handdator

Visa fullständig version : Prroblem att hitta dubbletter



m08121
2017-01-08, 16:51
Hej alla!
En medlem som kontaktat mig har problem med att hitta dubbletter.
Problemet började nog redan vid installationen av DG2016. Sedan programmet installerats tog han ett gedcomutdrag ur sin DG8installation och importerade detta i DG2016 (han var inte medveten om att DG2016 hämtar data från DG8:s datamapp i samband med installationen). Han upptäckte då att det fanns ett stort antal dubbletter. De skapades troligast när gedcomutdraget importerades flera gånger. I det skedet blev jag inkopplad. Jag föreslog att han skulle ta bort den nyinstallerade Dg2016 och göra om installationen och konvertera datamappen från Dg8.2 i samband med installationen. Han avinstallerade Disgen2016 och återinstallerade. Det tycktes därefter fungera, enligt honom. Detta var i maj 2016. Därefter satte han igång att mata in ett större antal nya individer i DG2016.
I slutet av december återkom han på nytt med problem med dubbletter. Nu är problemet att dubbletterna inte hittas. Han har t. ex en person Erik Andersson med följande uppgifter inmatade: Dödsdatum 1766-06-03 och Dödsort Nordmaling, Hummelholm. Sen finns det en till Erik Andersson med följande uppgifter inmatade: Född 1701-03-25, Död 1766-06-03, Födelseort Nordmaling, Hummelholm och Dödsort Nordmaling, Hummelholm. Det är samma person inmatad två gånger, men dubblettsökningen uppfattar dem inte som dubbletter. Samma sak gäller för flera andra personer. Varför? Vad krävs för att programmet ska uppfatta dem som dubbletter? Hur kommer men runt detta problem?
Vid dubblettsökningen kommer filen Gedcom 2015-12-15 upp som dubblett.

C-J Gustafsson
2017-01-08, 18:21
Olika program söker dubbletter på lite olika sätt och använder lite olika mängd data vid jämförelsen.

I openRGD (rgd.dis.se) finns ett par varianter av dubblettsökning. Den kan vara ett bra komplement till kontrollen i Disgen.
För att göra kontrollen i openRGD krävs en GEDCOM fil med hela eller med den delen av sitt data man vill kontrollera.

Olle_Olsson
2017-01-09, 00:39
Jag testade med samma förutsättning, samma namn och samma döds-datum och ort. Den första med födelse-datum och den andre utan födelsedatum.
Disgen_2016.5 hittar inte detta som dubblett.

Sen testade jag på Open RDG; https://rgd.dis.se:8088/login
Gjorde en Gedcom fil i Disgen 2016 och öppnade sen Open RDG, logga in som Guset, och ladda upp Gedcomfilen, och den hittade dessa dubbletter.
// Olle OLsson

C-J Gustafsson
2017-01-09, 00:53
openRGD är ett bra komplement när det gäller dubblettsökning, eftersom de arbetar på olika sätt.

Dessutom får man ju lite andra kontroller också "på köpet".

Christer
2017-01-09, 08:52
Olle, det är inte så konstigt. Olika analyser ligger bakom resultatet.
För analysen av möjliga dubbletter ligger flera jämförelser och viktningar för att få ett bra resultat. Det gäller att balansera så att resultatet blir tillräckligt stort men ändå inte för stort.