+ Svara på ämne
Resultat 1 till 5 av 5

Ämne: Prroblem att hitta dubbletter

  1. #1

    Örjan Öberg
    Medlemsnr
    8121
    Ort
    Härnösand
    Inlägg
    22

    Prroblem att hitta dubbletter

    Hej alla!
    En medlem som kontaktat mig har problem med att hitta dubbletter.
    Problemet började nog redan vid installationen av DG2016. Sedan programmet installerats tog han ett gedcomutdrag ur sin DG8installation och importerade detta i DG2016 (han var inte medveten om att DG2016 hämtar data från DG8:s datamapp i samband med installationen). Han upptäckte då att det fanns ett stort antal dubbletter. De skapades troligast när gedcomutdraget importerades flera gånger. I det skedet blev jag inkopplad. Jag föreslog att han skulle ta bort den nyinstallerade Dg2016 och göra om installationen och konvertera datamappen från Dg8.2 i samband med installationen. Han avinstallerade Disgen2016 och återinstallerade. Det tycktes därefter fungera, enligt honom. Detta var i maj 2016. Därefter satte han igång att mata in ett större antal nya individer i DG2016.
    I slutet av december återkom han på nytt med problem med dubbletter. Nu är problemet att dubbletterna inte hittas. Han har t. ex en person Erik Andersson med följande uppgifter inmatade: Dödsdatum 1766-06-03 och Dödsort Nordmaling, Hummelholm. Sen finns det en till Erik Andersson med följande uppgifter inmatade: Född 1701-03-25, Död 1766-06-03, Födelseort Nordmaling, Hummelholm och Dödsort Nordmaling, Hummelholm. Det är samma person inmatad två gånger, men dubblettsökningen uppfattar dem inte som dubbletter. Samma sak gäller för flera andra personer. Varför? Vad krävs för att programmet ska uppfatta dem som dubbletter? Hur kommer men runt detta problem?
    Vid dubblettsökningen kommer filen Gedcom 2015-12-15 upp som dubblett.

  2. #2

    Carl-Johan Gustafsson
    Medlemsnr
    19138
    Ort
    Nykvarn
    Inlägg
    417
    Olika program söker dubbletter på lite olika sätt och använder lite olika mängd data vid jämförelsen.

    I openRGD (rgd.dis.se) finns ett par varianter av dubblettsökning. Den kan vara ett bra komplement till kontrollen i Disgen.
    För att göra kontrollen i openRGD krävs en GEDCOM fil med hela eller med den delen av sitt data man vill kontrollera.

  3. #3

    Olle Olsson
    Medlemsnr
    10475
    Ort
    Gävle
    Inlägg
    76
    Jag testade med samma förutsättning, samma namn och samma döds-datum och ort. Den första med födelse-datum och den andre utan födelsedatum.
    Disgen_2016.5 hittar inte detta som dubblett.

    Sen testade jag på Open RDG; https://rgd.dis.se:8088/login
    Gjorde en Gedcom fil i Disgen 2016 och öppnade sen Open RDG, logga in som Guset, och ladda upp Gedcomfilen, och den hittade dessa dubbletter.
    // Olle OLsson

  4. #4

    Carl-Johan Gustafsson
    Medlemsnr
    19138
    Ort
    Nykvarn
    Inlägg
    417
    openRGD är ett bra komplement när det gäller dubblettsökning, eftersom de arbetar på olika sätt.

    Dessutom får man ju lite andra kontroller också "på köpet".

  5. #5
    Christers avatar
    Christer Gustavsson
    Medlemsnr
    4621
    Ort
    Linköping
    Inlägg
    1 125
    Olle, det är inte så konstigt. Olika analyser ligger bakom resultatet.
    För analysen av möjliga dubbletter ligger flera jämförelser och viktningar för att få ett bra resultat. Det gäller att balansera så att resultatet blir tillräckligt stort men ändå inte för stort.
    Christer Gustavsson - Verksamhetsledare DIS

+ Svara på ämne

Behörigheter för att posta

  • Du får inte posta nya ämnen
  • Du får inte posta svar
  • Du får inte posta bifogade filer
  • Du får inte redigera dina inlägg