handdator

Visa fullständig version : Sök dubletter



OH 10100
2020-12-31, 21:24
Jag har manuellt konstaterat att det finns några dubbletter i min datamapp. När jag använder "Sök dubblett i hela databasen" visas inte någon av dessa personer. Däremot visa några andra personer som jag efter kontroll kan konstatera inte är dubbletter. Missar jag någon inställning eller varför fungerar det inte?

Edgar
2021-01-01, 08:51
De algoritmer som används för att söka dubbletter är inte och kan inte vara exakta eller göra samma bedömningar som din mänskliga hjärna kan göra. Därför är det en viss osäkerhet i resultaten. Det finns alltså alltid en viss sannolikhet att programmet missar ett verkligt dubblettpar. Man vill naturligtvis att den sannolikheten ska vara så liten som möjligt men den blir aldrig försumbar, som i ditt fall. De dubblettkandidater, som du själv har konstaterat inte är dubbletter, kan du i resultatlistan markera som "ej dubblett" och i nästa körning kan du i resultatlistan undertrycka dessa så att den bara visar nyupptäckta dubblettkandidater. För det dubblettpar, som du vet är dubbletter men som inte kommer med i sökningen, måste det skilja i någon/några avgörande notiser som gör att programmet tolkar dem som icke dubblett.

Rolf Carlsson
2021-01-01, 14:16
Owe, testa OpenRGD, vilken har en mycket bättre dubblettsökningsfunktion.

OH 10100
2021-01-01, 14:19
Jag förstår.
I mitt fall är namn, födelse- och dödsdatum samma i de manuellt hittade dubbletterna. Men jag förstår nu att det räcker inte. Det skiljer på tex partner, döpt eller något annat. Tyvärr hade jag nog inte dubblettkontrollen aktiv när jag lade in dessa. Den kanske inte ens fanns i Disgen 8 och tidigare versioner.
Tack för hjälpen.

Rolf Carlsson
2021-01-01, 16:05
Min uppfattning är att dubblettkontrollen vid registrering i stor utsträckning bygger på exakt stavning. Då faller exempelvis Kristina/Christina utanför kontrollerna.

OH 10100
2021-01-01, 16:32
Tack för tipset Rolf om OpenRGD.
Jag har läst de två artiklarna i Diskulogen 2017. Det verkar vara riskfritt att prova vilket jag skall göra.
När det gäller dubblettkontroll och exakt stavning så gäller det även sök-funktionen. Det räcker med att glömma en accent för att man inte ska få träff.

Rolf Carlsson
2021-01-01, 17:36
Nej, det finns inga risker med OpenRGD. Du tar en kopia av ditt Disgenmaterial i form av en Gedcomfil, som du sparar i valfri mapp och under valfritt namn. Denna fil läses sedan in i OpenRGD. Det är inte bara dubblettkontroll du kan göra där utan även ett antal andra kontroller. Observera att du även kan jämföra ditt material med en annan forskare, om ni skapar var sin Gedcomfil. Dessa matchningar brukar vara "brutalt" avslöjande vad avser eventuella fel i relationer, då matchning alltid sker i form av far/mor/barn.

31581
2023-08-05, 17:17
Jag vet inte om det är korekt att skriva detta här men det handlar om SÖK Dublett.
Om man sedan tidigare markerat ett antal (väldigt många) som icke dubletter vore det en bra fiunktion om man vid en ny sökning av dubletter kunde "välja bort" dessa.
så klart skall man kunna söka "alla" dubletter igen om man så vill.
Finns det är det något påtänkt?

Christer
2023-08-07, 18:15
Om jag förstår dig rätt så finns funktionerna sedan Disgen 2016. För Disgen 2023 kan du läsa i https://handledning-disgen2023.dis.se/kontroll-dubblett .

Med ikonen "Visa Alla" som kan växla till "Undertryck" kan du välja om du vill se alla dubblettkandidater eller bara de som du inte valt bort.

31581
2023-08-08, 03:53
Hej Christer
Jag tror du missförstod mig. Redan INNAN jag påbörjar dublettsökningen skulle jag vilja markera att ALLA som sedan tidigare är markerade som ej dubletter inte skall komma med igen. Anledningen är att då blir dublettsökningen betydligt snabbare. Som det är nu tar en dublettsökning över en timme och de flesta säkert över 90% är redan markerade som ej dubletter.

Edgar
2023-08-08, 07:42
Du kan inte plocka bort de par, som är markerade som ej dubbletter, ur sökningen. De nya personer, som är inlagda, kan ju var dubblett till någon person bland de borttagna paren. Så vad jag kan förstå, måste hela databasen vara inblandad i dubblettsökningen.