Arkiverade (äldre) inlägg fram till 8 juni, 2009

DIS Forum: 3. DISGEN - Släktforskarprogrammet: Övrigt: Önskemål till nästa version: Arkiverade (äldre) inlägg fram till 8 juni, 2009
Av Carl-Johan Gustafsson Dis 19138 Torsdagen den 4 juni, 2009 - 20:09:

Installerat 8.2 i dag och börjar med önskemål till 8.2.1. Man kanske borde skämmas?
Jag körde funktionen för dubblettkontroll, en bra och lättanvänd funktion, verkligen suverän.

Men, av den lista på 300 tänkbara kandidater var c:a 15 verkliga dubbletter.

Det stora antalet kandidater borde kunna reduceras och kanske poängberäkningen ändras. De verkliga dubbletterna kom ofta på 14 till 16 poäng, inte på de höga 18 till 20.

I min databas kom väldigt många "icke-dubbletter" från syskon med något gemensamt familjenamn eller från yngre syskon som fått ärva namn av avliden storasyster/storebror.

Av Carl-Johan Gustafsson Dis 19138 Torsdagen den 4 juni, 2009 - 23:43:

Jag igen, men nu undrar jag varför jag fått för lite tänkbara dubblettkandidater (aldrig är man nöjd).

Gardelin Lars Ferdinand, omkr.1844 OCH
Gardelin Lars Ferdinand, 1843 Othem listades
men
Östman Catharina Maria, omkr.1837 OCH
Östman Katarina Maria, 1836 Fårö listades INTE
Jag tycker dom är ganska lika.

Pettersson Anna Catharina Carolina, 18410524 Lärbro OCH
Pettersson Anna, 1841 listades
men
Liljeström Jacob Lorentz Petter, 18450205 Hellvi OCH
Liljeström Jacob listades INTE
Samma här, vad är skillnaden?

Detta är två typexempel, som jag tycker borde fångats upp som kandidater. Finns någon bra förklaring till att det inte gjordes?

Av Runar Hortlund Fredagen den 5 juni, 2009 - 13:35:

Ett hjälpmedel när man registrerar ny person skulle vara att få svar på föjljande fråga.
Har jag tidigare registrerat någon med samma födelsedatum, och i så fall vem? Redan då skulla dubbletter kunna undvikas.

Av Karl-Edvard Thorén Fredagen den 5 juni, 2009 - 17:58:

Hej Runar!

När Du har skrivit in Efternamn och förnamn kan Du klicka på knappen Dubblett så får Du en dubblet kontroll.

Av Runar Hortlund Fredagen den 5 juni, 2009 - 19:12:

Men Karl-Edvard, när jag skriver in barnet Johan Nordlund och klickar på knappen Dubblett får jag frågan om jag vill söka bland 44 personer med liknande namn. Men jag vet att barnet Johan är född 9/10 1866 och när jag gör en kontroll i listan födda alla, ser jag att det inte finns någon mer som är född samma dag. Då kanske du förstår vad jag menar.

Av Lars Larsson Lördagen den 6 juni, 2009 - 08:19:

I likhet med Carl-Johan ovan borde kanske jag också skämmas - men icke förty - jag har ett starkt önskemål:
återinför i nästa uppdatering möjligheten att via höger musknapp kopiera text i textnotisen. Ctrl C och ctrl V i all ära, men höger musknapp är man van vid att använda.

Av Karl-Edvard Thorén Lördagen den 6 juni, 2009 - 11:34:

Ja Runar, man kan naturligtvis önska sig att den här sökningen också tar med t.ex. datum för född och död, men nu är det bara namnen men ändå en hjälp på vägen.
Vad jag ser som en svaghet i det här sammanhanget är att om det inte finns någon dubblett så kan man inte fortsätta med det man började skriva in utan måste börja om från början.

Av Runar Hortlund Lördagen den 6 juni, 2009 - 11:58:

Svagheten i Disgens sätt att söka dubbletter är just att när man skriver in ett barns födsel så vet man inte vilket efternamn personen tar sig.
Det vet man i bästa fall när personen gfter sig eller man hittar dödsnotisen.

Av Åke A Källstrand Måndagen den 8 juni, 2009 - 13:53:

Varför var det så svårt att få till en fungerande dublettsökning i den nya versionen? Det finns ju en uppsjö program på marknaden där man kan söka exempelvis dublettfiler. Skulle det inte gå att ta lärdom av ett sådant?
För övrigt har Min Släkt en utmärkt funktion för dublettsökning, som hittar verkliga dubletter. Använder inte Min Släkt normalt, men ibland har jag roat med att göra en export dit, bara för att kunna söka eventuella dubletter!

Medl 12410

Av Daniel Berglund Måndagen den 8 juni, 2009 - 14:54:

Det finns två olika dubblettsökningsfunktioner i 8.2. Den ena, den som kan användas vid inmatning av en ny person, är samma som i 8.1 och fungerar varken bättre eller sämre än vad det gjorde i 8.1. Jag tycker själv att den är i behov av en ordentlig översyn, men det hann vi inte med till 8.2.

Den andra som jämför alla personer i hela databasen är däremot ny, men det finns inga likheter med program som letar efter dubblettfiler. I Disgen är det fråga om att leta efter personer som är "delvis" eller "ungefär" lika. Att gå över en större mängd data och leta rätt på de personer som är minst olika är en ganska svår uppgift, men den som har tips om effektiva algoritmer kan gärna höra av sig.

Carl-Johan hade en bra idé härovanför att listan med dubblettkandidater kan rensas från vissa typfall som går att upptäcka automatiskt, t ex syskon med samma namn, där det äldre har dött i späd ålder; plus att namnnormering borde kunna ge en del, så att Catharina anses vara samma som Katarina.