Av stellan jacobsson Söndagen den 30 september, 2007 - 22:35: |
Är det inte dags att byta sökmotor i DISBYT!!!
Om man gör nedanstående sökningar på en exempelperson erhålls olika resultat. Det är omöjligt att veta om de olika resultaten är delmängder av varandra. Låt den hypotetiska personen vara Anders Svensson född i Stockholms län. Låt Svensson och Stockholms län vara fasta parametrar och fokusera på att enbart ändra texten i rutan Förnamn:
Sökningar ger:
1) Anders ger 70 träffar
2) * Anders ger 14 träffar
3) *Anders ger 84 träffar
4) Anders* ger 97 träffar
5) Anders * ger 27 träffar
skillnaden mellan 2) och 3) är att det i 2) finns ett mellanslag mellan * och A
skillnaden mellan 4) och 5) är att det i 5) finns ett mellanslag mellan s och *
Uppenbarligen har det betydelse om det finns ett mellanslag mellan ”wild card” symbolen * och första eller sista bokstaven i namnet, eller inget mellanslag. De fem alternativen ger alla olika antal träffar!! Huva!
Ett annat problem:
Det finns i DISBYT gott om personer som har vanliga förnamn som efternamn. Förmodligen beror detta på att uppgiftslämnaren har skrivit in förnamnet i rutan för efternamnet, och vice versa. Skriv in ”elisabeth” i efternamnsrutan och begrunda träffarna. I vissa fall är det säkert en korrekt träff (bl.a. uppgifter som kommer från Släktdatas databas), men andra fall finns det personer som heter ”Gerda Elisabeth” i efternamn och ”Larsson” i förnamn.
Exemplen ovan är bara tagna slumpmässigt, men jag befarar att det inte är svårt att finna andra liknande exempel. Att manuellt gå in i databasen och ändra felaktigheter, t.ex. i de fall då efternamn och förnamn är förväxlade, är ett omöjligt arbete.
Hur som helst så ger mig den luddiga syntaxen i sökningen, samt vetskapen om att det finns en hel del personer som matats in med för- och efternamn förväxlade, en stor osäkerhetskänsla varje gång jag gör en sökning i DISBYT – har jag verkligen fått med allt.
Varför inte betrakta hela DISBYT som en textmassa och förutsättningslöst kunna göra en sökning, gärna med eller utan boolska operatorer, i textmassan. För att göra detta måste (kanske) hela databasen byggas om samt sökmotor resp. användargränssnitt ändras. helt säkert ett stort arbete, men förr eller senare måste det säkert göras.
Hälsningar
Stellan Jacobsson
Av Ingvar Kärrdahl Söndagen den 30 september, 2007 - 23:42: |
Svar till Stellan Jacobsson
Jag svarar endast på din första fråga om sökning på Anders Svensson.
De fem olika sökningarna och angivna antalet träffar på dessa är helt korrekta men är endast delmängder eftersom du har missat den optimala söksträngen *Anders* som ger 113 träffar. Vad du har gjort är att du använt dig av fem olika sökbegrepp och också fått korrekta svar enligt dessa sökkriterier. Vad du glömt av är att ett mellanslag också är en del av sökbegreppet.
Ett annat exempel som kan vara aktuellt är sökning på dubbelnamn. En sökning på Sven Olof ger inte samma antal svar som om du söker på Sven?Olof. I den sistnämnda söksträngen får du även med personer som har namnet Sven-Olof. Lägger du sedan till * före och efter dvs. *Sven?Olof* så har du nästan optimerat sökresultatet. Du missar då t.ex. en person som heter Sven Bertil Olof. Honom får du med på den här söksträngen: *Sven*Olof*
Lycka till med fortsatt sökning i Disbyt!
Av Stellan Lördagen den 27 oktober, 2007 - 19:14: |
Ännu har ingen kommenterat det faktum att många poster i databasen har förväxlade för och efternamn. Till exempel finns det personer som heter ”Gerda Elisabeth” i efternamn och ”Larsson” i förnamn. Listan kan göras lång. Här hjälper varken stjärnor, frågetecken och andra wild cards för att hitta personer.
/Stellan
Tack Invar för dina kommentarer!
Av Olof Cronberg Söndagen den 28 oktober, 2007 - 16:50: |
Hej Stellan!
Vid en snabb koll är sannolikt ungefär 5000 av 15 miljoner poster felaktiga på så sätt att förnamn står i efternamnsfält och vice versa. Det är således inget stort problem. Vad jag kan se så är det enstaka poster hos flera olika medlemmar som blivit fel. Det bästa är att upplysa dessa medlemmar om felet, så blir det rättat vid källan.
Jag lägger dock in det som ett förbättringsförslag till Disbyt.
Ett utvecklingsarbete att föra över Disbyt i en modernare databas är påbörjat i samverkan med DIS Norge. Det är dock ett projekt på lite sikt.
/Olof C
Av Runar Hortlund Måndagen den 29 oktober, 2007 - 13:06: |
I Sveriges Dödbok förekommer ofta efternamn i förnamnsfältet. Sök på Andersdotter som förnamn.
Hur är reglerna? Vem bestämmer?
Av Jan Lilliesköld Lördagen den 3 november, 2007 - 21:54: |
Att det förekommer förnamn i efternamnsfältet och tvärtom,har väl ingenting med någon regel att göra ?
Jag är på intet sätt insatt i hur 'Sveriges Dödbok' har tagits fram, men det torde nog vara så enkelt som att de som registrerat namnen har i något fall glömt att sätta ut "avskiljare" rätt mellan för och efternamn. För av vad jag kan se så saknas det kommatecken i många fall där förnamn blivit efternamn, och kommatecken verkar stå på fel plats där efternamn blivit förnamn.
Dessutom förekommer det att som exempelvis Andersdotter är ett förnamn. Själv heter jag Gunnarsson i förnamn, och mina döttrar heter Jansdotter i förnamn. Jag har stött på fler som hetat just Gunnarsson som förnamn, men det torde finnas många som har andra "patronymikon" eller för den delen "metronymikon" som förnamn. Detta "fenomen" beror på att man sedan rätt länge inte kunnat få ha ett patronymikon utöver ett familjenamn. Enligt senaste namnlag, så borde man nog kunna ha ett sådant namn som 'mellannamn', dock har jag personligen inte stött på någon med sådant mellannamn.
Av stellan Tisdagen den 6 november, 2007 - 22:33: |
Finns det en ruta som heter efternamn förväntar man sig att finna efternamn i den rutan, inte ett förnamn. På samma sätt som vi inte skriver efternamn i rutan för födelseplats. Så någon form av regel eller konvention finns.
Problemet är ju att det uppenbarligen blir fel ibland. Följaktligen missar den nuvarande sökmotorn i DISBYT några (få?) personer. Detta eftersom DISBYT har, helt korrekt, antagit att de olika posterna i databasen har matats in på ett korrekt sätt!
Därför vore det bättre att kunna söka förutsättningslöst i databasen, på samma sätt som i t.ex. Google. Gärna med möjligheter att använda boolska operatorer (logiska funktioner).
Av Karl Edvard Thorén (M04089) Tisdagen den 11 november, 2008 - 18:29: |
Sökning på personer med dubbla efternamn.
Vid sökning på person med två efternamn Andersson - Karlsson får man inte träff i Disbyt när man söker på Andersson.
Vid sökning i Dispos får man träff men går man därifrån vidare till Disbyt, ingen träff, varför? borde det inte ändras.
Av Sören Ewaldsson Tisdagen den 25 november, 2008 - 17:47: |
Det finns flera personer med dubbla efternamn som inte är sökbara mer än på det ena efternamnet, t ex Samuelsson Sjölin. Samuelsson är inte sökbart.
Det borde i DISGEN finnas en möjlighet att särskilja på namn vid födelsen och taget namn (soldatnamn etc). Båda dessa borde vara sökbara i DISBYT i var sitt sökfält. Vissa personer har till och med tre olika namn. Hur blir det med sökningen då? Det är nog dags att göra något åt detta både i DISGEN och DISBYT. Det vore intressant att få en kommentar från ansvarig för resp. program.
Av Olof cronberg Tisdagen den 25 november, 2008 - 18:06: |
I Disbyt gäller följande:
Personer med flera efternamn är i allmänhet sökbara på vart efternamn för sig. Om en person heter Anders i förnamn och Samuelsson Sjölin i efternamn, så är han sökbar på Anders Samuelsson eller Anders Sjölin. Om materialet i Disbyt är gammalt, dvs äldre än ungefär 5 år, så kan det vara så att personen bara är sökbar på sitt släktnamn. Man ska således bara skriva ett efternamn i sökfältet för efternamn.
I Disgen gäller följande:
Det görs en sökning på varje namn du skriver i efternamnsfältet. Söker du på Sjölin Samuelsson, får du träff på både Sjölin Samuelsson och Samuelsson Sjölin.
/Olof C