Av Ulf Löfgren Lördagen den 20 december, 2008 - 16:38: |
Jag har lagt märke till att i många fall förekommer samma uppgifter både två och tre gånger på Disbyt, dvs Disbyt-medlemmen har identiska uppgifter flera gånger efter varandra. Då är det ju inte svårt att få en stor databas...
Av Alf Christophersen (M00919) Lördagen den 20 december, 2008 - 17:17: |
Litt usikker på hva du mener.
Mener du at medlem nr x har flere linjer for samme person i Disbyt eller mener du at samme person forekommer både for medlem nr x og for medlem nr y og for medlem z og at også andre medlemmer har samme person registrert.
I tilfelle en kan det tyde på at vedkommende kanskje har registrert samme person flere ganger i samme base hos seg selv.
Men i tilfelle to er det nettopp det som er hensikten med DISBYT.
Alle disse har da registrert samme person og vil finne ved innsending av neste oppdatering at medlem x, medlem y og medlem z samt andre, har registrert samme person som bidragsyter og at man derfor kan forvente at disse jobber med samme slekt.
Det er hensikten med DISBYT, å identifisere alle slektsforskere i foreningen som jobber med samme slekt og personer :-)
Det som det kan virke som, er at du forventer at DISBYT er en kilde over alle registrert fødte i Sverige. Da kan jeg være enig i at et individ kun skal forekomme en gang i databasen.
Men det er altså ikke hensikten, hverken med DISBYT eller DIStreff (som jeg er koordinator for i DIS-Norge)
:-)
Ha en riktig god og trivelig jul og et godt nyttår
Av Olof Cronberg Lördagen den 20 december, 2008 - 17:20: |
Hej Ulf!
När man skickar in nya uppgifter till Disbyt, tas automatiskt de gamla uppgifterna bort. Att det kan förekomma dubbla uppgifter i Disbyt beror nästan alltid på att släktforskaren har lagt in samma person flera gånger i sin databas. Vi kan inte ta bort dubblerade personer vid bearbetningen därför att vi kan inte veta vilka uppgifter som är fylligast eller mest "rätt".
När vi räknar statistiken 18,3 miljoner poster i Disbyt, så är dubbletterna räknade dubbelt. När vi säger att mer än 40 % av alla födda i Sverige finns i Disbyt, så räknar vi bara unika inivider, så i den siffran är inte dubbletter med. (Namn, födelseår, födelseförsamling räknas bara en gång om de är identiska.)
/Olof C
Av Anders Berg M01397 Söndagen den 21 december, 2008 - 00:43: |
Hur beräknas siffran 40% egentligen?
Har ni gjort några stickprov att det verkligen stämmer? Som t ex att gå igenom ett antal födelseböcker för utvalda år och se om verkligen 40% av alla dessa barn finns i Disbyt?
Av Olof Cronberg (M00082) Måndagen den 29 december, 2008 - 11:42: |
Hej Anders!
För alla personer i Disbyt som har ett födelseår räknas förekomsten av antalet unika namn per födelseår och födelseort. Dvs oavsett om det förekommer en eller flera Anders Bengtsson födda i Blomstermåla 1789, så räknas det som en person. Den totala summan delas med antalet personer som uppges vara födda i Sverige för respektive tidsperiod.
Jag har tidigare inte gjort några stickprov för att verifera att det är korrekt. Jag passade nu på att titta på Dädesjö socken. Där fanns det drygt 3000 personer födda i Disbyt mellan 1750 och 1899. När man tittar på uppgifterna kan man se att en del uppgifter blivit dubblerade för att man har skrivit lite olika namn, som inte blivit normerade ihop. Det kan bero på felstavning, att man i vissa fall bara angett ett förnamn och i andra fall två, att man har olika stavningar på släktnamn. I Dädesjö utgjorde sådana fel ca 5 % av alla poster eller ungefär 150 st.
Jag jämförde sedan antalet födda enligt Disbyt med antalet födda enligt tabellverket för vissa år. För de år jag kollade fanns mellan 30 % och 40 % av antalet enligt tabellverket med i Disbyt.
Sedan är det säkert så att täckningsgraden växlar mellan församlingar. I vissa fall finns det släktforskare som har registrerat alla födda i en viss församling och då blir täckningsgraden betydligt högre, och i andra församlingar är täckningsgraden sämre.
Det är möjligt att den beräkning som görs är lite för optimistisk, men å andra sidan tror jag inte att felprocenten på totalsiffran är mer än 10-20%. Eftersom alla tidsperioder väl har passerat 40 % enligt nuvarande beräkningsmodell, så borde även med avdrag för felkällor täckningsgraden ligga väl över 30 %.
/Olof C