handdator

Visa fullständig version : Släkttrim - trimma din släktforskning



Rolf Carlsson
2014-12-30, 22:41
Utnyttja möjligheten att trimma din släktforskning

RGDs Web-version syftar dels till att höja tillförlitligheten avseende relationer och sakuppgifter i den egna forskningen och dels till att ge indikationer om utökning genom tillkommande individer. Tillförlitligheten kan höjas dels genom att indikera vissa formella avvikelser (namn, dubbletter, orter och vissa andra typer) - Indatavalidering - och dels genom att jämföra den egna forskningen med en annan forskares uppgifter eller – i ett senare läge - med RGDs databas - Matchning.

Produkten är fortfarande under utveckling men vi vill ändå ge medlemmar möjlighet att redan nu utnyttja de tillgängliga funktionerna. Alla funktioner baseras på en Gedcomfil avseende den egna forskningen.

Funktioner som kan utnyttjas är:
• Validering av uppgifter i Gedcomfilen,
• Jämförelse (Matchning) av familjer i den egna Gedcomfilen med motsvarande familjer i en annan forskares Gedcomfil
• Sammanföring av uppgifterna i de två Gedcomfilerna till en gemensam fil, varvid identiska individer slås samman
• Export av den sammanslagna Gedcomfilen.

Senare är avsikten att kunna göra jämförelsen/matchningen mot RGDs databas.

Inloggning kan antingen ske som Gäst (med begränsade funktioner) eller som registrerad användare. Länk: http://rgd.eit.lth.se:8085/
Vill du registrera dig som användare (se även julbrev från Dis) skicka ett email till Anders Ardö: anders.ardo@gmail.com.

När den definitiva versionen lanseras kommer inloggningen att kopplas mot DIS Medlemsregister och de tillfälliga användarkontona avslutas.

Kort beskrivning ( se även bifogade grafiska sammanställning och motsvarande sifferhänvisningar)
1. Egen släktforskning. Representerar den egna släktforskningen i valfritt släktforskningsprogram. En Gedcomfil skapas för inläsning i Släkttrim.
2. Inläsning och validering i Släkttrim
3. Validering med avseende på dubbletter, namnavvikelser/kön, orter och vissa andra uppgifter.
4. De indikerade avvikelserna analyseras och i förekommande fall sker korrigering i den egna forskningen. Efter genomförda korrigeringar skapas en ny Gedcomfil och inläsning/validering initieras på nytt.
5. När indikerade avvikelser korrigerats och moment 1-4 genomförts med två forskares Gedcomfiler kan dessa jämföras med varandra (Matchning). Jämförelserna sker familjevis för att fånga upp avvikande familjebilder. Matchningsresultatet kan därefter analyseras i flera detaljsteg:
- Relationskonflikter (MultiMatch); fel partner, barn i fel äktenskap, syskon med olika föräldrapar.
- Avvikelser i Familjebild; olika uppgifter om makar/barn, tillkommande barn.
- Avvikelser hos en Person i en gemensam familj.
- Lista över alla enskilda avvikelser avseende matchande individer (vissa avvikelser godkänns i samband med matchning).
6. Analys av indikerade avvikelser. I förekommande fall rättas antingen i den jämförda eller i den jämförande Gedcomfilen. Familjer markeras som ”Godkända” eller ”Ej godkända” för matchning. Eftersom det ibland kan råda osäkerhet om familjerna matchar eller inte, föreslås i vissa fall matchning av familjer med näraliggande identitetsuppgifter – dessa förslag markeras som Ej godkända.
När alla eller en viss mängd avvikelser bearbetats och korrigerats i ursprungsforskningen kan nya Gedcomfiler tas fram och moment 1-5 upprepas tills resultatet är nöjaktigt.
7. Korrigeringar i den egna forskningen enligt beskrivning under 4 och 6.
8. De två matchade Gedcomfilerna kan sammanföras till en gemensam Gedcomfil, där uppgifterna i de två filerna kompletterar varandra och vävs samman. En förutsättning är att alla avvikelser avseende MultiMatch, Familjebild, Personuppgifter bearbetats och samtliga familjer och personer markerats som Godkända eller Ej godkända (inga poster får kvarstå som obearbetade).
9. Gedcomfilen över de sammanslagna uppgifterna kan därefter överföras till den egna datorn som ett dokument i GED-format.

walgot
2014-12-31, 15:47
Jag har av en DIS-medlem fått tips om detta forum och om "RGD".

Jag har läst ovanstående inlägg om "Släkttrim" och dessutom rgd.eit.lth.se första sida.

Vilka funktioner går man som 'Gäst' miste om?
Vilka uppgifter ur de inmatade GEDCOM-filerna lagras på serversidan och i så fall för vilka ändamål och hur länge?

dis49324
2015-01-01, 09:04
Jag har av en DIS-medlem fått tips om detta forum och om "RGD".

Jag har läst ovanstående inlägg om "Släkttrim" och dessutom rgd.eit.lth.se första sida.

Vilka funktioner går man som 'Gäst' miste om?
Spara data mellan inloggningar


Vilka uppgifter ur de inmatade GEDCOM-filerna lagras på serversidan
Hela GEDCOM-filen


och i så fall för vilka ändamål
Dina egna tester


och hur länge?
tills du loggar ut som 'Gäst' eller
tills du själv tar bort data som användare

Vi i RGD-gruppen hoppas givetvis att få feedback från dig på funktionalitet, fel, konstigheter, förbättringar, mm. Gärna på detta forum.

Rolf Carlsson
2015-01-01, 10:53
Vill ytterligare komplettera svaret från Anders:

Själva syftet med Släkttrim är att jämföra den egna forskningen med en annan forskning (tills vidare enbart Gedcomfiler med varandra). Av den anledningen är någon "långtidslagring" inte förutsedd i denna delprodukt i RGD-projektet. Båda underlagen är ju dynamiska allt eftersom respektive ursprungsforskning uppdateras.

Observera också att jämförelse enbart kan göras mellan Gedcomfiler, som lästs in på samma användarkonto. Enbart den eller de personer som har tillgång till ditt Konto/Password kan jämföra sina uppgifter med dina.

Det är också möjligt att läsa in flera än två Gedcomfiler på ett och samma användarkonto och därigenom jämföra uppgifterna parvis i alla kombinationer för att på så sätt ytterligare höja tillförlitligheten i uppgifterna i de två jämförda Gedcomfilerna.

Jag lägger även upp ett nytt ämne: Släkttrim - frågor/synpunkter, så kan vi använda detta ämne mera för information kring delprodukten.

Rolf Carlsson

Rolf Carlsson
2015-01-01, 16:42
Skapa en grupp av användare med samma forskningsinriktning

Den enklaste jämförelsen i Släkttrim är med två Gedcomfiler inlästa på samma användarkonto. Det är emellertid inget som hindrar att en grupp av forskare med likartad forskningsinriktning läser in Gedcomfiler på samma användarkonto. När väl RGDs huvudprodukt med den aggregerade databasen börjar byggas upp ersätts detta ”gruppförfarande” med jämförelse direkt mot RGDs databas.

Man kan inom gruppen göra parvisa jämförelser/matchningar i alla möjliga kombinationer. Av praktiska skäl (tidsåtgång) är det lämpligast att jämföra den mindre filen mot den större men det har ingen inverkan på resultatet i vilken inbördes ordning filerna jämförs. Ej heller behöver B jämföras med A om A redan har jämförts med B.

Värt att notera är att själva matchningsresultatet automatiskt sparas vid utloggning. Man kan vid återinloggning fortsätta där man slutade föregående gång (punkt 6 i arbetsflödet). Det går också utmärkt att växla med olika matchade kombinationer (A mot B, A mot D, B mot F).

Genom att de sammanlagda ”överlappningsytorna” blir väsentligt större vid jämförelser av en grupp av Gedcomfiler ökar sannolikheten att ytterligare relationskonflikter och andra avvikelser kommer upp (som inte kan upptäckas vid kontroll av en enskild datafil).

I projektgruppen har vi testat detta förfarande med mycket gott (och förvånande) resultat. Filerna har varit ungefär 13.000/29.000/53.000 individer med cirka 10.000 överlappande (identiska) individer. Ett relativt stort antal relationskonflikter indikeras (fel partner, barn i fel äktenskap, syskons föräldrar är dubbelregistrerade med flera varianter). Även fel i sakuppgifter indikeras (namnfel av typ Emma/Eva, datumavvikelser).
Om du inte redan har kontakt med andra forskare, som skulle kunna bilda en grupp, är en möjlighet att kontakta medlemmar med stora överlappningar i din senaste resultatrapport från Disbyt.

Vi vill påpeka att indikeringen av potentiella fel i första hand gagnar gruppens egen forskning och i andra hand Disbyt och (när den lanserats) RGDs databas.

Bifogat finns en principskiss över effekten av sammanlagrade överlappningar samt en ”Lathund – utkast” till Släkttrim (denna finns även som bifogat dokument på inloggningssidan).

Det är inget hinder att flera personer i gruppen är inloggade samtidigt för analys av resultat. Möjligtvis kan en konflikt uppstå om ändringskommandon i samma fil verkställs av mer än en person vid samma tidpunkt. Det värsta som kan hända är att radera filerna och läsa in dem på nytt.

Konklusion: Ta initiativ att bilda ”Släkttrim-grupper” med syfte att förbättra tillförlitligheten i och öka omfattningen av din forskning. Kanske du får nya forskarkontakter för mera intensivt utbyte.

Rolf Carlsson
2015-01-16, 12:03
Pilotprojekt med Borås Släktforskarförening - BSF

Som en del av valideringsarbetet med Betaversionen av Släkttrim har vi startat upp ett pilotprojekt inom BSF. En grupp av 10 medlemmar har laddat upp sina Gedcomfiler på ett och samma användarkonto för att dels genomföra Indatavalidering av filerna och därefter parvis kunna matcha filerna mot varandra i relevanta kombinationer. Gruppen har en relativt stor mängd gemensamma individer. Alla medlemmar i gruppen har tillgång till kontot och var och en kan arbeta, "när det passar bäst". Detta innebär att om filen A matchats mot filen D, så kan såväl A som D analysera resultatet var för sig.

Hittills har gruppen mest varit koncentrerad på att gå igenom Varningslistorna från Indatakontrollerna men har nu övergått till att analysera resultatet av de parvis gjorda matchningarna. Så länge uppdateringar inte kan göras i RGDs databas är detta förfaringssätt en möjlighet att för en "sluten" grupp av personer att kunna jämföra sin forskning med alla andra medlemmar i gruppen.

Från RGD-projektet har vi fått flera bekräftelser på funktionerna vid detta gruppförfarande.

Se även inlägget ovan, som behandlar samma frågeställning.

Huvudsyftet med detta grupparbete är att kontrollera och trimma sin egen släktforskning.

Funderar någon på att ta initiativ till en liknande grupp, så ställer jag gärna upp för diskussioner.

Rolf Carlsson, hjalmo114@hotmail.com