Har projektet helt lagts på is och resulterat i en dubblettkontroll?
Här har DIS en möjlighet att göra en betydande insats för svensk släktforskning men det verkar som man hellre lägger kraften på annat.
Har projektet helt lagts på is och resulterat i en dubblettkontroll?
Här har DIS en möjlighet att göra en betydande insats för svensk släktforskning men det verkar som man hellre lägger kraften på annat.
Utvecklare av Genney och ägare av Genney Digit.
Kanske är det som ordspråket ”Den som gapar efter mycket mister ofta hela stycket”. Om jag fattat det rätt ville man integrera hela det spretiga Disbyt-materialet på en gång för att få ”kritisk massa” … Undrar om det inte varit bättre att starta i liten skala (ex med en socken) och bygga ut det successivt. Jag förespråkar manuell inmatning före import och anpassning av stora mängder gammal forskning.
C-G, att, som du skriver, använda Disbyt-databasen fanns aldrig i sinnevärlden för Projektgruppen. Databasen skulle till 100 % byggas med nya bidrag från medlemmar en efter en med omfattande kontroller och korrigeringar hos medlemmen innan bidraget skarpt skulle uppdatera databasen. Även alla sidoregister som exempelvis en namndatabas och ort/församlingsdatabas skulle nyskapas för projektet.
Varför RGD inte genomfördes får en företrädare för DIS svara på.
Rolf Carlsson
Initiator av RGD
Du skrev inledningsvis att OpenRGD blivit en dubblettkontroll. Detta kan stämma om du refererar till en enskild Gedcomfil. Härutöver kan du matcha två gedcomfiler med varandra och få underlag för att utreda alla differenser mellan filerna. När alla differenser är utredda kan du slå samman dessa två bidrag till en gemensam Gedcomfil, som kan läsas in i ett släktforskningsprogram.
Vill du förstå bättre hur RGD arbetar föreslår jag att du prövar matchningsfunktionen genom att läsa in två separata filer och matcha dessa mot varandra enligt menyn för OpenRGD. Det finns i princip inga begränsningar hur stora filerna kan vara men de bör ha ett relevant antal matchande individer. Välj hellre större än mindre filer för att få olika typer av differenser. Matchningar har gjorts med filer med "många" 10-tusentals individer. I Disklogen finns uppgift om supportpersoner, om du har frågor kring förfarandet.
Det finns en förklaring till RGD projektet och att det avbröts vid årsskiftet 2018/2019 på grund av resursbrist med att föra det vidare på sidan https://www.dis.se/rgd-projektet
Mikael Winbladh - Verksamhetsledare DIS
Ska jag förstå det som att projektet är dödförklarat och att föreningen prioriterar andra områden?
Utvecklare av Genney och ägare av Genney Digit.
Projektet avbröts vid årsskiftet 2018/2019 pga resursbrist.
Christer Gustavsson - Dis verksamhetsledare emeritus
Denna jämförelse görs ju mellan två databaser som bearbetningen lagt in resultatet i. Hur väljs namnen på databaserna? Jag har fått ett antal olika databaser tidigare, men nu när jag vill jämföra en GEDCOM från mitt träd på Ancestry med motsvarande från Family Tree Maker så hamnar de i samma databas...
När en GEDCOM fil läses in används GEDCOM filens namn i openRGD. Läser man in en ny GEDCOM fil med samma namn ersätts den tidigare, har GEDCOM filen ett annat namn så får man två olika databaser för vidare bearbetning. Två GEDCOM hamnar aldrig i samma databas vid inläsningen.
Matchningen görs alltid mot två olika databaser som ärvt sitt namn från namnet på GEDCOM filen den skapats ifrån.
Vill man lägga ihop två stycken gör man detta i funktionen Sammanslagning, efter att de matchats mot varandra både maskinellt och manuellt.
Därefter kan man skapa en ny GEDCOM med resultatet från Sammanslagningen.
Det verkar ju inte alls stämma.
Till exempel ger GEDCOM-filen Petersson.Olsson.Cobel.ged en databas med namnet tommy_Petersson. GEDCOM-filen med ett annat namn (Petersson.Olsson.Cobel.10_2024-03-19.ged) får samma databasnamn. Jag kan absolut byta namn på någon av GEDCOM-filerna så de inte liknar varandra alls men det verkar ju inte påverka databasnamnet.
Senast redigerat av tommypeters den 2024-03-22 klockan 13:27.
Det jag för övrigt önskar här är en lista med vilka personer som *inte* finns i bägge filerna. Det kanske den här funktionen inte kan erbjuda - känner någon då till något program som kan ta fram detta?
Genney kan jämföra en gedcom-fil med aktuell databas och listar eventuella dubbletter. Om du importerar den gedcom-filen kommer nya personer ligga i en egen grupp där du kan manuellt ta bort dubbletterna och sen exportera listan till t.ex. excel.
Utvecklare av Genney och ägare av Genney Digit.
Jag vet inte hur parenteser möjligen kan påverka namnsättningen men det kan i vilket fall som helst kan de inte slås ihop, antingen blir det ny databas, eller ersätts tidigare med samma namn, eller blir det ingen databas på grund av felaktigheter i GEDCOM filen. Det ser man om man kollar meddelandet när databasen skapas, om det gått bra eller om det inte gått bra.
Funktionen att hitta unika personer finns inte i openRGD. Det var en snarlik funktion på gång när utvecklingen stoppades.
Fungerar RGD överhuvud taget nu? Jag har försökt några gånger senaste veckan men när jag klickat på Starta Bearbetning hände ingenting.
Underligt nog så gick rutinen igenom just inatt... Den stod verkligen länge utan att skriva ut några prickar men sedan gick det rätt snabbt.
Vi uppgraderade servern nyligen - med ett enkelt test blev det cirka 4 gånger snabbare - men vad som tog tid i ditt fall vågar jag inte säga något om. Fungera ska det i alla fall göra. Vänligen återkom om det ofungerar...
Vice ordförande (2025) & Disgenutvecklare.
Jag tror att den gamla servern hade automatisk Flush(buffer) eller liknande medan den nya inte har det. Med den gamla servern fick man se att den arbetade genom att den efter en stund började skriva ut en punkt då och då tills den var klar. Med den nya servern kommer alla punkterna på en gång när hela rutinen är färdig, när den också presenterar hela resultatet.
Kan i så fall ha med web-läsaren att göra. När jag kör Firefox kommer prickarna en efter en.
Ja, så gjorde det hos mig också innan byte till nya servern, med samma webbläsare. Så det är kombinationen av nya servern och Chrome. Nu är det ju ett mindre problem när jag vet att den arbetar trots att inga prickar skrivs ut under tiden så jag avbryter inte arbetet i tron att den hakat upp sig.
Jag ser att du har rätt. Jag förutsatte att du utnyttjat länken till version 2.3 och laddat in ditt data där.
Version 1 finns kvar för att ge möjlighet att plocka ut data eftersom det inte följer med till den nya versionen.
OK, jag har aldrig hört annat än att utvecklingen lagts ner, "Projektet avbröts vid årsskiftet 2018/2019 pga resursbrist.", aldrig hört något om en nyare version... :-) Jag vet att det nämnda projektet var själva databasprojektet, men har inte hört något om version 2.3 eller sett någon länk dit. Ska kolla och använda den i stället, har väl inget direkt behov av någon gammal data.
Ser fortfarande ingen länk till någon version 2.3. DiS hemsida länkar till 1.0.
OK, hittade en artikel som hade en länk till nya versionen, https://openrgd-drift.dis.se/login
Ska pröva igen, men första försöket var inte så lovande:
Sidan fungerar inte
openrgd-drift.dis.se skickade ingen data.
ERR_EMPTY_RESPONSE
Andra försöket, kom ett antal prickar och sedan händer inget mer.
Avvakta programmet: indataValidering.py
.................................................. ....................
Jag vet att du har rätt stor databas. Hur stor är den?
Nu gick den igenom :-) Ser att dock fortfarande namndatabasen inte är uppdaterad utan det i mitt träd mycket vanliga kvinnonamnet Botel/Bothel/Bothil/Botild/Bothild/Botill/Botild larmas för och sägs att alla de är mansnamn. Liksom det typiska namnet för första dottern, Una, eller de mer engelskklingande kvinnonamnen Lucille, Gloria, Marilyn, Doreen, Melissa, Charlene och Kristen.
Närmare 60000 personer. Tror att rutinen kanske är känslig för om det blir ett ögonblickligt avbrott i internetkontakten. Har dåligt internet här i Sunny Beach, när jag körde via mobilens internet gick rutinen igenom.