handdator

Visa fullständig version : RGD



39064
2012-01-16, 11:37
Jag ingår i en arbtsgrupp som försöker titta på om det är möjligt att införa Rikstäckande genealogisk databas – RGD, samt vilka program/verktyg som kan användas för att skapa lite större släktdatabaser.
Vi behöver våra medlemmars hjälp för att göra en inventering över vilka program finns idag, där flera forskare kan samarbeta. Som ex Ancestry.se . Vilka mer liknade program finns? Någon som kan skriva ned lite erfarenheter om sådana program.
Vi vill också få tips om program som underlättar import av GEDCOM filer. Så som ”Dubblegångaren” Runar Hortlunds program.

Även fristående program för släktrelationer är intressanta.

Är det känslig information, är det bra om ni skickar den till mig personligen.

kjell.hasselroth@comhem.se

LOE
2012-05-11, 23:30
Reflexioner om en Rikstäckande Genealogisk Databas (RGD)

Inte förrän helt nyligen upptäckte jag, att DIS länge övervägt utvecklandet av en ny genealogisk databas. Uppenbarligen har en arbetsgrupp länge bearbetat problemet. Det kanske är alldeles för sent att anlägga principiella synpunkter. Eftersom jag inte känner till vad arbetsgruppen gjort, är jag fri att spekulera. Om spekulationerna kan i någon mån vara tankeväckande, så bjuder jag på följande överloppsgärning, som är en skiss till en modell.

Vid utformningen av ett stort system som RGD är det lämpligt att tänka igenom det principiellt innan implementationstekniker förs in i diskussionen. Det säger sig självt, att många konstruktionsbeslut är avgörande för systemets prestanda, t o m för dess rimlighet - i det följande avstår jag alltså avsiktligt från sådana överväganden.

Jag har antagit, att systemet i princip ska omfatta alla personer som levat - även sådana, som är och förblir ofullständigt kända eller t o m vaga. Kyrkböcker eller källor av annan typ kan alltså inte vara själva grunden för systemet.

I mitt RGD finns inga personer, bara representationer av förmodade personer. En person kan ha gett upphov till flera olika representationer - en del ofullkomliga, en del innehållande felaktigheter. Förhoppningen med RGD är att så många personer som möjligt ska komma att företrädas av så fullständiga och sannolika representationer som möjligt. Sanning är ett ohanterligt kvalitetsmått.

Låt oss kalla en föreslagen representation för en persona. Varje persona har tilldelats en unik identitet vid inläggningen och ägs för alltid av den som lagt in den [valet av identifikationsprincip är en praktisk fråga vid systemkonstruktionen, identiteten skulle kunna vara ett generaliserat ”ortspersonnummer” men kan vara ett rent löpnummer]. Flera persona kan ibland förmodas syfta på en och samma person [kriterierna för detta är en mycket viktig del av systemutformningen, innebärande bl a bestämmande av värdeförråd för attributen; hanteringen av överlappande klasser är också en viktig fråga]. Låt oss gruppera sådana pseudonyma persona i en personaklass, även denna med en unik identitet. Vid varje givet tillfälle ska en klass ha en persona, som anses bäst representera klassen (kan vara den enda personan). Valet av bästa representation kan vi kalla nominering och den nominerade personan för kandidat, processen att komma till en nominering kan vi kalla certifiering [kriterierna för denna är en mycket viktig del av systemutformningen och måste utformas som en ständigt föränderlig del av systemet - ett enkelt viktningssystem är det minsta som duger (en källverifierad födelseuppgift väger t ex mycket tyngre än en dödsåldersuppgift), mera spektakulärt vore optimerings- eller evolutionsalgoritmer; man kan hävda, att antalet ”röster” för en viss uppgift skulle utgöra ett argument - det tycker jag inte, om inte annat så därför, att en stor del av uppgifterna kommer att vara okritiskt adopterade från andra forskare, inklusive källhänvisningar i bästa fall]. Man kan överväga, att låta ägaren till den nominerade personan äga även kandidaten [Viktigt val - jag lutar åt detta]. På vanligt vis är varje persona representerad genom ett antal förutbestämda attribut med normerade samt ursprungliga data (t ex det påträffade namnet Nicolaus och normeringen Nils registreras), varav vissa kan vara nil. Dessa attribut ska vara så starkt formaterade som möjligt (t ex ortsangivelser enligt viss standard), men också medge ofullständig information. Varje uppgift ska vara kopplad till ett argument - ofta en källangivelse, eventuellt flera källangivelser i kombination eller t o m ett helt, logiskt resonemang (källangivelser ska så långt möjligt vara strukturerade och volymsutpekningen auktoriserad). En persona har uppgifter om personens relationer - kandidaten har motsvarande relationer med andra kandidater. [Huruvida det kan vara lämpligt att behandla familjer och relationer som särskilda entiteter får vara ett praktiskt konstruktionsbeslut].

Mot denna databas kan ett antal processer definieras: inläggning, nominering, organisering, utsökning, eftersökning, presentation osv.

Inläggning innebär, att en användare m h a systemets funktioner inför en uppsättning nya persona. Vid inläggningen kan databasen redan innehålla ett godtyckligt antal persona. Uppsättningen nya persona kan vara godtyckligt stor (minst en). Till användare hänförs även andra system, såsom DISBYT och kyrkboksregister, som uppfyller en speciell gränssnittsspecifikation).

En inläggning medför en organisering av databasen [Om denna ska ske per inläggning, per persona; samtidigt eller efter inläggning är föremål för konstruktionsbeslut]. Organiseringen innebär, att varje persona läggs i mest pseudonyma, existerande personaklass eller får bilda en ny sådan [kriterierna för detta är en mycket viktig del av systemutformningen - en felplacerad persona utgör ett problem - en fritt flytande sådan, som bort placeras, utgör ett annat]. En sorts purgering (Vissa persona rensas bort, läggs i nya, egna personaklasser eller omplaceras till andra) kan vara ett lämpligt moment i processen [Detta har jag inte tänkt igenom]. Organiseringen innebär också, att alla relationer mellan personaklasser utökas och omprövas. Som avslutande moment gör systemet en omprövning av alla nomineringar [Om detta ska ske automatiskt eller involvera ägaren av den gamla kandidaten och ägaren av den nya kandidaten är en fråga att ta ställning till].

Lämpligen upprätthåller systemet en historik och lämpligen är varje process förenad med önskvärd rapportering av vad som skett. I rapporteringen kan ingå meddelande om förändringar till ägare av persona.

Värt att notera är, att modellen inte innehåller någon process för anmärkning på eller rättelse av data - förfaringssättet är att lansera en ny persona innebärande föreslagna ändringar och tillägg. Detta kommer att leda till en förädlingsprocess, driven av enskilda användare - kandidaten blir förhoppningsvis bättre och bättre och enigheten om nomineringen större och större. För att understödja denna evolution behövs en möjlighet till diskussion i anslutning till en personaklass [man kan tänka sig att införa överklasser, motsvarande släkter - detta har jag inte tänkt på]. Så långt har man ett ”ädelt” system, där ”bästa persona vinner”. Det kommer dock aldrig att vara möjligt att för varje personaklass bevisa, vad som är sant. Ovan har föreslagits, att systemet utför (om)nominering. Det kan finnas skäl att anse, att systemet valt fel i ett enskilt fall (ceritifierings-kriterierna borde kanske ändras). Denna situation kan man hantera med en möjlighet för en användare att göra ett anspråk, innebärande, att en annan persona än den nominerade hävdas böra vara kandidat. Ett sådant anspråk skulle genom meddelande från systemet ge kandidatens ägare och andra intressenter rådrum för svaromål, efter vilken tid anspråket skulle hörsammas av systemet [ägare kan vara förhindrade att gå i svaromål eller tillämpa en strategi att tiga ihjäl förändringsförslag, vilket skulle kunna ta död på systemet]. För att detta system inte ska bli ett DISPYT (sic) krävs lite eftertanke om det sociala samspelet.

Det ska vara möjligt att göra utsökning, innebärande, att angivande av en identitet resulterar i presenterandet av motsvarande persona.

Likaså ska sedvanliga metoder för eftersökning finnas.

Systemet ska ha sedvanliga metoder för presentation: av en persona, av en ”familj”, av en släkt osv. Presenterade data ska kunna laddas ner.

För att öka ansvarstagandet, kan man ge anonyma användare mindre befogenheter eller lägre vikt [även med formellt starka källangivelser kan en uppgift vara fel, därför att källtolkningen är felaktig osv - det finns därmed en risk för ”virus” i databasen, som något minskas av personligt ansvarstagande]. Omvänt kunde man erbjuda möjligheten för forskare med mycket höga tankar om sitt eget arbete att med en kröning av en kandidat riskera sitt goda namn och rykte med ett intygande av att uppgifterna utsatts för seriös prövning och anses ha hög halt. Några formella auktoriteter ska inte finnas - allt ska bygga på trovärdighet, saklig argumentation och successiv prövning.

Som alltid vid systemutveckling bör man försöka skapa generella mekanismer för förutsedd utveckling, inte minst i omvärlden. En sådan kan vara systematisk hantering av användaridentiteter, t ex med en spårningsmöjlighet gällande evolutionen av kandidater, eller med ett register över inlagda persona per användare. En annan skulle kunna innebära tvingande märkning av nerladdade data med identitet, så att återkommande inläggningar av kopior kunde effektiviseras.

[Ett viktigt konstruktionsbeslut gäller hanteringen av problemet med ”gamla” persona. Strängt taget skulle man kunna kasta alla utom de nominerade. Mot detta talar möjliga förändringar i certifierings-processen, som skulle kunna ge tidigare utrangerade persona förnyad vikt]

C-J Gustafsson
2012-05-12, 20:08
Hej Lars-Olov

Jag har läst igenom dina idéer och synpunkter. Det överensstämmer ganska väl med de tankegångar som funnits i arbetsgruppen, men det finns också en del skillnader. Arbetsgruppens uppgift var dock inte att gå ner så här långt i detaljer, så på det planet är du inte för sent ute med synpunkter.

Arbetsgruppen har dock avslutat sitt arbete och frågan ligger nu hos Dis styrelse.

Om du är intresserad av att delta, om/när arbetet kan återupptas, så meddela ditt intresse till mig eller till Rolf Carlsson. Hur direktiven kommer att se ut vet vi som sagt inte i nuläget men vi hoppas att ett RGD projekt kan startas upp om någon tid.

Carl-Johan Gustafsson, medlem i den tidigare arbetsgruppen.