Visa fullständig version : Databas med Svenska namn och ekvivalenter
Hej,
Finns det nån publik databas med förslag för vilka svenska namn och efternamn som ska anses vara samma namn?
Om jag är dålig på att förklara kan jag ge ett exempel.
Om man vill söka efter en person söker man ju normalt efter tex "Per Persson", men han kan ju lika gärna ha skrivits in som "Pehr Pehrsson", "Pehr Pehrson" eller liknande i olika kyrkböcker. Mao så vill man ju normalt att släktforskningsprogram och websidor ska söka efter alla dessa kombinationer.
Men för att kunna göra det vore det bra om det fanns en gemensam svensk databas som listade alla namn som man normalt kan anse är desamma (i svenska kyrkböcker iaf).
Finns det nån sån eller är detta nåt som varje släktforskarprogram får hitta på själv?
Mvh, Kenneth
Förbundet har en namnlista.
https://wiki.rotter.se/index.php/Fil:S%C3%A5_stavar_du_namnen_-_Sl%C3%A4ktforskarf%C3%B6rbundets_namnlista.pdf
Hej och tack, Gunnar!
Jag hittade just själv nu också https://www.rotter.se/faktabanken/personnamn/?view=listmanagerfront vilket jag gissar är samma databas fast på annat sätt?
Men det löser inte mitt problem dels därför att den inte är direkt maskinläsbar (vilket man iofs kan lösa med lite manuellt jobb), men det verkar också saknas en del information som man behöver.
Dels triviala ekvivalenta namn som tex "Pehr" => "Per".
Dessutom står det inget om efternamn. Man skulle kanske kunna lägga på "-sson" och "-dotter" på diverse manliga förnamn, men jag gissar att det skulle bli stora luckor ändå?
Hur gör tex Disgen?
Mvh, Kenneth
Torgny Larsson
2019-07-11, 13:14
En hel del databaser fungerar så, dvs. att sökning sjer på ett "normalisera namn", som det kallas.
Vid sökning t.ex. på Kerstin får man träff på alla stavningsvarianter. Samma för efternamn.
Disbyt fungerar så.
Disgen har ännu inte den möjligheten.
Jo, det stämmer.
Vad jag skulle vilja göra är att lägga till motsvarande även på min egen (gratis-) websida
http://improveyourtree.com/
för att förbättra funktionerna för att hitta dubletter i gedcom filer, geni.com eller när man jämför två olika släktdatabaser.
Tillägg:
Om det inte finns nån skulle jag kunna hjälpa till att skapa en.
Men i så fall vore det bra om nån Svensk släktforskarförening är intresserad av att göra den tillgänglig för almänheten?
/ Kenneth
Vore det inte en bra ide om tex Disbyt lade ut den databas de använder?
För att alla släktforskarprogram som vill ska kunna bli lite bättre (inklusive Disbyt)?
GunnarBer
2019-07-11, 16:49
Nu är det så att DIS äger inte innehållet i Disbyt, utan det tillhör de enskilda bidragsgivarna.
Hmm..
Det du menar är att DIS äger inte databasen som utgär Disbyt, eller?
Men DIS äger väl ändå källkoden som hanterar namn-matchningen vid sökning, och det är den som jag pratar om....
Rolf Carlsson
2019-07-17, 11:16
Det finns en namndatabas hos Dis, nämligen den som togs fram i RGD-projektet. Den har ett delvis annat syfte; nämligen att hjälpa till att identifiera/hitta dubbletter vid matchning i databasen.
Det finns dels namnvarianter av samma grundnamn (Per, Petter, Petrus) och dels stavningsvarianter av en namnvariant (Per, Pär).
Nu är det inte alldeles enkelt att upprätta en databas, som du åsyftar. Ta det enkla namnet Persson och dela upp det i dels Per och dels sson. Per, Pehr, Pär, Pähr, Peer liksom sson, son, sohn, ssohn, zon, zohn och kanske fler kombinationer (utan att ta med Peder, Peter, Petter). Bara exemplet med 5+6 ger ju 30 olika kombinationer. Ta "skräckexemplet" Källkvist, där jag arbetade på sin tid en hel del med det och kom fram till säg 20 stavningar på Käll och ungefär lika många på kvist. Du får då teoretiskt 300-400 olika stavningskombinationer. Det andra problemområdet är att avgöra till vilket grundnamn ett namn hör: är Ek-, Eke-, Eken- samma grundnamn? På förnamnssidan kan det vara mycket komplicerat med alla stavningar kring Kerstin och Kristina (nu är i och för sig Kerstin en namnvariant av Kristina.
Powered by vBulletin® Version 4.2.5 Copyright © 2024 vBulletin Solutions, Inc. All rights reserved.