Resultat 1 till 24 av 24

Ämne: Svarsfiler i Disbyt

Hybridvisning

Föregående inlägg Föregående inlägg   Nästa inlägg Nästa inlägg
  1. #1

    Svarsfiler i Disbyt

    När jag får mina svarsfiler så är de encodade i oldfashined 8 bits. Varför ?. Det är tyvärr inte övergivet ännu. En mera modern encoding är utf8 som också klarar av en massa utländska tecken förutom åäö. För att tillgodose alla önskemal kan man använda
    taggen HEAD.CHAR och generera svarsfiler enligt den taggen.

    Regards.

    PS. Hur är progressen med modernisering utav dispyt DS.

  2. #2
    Christers avatar
    Christer Gustavsson
    Medlemsnr
    4621
    Ort
    Linköping
    Inlägg
    1 873
    Jag ska lyssna vad som är möjligt att enkelt genomföra när det teckenkodning. När det gäller nya söksidan så står vi i begrepp att gå ut med, som vi hoppas, den sista betan innan vi släpper en publik beta parallellt med nuvarande Disbyt.
    Jag har skrivet ett ärende #4329 men utvecklaren är utomlands ett par veckor till så jag tror att svaret dröjer.
    Senast redigerat av Christer den 2017-09-25 klockan 09:47.
    Christer Gustavsson - Dis verksamhetsledare emeritus

  3. #3

    Ang teckenkodning i Disbyt

    Citat Ursprungligen postat av penguinfriend Visa inlägg
    När jag får mina svarsfiler så är de encodade i oldfashined 8 bits. Varför ?.
    Disbyt-basen har varit med så länge, så den första teckenuppsättningen i basen var ASCII-7. I dagsläget är teckenuppsättningen ANSI-8.

    Filer som tas emot checkas för olika teckenformat: ASCII, ANSI, MAC, UTF8 mm men konverteras till ANSI. Det innebär att vi inte tar höjd för alla teckenvarianter som finns i UTF8. Å andra sidan har fokus på Disbyt alltid varit svenskt material, så en total internationalisering har inte varit aktuellt.

    Att konvertera teckenformat i själva Disbyt-basen till UTF8 kräver mycket arbete med att kolla koden. Delar av koden har mer 25 år på nacken. Det är ingen högprioriterad fråga i dagsläget.

    När det gäller teckenformat på resultatfilerna i Disbyt, så är jag ganska säker på att de som skickar in material med MAC-teckenkodning får tillbaka resultatet i samma format. Jag trodde nog att det också gällde de som använder olika PC-teckenkodningar, men jag får kolla det framöver när jag är tillbaka i Sverige.

    Med hälsning från Stillwater, Minnesota
    /Olof C

  4. #4
    Citat Ursprungligen postat av m00082 Visa inlägg
    Disbyt-basen har varit med så länge, så den första teckenuppsättningen i basen var ASCII-7. I dagsläget är teckenuppsättningen ANSI-8.

    Med ASCII-7 menas ASCII (hoppas jag)
    Med ANSI-8 menar du säkert ISO/IEC 8859-1 som också kan kallas Windows code page. ANSI-8 finns inte deklarerat


    Filer som tas emot checkas för olika teckenformat: ASCII, ANSI, MAC, UTF8 mm men konverteras till ANSI. Det innebär att vi inte tar höjd för alla teckenvarianter som finns i UTF8. Å andra sidan har fokus på Disbyt alltid varit svenskt material, så en total internationalisering har inte varit aktuellt.



    Att konvertera teckenformat i själva Disbyt-basen till UTF8 kräver mycket arbete med att kolla koden. Delar av koden har mer 25 år på nacken. Det är ingen högprioriterad fråga i dagsläget.

    När det gäller teckenformat på resultatfilerna i Disbyt, så är jag ganska säker på att de som skickar in material med MAC-teckenkodning får tillbaka resultatet i samma format. Jag trodde nog att det också gällde de som använder olika PC-teckenkodningar, men jag får kolla det framöver när jag är tillbaka i Sverige.

    Med hälsning från Stillwater, Minnesota
    /Olof C
    Min Gedcomfil har följande infi i headern

    2 VERS 5.5.1
    2 FORM LINEAGE-LINKED
    1 CHAR UTF-8
    1 LANG Swedish

    men när jag får mina svarsfiler ser det ut som följer: (utdrag från A****.TXT)
    Först så varnar den att det är en binär fil och sedan ser det ut:

    Resultat av DISBYT-s<F6>kning med s<F6>kfil f<F6>r medlem 49812 utf<F6>rd 2017-09-24

    Niv<E5> 3 - Efternamn och ort <E4>r identiska. <C5>rtalen <F6>verlappande.
    Niv<E5> 4 - Hela namnet och orten <E4>r identiska. <C5>rtalen <F6>verlappande.
    Niv<E5> 5 - Hela namnet, orten och ett <E5>rtal <E4>r identiska.
    Niv<E5> 6 - Hela namnet, orten och b<E5>da <E5>rtalen <E4>r identiska.
    Niv<E5> 7 - Hela namnet, orten och ett <E5>rtal <E4>r identiska. Sl<E4>ktingar finns med tr<E4>ffar.
    Niv<E5> 8 - Hela namnet, orten och b<E5>da <E5>rtalen <E4>r identiska. Sl<E4>ktingar finns med tr<E4>ffar.

    F<F6>r- och efternamn kan vara normerade j<E4>mf<F6>rt med medlemmens egna uppgifter.

    dvs den ger ISO/IEC 8859-1 fastän infilen var skriven i UTF-8.

    Du skrev också att databasen är skriven i 8 bits men jag bryr mig inte om vad den har för internformat utan vad den ger som utfil. Eftersom teckenuppsättning är jobbigt så
    vill jag bara ha utf8 i mina datorer.

    Låt detta vara sista ordet i denna tråd.

  5. #5
    DanielBerglunds avatar
    Daniel Berglund
    Medlemsnr
    25564
    Ort
    Göteborg
    Inlägg
    1 225
    Citat Ursprungligen postat av penguinfriend Visa inlägg
    men när jag får mina svarsfiler ser det ut som följer: (utdrag från A****.TXT)
    Först så varnar den att det är en binär fil och sedan ser det ut:
    Vem är "den" som varnar för att det inte är en textfil? Vilket program använder du för att öppna textfiler?
    Ordförande & Disgenutvecklare.

  6. #6

    DIS är en förening för datorer och inte enbart Windows

    Det är inget progran utan OS (Linux)

    Använder 'less' som tool
    Senast redigerat av penguinfriend den 2017-09-26 klockan 20:49.

  7. #7
    DanielBerglunds avatar
    Daniel Berglund
    Medlemsnr
    25564
    Ort
    Göteborg
    Inlägg
    1 225
    Jo, men givetvis finns det program även i Linux, och ett av dem är det du använder för att öppna textfiler. Exempelvis vim, less, more, emacs, nano, ... Så min fråga är helt enkelt vilken texteditor/motsvarande som visar meddelandet att svarsfilen inte är en textfil.

    (För din information har föreningen runt 8 servrar som kör Linux så lite kunskap finns det.)
    Ordförande & Disgenutvecklare.

Behörigheter för att posta

  • Du får inte posta nya ämnen
  • Du får inte posta svar
  • Du får inte posta bifogade filer
  • Du får inte redigera dina inlägg
  •