Det hender UTF-8 er feil val..

Litt teknisk bakgrunn for dette hjertesukket: Ei datamaskin kan eigentleg ikkje jobbe med tekst, berre med tal. Så det datamaskina har gjort er å registrere tal som bokstavar. Ei liste med tal og tilsvarande bokstavar kaller vi for eit teiknsett. Til dømes er talet for "A" i den vanlege ASCII-tabellen 65.

Det er mange ulike teiknsett for ulike språk - det er klart at du treng ei lengre liste over bokstavar i kinesisk eller japansk enn for norsk. Men i dag vel eg omtrent automatisk teiknsettet UTF-8 for nye prosjekt, for det er det einaste som har god støtte i programvare og kan syne teikn frå ALLE språk på same side.

Men: det hender UTF-8 er FEIL val. Veldig feil. For Wergelandkalenderen valde eg også UTF-8 for databasen, både for sitat og abonnentar. Og det har straffa seg..

For det er enno ikkje slik at all programvare støtter UTF-8. Derfor risikerar du at mottakaren ser æ, ø og å feil om du sender ut E-post med UTF-8-teiknsettet.

Etter å ha tenkt meg om (hei der, Wergeland har vel av gode grunnar aldri brukt ein einaste Kanji eller Hangul-bokstav i tekstene sine!!) vart det ganske klart at eg burde ha bruk standard vestleg teiknsett. Men da var det for seint. Nå tek skriptet som sender ut E-post jobben med å konvertere UTF-8 til iso-8859-1. Håper at alle feil er ute av verda, men det har gått ut E-post som synte søppel for norske teikn i namnet på abonnenten, og E-post som sender fancy anførselsteikn og pause-teikn kopiert frå Word som spørsmålsteikn ettersom desse teikna ikkje let seg konvertere til iso-8859-1. Søren. Men det er grei erfaring å ha med: UTF-8 er DET BESTE teiknsettet - men det hender likevel at det er feil å bruke det..

<<: HAW-sitat i innboksen! --

Comments

Add commentAdd comment