UTF
Wikipedia
UTF, akronym för Unicode Transformation Format, universellt teckenkodningsformat, format för att representera teckenkoder (unicode) i multiplar av oktetter i datorer och datamedia.
Standarden definierar olika metoder att översätta en teckenkod i unicode till en sekvens av oktetter, vilket är nödvändigt för att utvidga datorernas förmåga att representera världens olika skriftsystem men samtidigt bibehålla kompatibilitet av gamla representationer, som i huvudsak är av varianten ASCII (sju bitar varav en oanvänd.) Samtliga teckensymboler (glyfer) av dagens existerande skriftspråk kan representeras i UTF-16 (av två oktetter).
Följande varianter av UTF finns:
Endast UTF-16 och UTF-8 beskrivs i ISO/IEC 10646.
Alla varianter utom UTF-32 innebär att ett tecken översätts till ett variabelt antal bitsekveser av den givna längden. I till exempel UTF-8 kan ett Unicode-tecken kodas med antingen 8, 16, 32, 40, 48 eller 56 bitar beroende på vilket tecken det är. För alla varianterna gäller att teckenuppsättningen i ISO/IEC 8859-1 förblir oförändrade och kodas med 8 bitar.