Unicode
Z Wikipedii
Unicode (zwany czasem po polsku Unikod) to komputerowy zestaw znaków mający w zamierzeniu obejmować wszystkie pisma używane na świecie. Definiują go dwa standardy - Unicode oraz ISO 10646. Znaki obu standardów są identyczne. Standardy te różnią się drobnymi sprawami, m.in. Unicode określa sposób składu.
Rozwijany jest przez konsorcjum, w którego skład wchodzą ważne firmy komputerowe, producenci oprogramowania, instytuty naukowe, agencje międzynarodowe oraz grupy zainteresowanych użytkowników. Konsorcjum współpracuje z organizacją ISO.
Standard Unicode nie obejmuje sposobów kodowania znaków. Jest kilka metod kodowania, oznaczanych skrótami UCS (Universal Character Set) lub UTF (Unicode Transformation Format), a do najważniejszych należą:
innymi kodowaniami Unikodu są także:
Kody pierwszych 256 znaków Unicode pokrywają się z kodami ISO Latin 1 (czyli ISO-8859-1). Należy jednak pamiętać, że jest to zbieżność wyłącznie numerów przyporządkowanych konkretnym znakom, wartości bajtów użytych do ich zapisania mogą (i w większości kodowań będą) się różnić od tych, które uzyska się stosując Latin 1.
[edytuj] Historia standardu
- 1991 Unicode 1.0
- 1993 Unicode 1.1
- 1996 Unicode 2.0
- 1998 Unicode 2.1
- 2000 Unicode 3.0
- 2001 Unicode 3.1
- 2002 Unicode 3.2
- 2003 Unicode 4.0
- 2005 Unicode 4.1.0 (31 marca)
- 2006 Unicode 5.0 (18 lipca)
[edytuj] Relacje do UCS
- Unicode 1.1 ISO/IEC ≈ 10646-1:1993
- Unicode 3.0 ISO/IEC ≈ 10646-1:2000
- Unicode 3.2 ISO/IEC ≈ 10646-2:2001
- Unicode 4.0 ISO/IEC ≈ 10646-3:2003
[edytuj] Linki zewnętrzne
- Polska witryna o Unikodzie
- Konsorcjum Unicode, czyli strona domowa Unicode - tu znajduje się opis standardu i wszelkie tabele.
- DecodeUnicode - Unicode WIKI, 50.000 gifs