ISO 8859-1
Z Wikipedie, otevřené encyklopedie
ISO 8859-1, formálněji ISO/IEC 8859-1, méně formálně Latin-1 je široce používaná osmibitová znaková sada. Je 1. částí standardu ISO/IEC 8859 zabývajícího se kódováním latinky. Byl zaveden organizací ISO, později udržován společně s IEC. Je základem široce používaných znakových sad ISO-8859-1 (všimněte si pomlčky navíc) a Windows-1252. Rovněž prvních 256 znaků unicode vychází z ISO 8859-1.
Obsah |
[editovat] Pokrytí
Skládá se ze 191 znaků dovolujících (s výjimkou několika označených znaků) komunikovat následujícími jazyky:
- albánština
- baskičtina
- katalánština
- dánština
- holandština (chybí dvojznak ij, ale ten by měl být v elektronické formě vždy reprezntován znaky IJ nebo ij)
- angličtina
- estonština (chybí Š, š, Ž, ž)
- Pozn.: Windows-1252 a ISO-8859-15 tyto znaky obsahují
- faroéština
- francouzština (chybí ligatury Œ, œ a řídce užívaný znak Ÿ)
- Pozn.: Windows-1252 a ISO-8859-15 tyto znaky obsahují
- finština (chybí Š, š, Ž, ž)
- Pozn.: Windows-1252 a ISO-8859-15 tyto znaky obsahují
- galština
- němčina
- islandština
- irština (nová ortografie)
- italština
- latina
- norština (Bokmål a Nynorsk)
- portugalština
- réto-románština
- skotština
- španělština
- švédština
Další jazyky:
- afrikaans
- svahilština
Některým jazykům chybí správné typografické uvozovky, protože jsou dostupné jen « », " ", a ' '.
[editovat] Historie
ISO 8859-1 byl založen na mezinárodní sadě použité společností Digital Equipment Corporation v populárním terminálu VT220. Byl vyvinut v ECMA, European Computer Manufacturers Association, a publikován společně s ISO 8859-2, ISO 8859-3, a ISO 8859-4 jako část specifikace ECMA-94, pod jejímž jménem se občas dosud uvádí.
[editovat] Vztah k ISO/IEC 8859-15
V ISO/IEC 8859-1 chybí řídce užívané znaky Œ, œ a Ÿ pro francouzštinu, jednoznaková reprezentace písmene IJ, dva finské znaky pro transkripci některých cizích jmen (Š a Ž), typografické uvozovky a pomlčky, symbol eura (€) a typografický křížek (†).
Proto byl vyvinut standard ISO/IEC 8859-15 jako aktualizace ISO 8859-1. To si bohužel vyžádalo odstranění některých méně frekventovaných symbolů ISO/IEC 8859-1, : ¤, ¦, ¨, ´, ¸, ¼, ½, a ¾.
[editovat] Kódová tabulka
ISO/IEC 8859-1 | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
0x | Řídící znaky | |||||||||||||||
1x | ||||||||||||||||
2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | | | } | ~ | |
8x | Nevyužíváno | |||||||||||||||
9x | ||||||||||||||||
Ax | NBSP | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | SHY | ® | ¯ |
Bx | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
Cx | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
Dx | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |
Ex | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
Fx | ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |
Hodnoty 00–1F, 7F, a 80–9F nejsou v ISO/IEC 8859-1 přiřazeny.
[editovat] Externí odkazy
- ISO/IEC 8859-1:1998
- ISO/IEC 8859-1:1998 - 8-bit single-byte coded graphic character sets, Part 1: Latin alphabet No. 1 (draft dated February 12, 1998, published April 15, 1998)
- Standard ECMA-94: 8-Bit Single Byte Coded Graphic Character Sets - Latin Alphabets No. 1 to No. 4 2nd edition (June 1986)
- ISO-IR 100 Right-Hand Part of Latin Alphabet No.1 (February 1, 1986)
- Windows Code pages
- Differences between ANSI, ISO-8859-1 and MacRoman Character Sets
- The Letter Database
- ASCII - ISO 8859-1 Table with HTML Entity Names
- The ISO 8859 Alphabet Soup - Roman Czyborra's history of ISO character sets