ISO 8859-1
Wikipedia
ISO 8859-1 on kahdeksanbittinen ASCII-merkistön laajennos johon on otettu mukaan useimmat länsieurooppalaiset merkit. Merkistö tukee virallisesti seuraavia kieliä: albania, baski, englanti, espanja, fääri, gaeli, hollanti, iiri, islanti, italia, katalaani, norja, portugali, retoromaani, ruotsi, saksa, suomi ja tanska. Lisäksi sitä voi käyttää ainakin afrikaansin, eteläsaamen ja swahilin kirjoittamiseen.
Merkistön seuraaja on ISO 8859-15, joka täydentää ranskan ja suomen tukea sekä lisää merkistöön euron merkin. ISO 8859-1 on kuitenkin niin laajasti käytetty, ettei sen korvaaminen ole realistisesti ollut mahdollista.
Sisällysluettelo |
[muokkaa] Historia ja standardointi
ISO 8859-1 perustuu DEC Multilanguage Character Set -merkistöön jota käytettiin ensimmäisen kerran VT220 ja VT240-päätteissä vuonna 1982. DEC MCS eroaa ISO 8859-1 -merkistöstä islantilaisten merkkien osalta.
Virallisempi nimi merkistölle on ISO/IEC 8859-1 ja se tunnetaan myös nimellä Latin1 (Latinalainen 1). IANA:n standardoinnissa merkistö tunnetaan ISO-8859-1 -nimellä. IANA määrittelee myös merkitykset kontrollimerkeille 0-31 (vastaavat ASCII-merkistön merkityksiä), joihin ISO ei ota kantaa.
Maaliskuussa 1985 ECMA (European Computer Manufacturer's Association) standardoi nykyisin nimillä ISO 8859-1:stä ISO 8859-4:aan tunnettavat merkistöt ECMA-94 nimellä. ISO-standardointia saatiin kuitenkin odottaa vuoteen 1987.
Vuonna 1987 julkaistiin MS-DOS 3.30 jossa oli mukana koodisivu CP850, joka sisältää samat merkit kuin ISO 8859-1, kuitenkin eri järjestyksessä. PC-koneissa ISO-merkistöä muistuttava Windows koodisivu-1252 tuli käyttöön lopulta Windows-ympäristön mukana 1990-luvulla. UNIX-puolella siirtymistä hidasti erilaisten päätelaitteiden kirjavuus, kattavaan 8-bittisen merkistön käyttöön päästiin vasta kun vanhat päätteet korvattiin itsenäisillä työasemakoneilla ja pääasialliseksi yhteydeksi UNIX-koneisiin tuli Windowsista otettu telnet- tai ssh-yhteys.
ISO 8859-1 laajentaa ISO 646-IRV -merkistöä kahdella lohkolla; ASCIIn kontrollimerkkien ja latinalaisen perusosan lisäksi merkistöön on lisätty laajennetut kontrollimerkit ja Latinalaisen merkistön täydennys Latin-1:ksi osa. Laajennetuille kontrollimerkeille ei ole keksitty käyttöä ja merkkipaikat ovat käyttämättä.
[muokkaa] ISO 8859-1 -merkit
ISO/IEC 8859-1 | ||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
x0 | x1 | x2 | x3 | x4 | x5 | x6 | x7 | x8 | x9 | xA | xB | xC | xD | xE | xF | |
0x | ei käytössä | |||||||||||||||
1x | ||||||||||||||||
2x | SP | ! | " | # | $ | % | & | ' | ( | ) | * | + | , | - | . | / |
3x | 0 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | : | ; | < | = | > | ? |
4x | @ | A | B | C | D | E | F | G | H | I | J | K | L | M | N | O |
5x | P | Q | R | S | T | U | V | W | X | Y | Z | [ | \ | ] | ^ | _ |
6x | ` | a | b | c | d | e | f | g | h | i | j | k | l | m | n | o |
7x | p | q | r | s | t | u | v | w | x | y | z | { | } | ~ | ||
8x | ei käytössä | |||||||||||||||
9x | ||||||||||||||||
Ax | NBSP | ¡ | ¢ | £ | ¤ | ¥ | ¦ | § | ¨ | © | ª | « | ¬ | SHY | ® | ¯ |
Bx | ° | ± | ² | ³ | ´ | µ | ¶ | · | ¸ | ¹ | º | » | ¼ | ½ | ¾ | ¿ |
Cx | À | Á | Â | Ã | Ä | Å | Æ | Ç | È | É | Ê | Ë | Ì | Í | Î | Ï |
Dx | Ð | Ñ | Ò | Ó | Ô | Õ | Ö | × | Ø | Ù | Ú | Û | Ü | Ý | Þ | ß |
Ex | à | á | â | ã | ä | å | æ | ç | è | é | ê | ë | ì | í | î | ï |
Fx | ð | ñ | ò | ó | ô | õ | ö | ÷ | ø | ù | ú | û | ü | ý | þ | ÿ |
Merkistössä merkki 20 (32 desimaalisena) on tavallinen välilyönti ja A0 sitova välilyönti. Merkki AD, SOFT HYPHEN, on määritelty HTML-kielessä tavutusvihjeeksi, eikä sen pitäisi olla näkyvissä (vaikkakaan useimmat selaimet eivät tue tavutusta). Merkkiä 7F ei ole määritelty, mutta ASCII:ssa se on kontrollimerkki, joka saadaan BackSpace-näppäimestä.
[muokkaa] Katso myös
[muokkaa] Lisätietoja
- Eurooppalaisen merkistön merkkien suomenkieliset nimet http://www.ling.helsinki.fi/filt/info/mes2/