ISO-8859
Материал из Википедии — свободной энциклопедии
ISO-8859 — семейство ASCII-совместимых кодовых страниц, разработанное совместными усилиями ISO и IEC. По состоянию на 2006 г. это семейство состоит из 15 кодовых страниц.
[править] Общая информация
Поскольку кодировки ISO-8859 разрабатывались как средства для обмена информацией, а не как средства обеспечения выскококачественной типографики, то в них не включены такие символы, как парные кавычки, тире различной длины, лигатуры и т.п. Также в них не включены управляющие символы, кроме заимствованных из ASCII. Такие управляющие символы, как неразрывный пробел, символ мягкого переноса и символы управления двунаправленным письмом, были добавлены в расширениях ISO-8859 на позиции, значения которых данными стандартами оставлены непонятными.
Поскольку различные страницы ISO-8859 разрабатывались совместно, они обладают некоторой взаимной соместимостью. Например, все семь символов расширенной латиницы, используемые в немецком языке, стоят на одинаковых позициях во всех кодовых страницах, включающих эти символы. Страницы Latin-1—Latin-4 обладают ещё большей степенью совместимости: каждый символ, представленный в любых двух из этих страниц, стоит в них на одинаковых позициях.
[править] Части ISO-8859
- ISO 8859-1 (Latin-1)
- Расширенная латиница, включающая символы большинства западноевропейских языков (английский, датский, ирландский, исландский, испанский, итальянский, немецкий, норвежский, португальский, ретороманский, фарерский, шведский, шотландский (гэльский) и частично голландский, финский, французский), а также некоторых восточноевропейских (албанский) и африканских языков (африкаанс, суахили). В Latin-1 отсутствуют знак евро и заглавная буква Ÿ. Эта кодовая страница считается кодировкой по умолчанию для HTML-документов и сообщений электронной почты. Также этой кодовой странице соответствуют первые 256 символов Юникода.
- ISO 8859-2 (Latin-2)
- Расширенная латиница, включающая символы центральноевропейских и восточноевропейских языков (боснийский, венгерский, польский, словацкий, словенский, хорватский, чешский). В Latin-2, как и в Latin-1, отсутствуют знак евро.
- ISO 8859-3 (Latin-3)
- Расширенная латиница, включающая символы южноевропейских языков (мальтийский, турецкий и эсперанто).
- ISO 8859-4 (Latin-4)
- Расширенная латиница, включающая символы североевропейских языков (гренландский, эстонский, латвийский, литовский и саамские языки).
- ISO 8859-5 (Latin/Cyrillic)
- Кириллица, включающая символы славянских языков (белорусский, болгарский, македонский, русский, сербский и частично украинский).
- ISO 8859-6 (Latin/Arabic)
- Символы, используемые в арабском языке. Символы других языков с письмом на основе арабского не поддерживаются. Для корректного отображения текста в кодировке ISO-8859-6 трубется поддержка двунаправленного письма и контекстно-зависимых форм символов.
- ISO 8859-7 (Latin/Greek)
- Символы современного греческого языка. Может использоваться также для записи древнегреческих текстов в монотонической орфографии.
- ISO 8859-8 (Latin/Hebrew)
- Символы современного иврита. Используется в двух вариантах: с логическим порядком следования символов (требует поддержки двунаправленного письма) и с визуальным порядком следования символов.
- ISO 8859-9 (Latin-5)
- Вариант Latin-1, в котором редко используемые символы исландского языка заменены на турецкие. Используется для турецкого и курдского языков.
- ISO 8859-10 (Latin-6)
- Вариант Latin-4, более удобный для скандинавских языков.
- ISO 8859-11 (Latin/Thai)
- Символы тайского языка.
- ISO 8859-12 (Latin/Devanagari)
- Символы письма деванагари. В 1997 работа над ISO-8859-12 была официально прекращена, и эта кодировка так и не была принята как стандарт.
- ISO 8859-13 (Latin-7)
- Вариант Latin-4, более удобный для балтийских языков.
- ISO 8859-14 (Latin-8)
- Расширенная латиница, включающая символы кельтских языков, таких как шотландский (гэльский) и бретонский.
- ISO 8859-15 (Latin-9)
- Вариант Latin-1, в котором редко используемые символы заменены на необходимые для полной поддержки финского, французского и эстонского языков. Кроме того, в Latin-9 был добавлен знак евро.
- ISO 8859-16 (Latin-10)
- Расширенная латиница, включающая символы южноевропейских и восточноевропейских (албанский, венгерский, итальянский, польский, румынский, словенский, хорватский), а также некоторых западноевропейских языков (ирландский в новой орфографии, немецкий, финский, французский). Как и в Latin-9, в Latin-10 был добавлен знак евро.
Кодовые таблицы символов в ISO-8859 |
---|
ISO-8859-1 | ISO-8859-2 | ISO-8859-3 | ISO-8859-4 | ISO-8859-5 | ISO-8859-6 | ISO-8859-7 | ISO-8859-8 ISO-8859-9 | ISO-8859-10 | ISO-8859-11 | ISO-8859-12 | ISO-8859-13 | ISO-8859-14 | ISO-8859-15 | ISO-8859-16 |