ISO 2022
维基百科,自由的百科全书
ISO 2022,全称ISO/IEC 2022,由国际标准化组织(ISO)及国际电工委员会(IEC)联合制定,是一个使用7位编码表示汉语文字、日语文字或朝鲜文字的方法。
ISO 2022等同于欧洲标准组织(ECMA)的ECMA-35、中国国标GB 2311、日本工业规格JIS X 0202(旧称JIS C 6228)及韩国工业规格KS X 1004(旧称KS C 5620)。
目录 |
[编辑] 引言
英语可用7位编码储存,而其他使用拉丁字母、希腊字母、西里尔字母、希伯来字母等的语文,由于只使用数十个字母,传统上均使用8位编码的ISO 8859标准来表示。但由于汉语、日语及朝鲜语字数众多,无法用单一个8位字元来表达,故需要多于一个字节来代表一个字。于是,ISO 2022就设计出来让汉语、日语及朝鲜语可以使用数个7位编码的字元来示。
ISO 2022使用“逃逸字串”(Escape sequence)。逃逸字串由1个“ESC”字符(0x1B),再由两至三个字串组成。此标记代表它后面的字符,属于下表字符集的文字。
[编辑] ISO 2022表达方式
以ISO 2022标准来编码的字集包括:
- ISO-2022-JP - 日语文字
- ESC ( B 转为ASCII
- ESC ( J 转为JIS X 0201-1976
- ESC $ @ 转为JIS X 0208-1978
- ESC $ B 转为JIS X 0208-1983
- ISO-2022-JP-1 - 于ISO-2022-JP的基础上,加上以下一组逃逸字串
- ESC $ ( D 转为JIS X 0212-1990
- ISO-2022-JP-2 - 于ISO-2022-JP-1的基础上,加上以下四组逃逸字串,提供多语言支援
- ESC $ A 转为GB 2312-1980 (简体中文)
- ESC $ ( C 转为KS X 1001-1992 (朝鲜文)
- ESC . A 转为ISO 8859-1 (西欧拉丁字母)
- ESC . F 转为ISO 8859-7 (希腊字母)
- ISO-2022-JP-3 - 于ISO-2022-JP的基础上,加上以下两组逃逸字串
- ESC $ ( O 转为JIS X 0213-2000第一字面
- ESC $ ( P 转为JIS X 0213-2000第二字面
- ISO-2022-JP-2004 - 于ISO-2022-JP-3的基础上,加上以下一组逃逸字串
- ESC $ ( Q 转为JIS X 0213-2004第一字面
- ISO-2022-KR - 朝鲜文
- ESC $ ) C 转为KS X 1001-1992
- ISO-2022-CN - 中文
- ESC $ ) A 转为GB 2312-1980
- ESC $ ) G 转为CNS 11643-1992第一字面
- ESC $ * H 转为CNS 11643-1992第二字面
- ISO-2022-CN-EXT - 于ISO-2022-CN的基础上,加上以下六组逃逸字串
- ESC $ ) E 转为ISO-IR-165
- ESC $ + I 转为CNS 11643-1992第三字面
- ESC $ + J 转为CNS 11643-1992第四字面
- ESC $ + K 转为CNS 11643-1992第五字面
- ESC $ + L 转为CNS 11643-1992第六字面
- ESC $ + M 转为CNS 11643-1992第七字面
[编辑] 参看
[编辑] 参考文献
- 小林劍,(1999年). CJKV Information Processing. First Edition. O'Reilly and Associates, Inc. ISBN 1-56592-224-7;中文版,鄭褚璋譯,(2002年) 中日韓越資訊處理 第一版,台北市,美商歐萊禮股份有限公司。 ISBN 986-7794-03-6
[编辑] 外部链结
- 国际标准化组织
- ECMA-35
- 中國國家標準(中華民國) CNS 7654
- International Register of Coded Character Sets to be Used with Escape Sequences
- RFC 1468, ISO-2022-JP的规格
- RFC 2237, ISO-2022-JP-1的规格
- RFC 1554, ISO-2022-JP-2的规格
- RFC 1922, ISO-2022-CN及ISO-2022-CN-EXT的规格
- RFC 1557, ISO-2022-KR的规格
- History of Character Codes in North America, Europe, and East Asia
- CJK.INF: a document on encoding Chinese, Japanese, and Korean (CJK) languages, including a discussion of the various variants of ISO 2022. 可透过 HTTP浏览.