ISO-2022-JP
出典: フリー百科事典『ウィキペディア(Wikipedia)』
ISO-2022-JPは、インターネット上(特に電子メール)で使われる日本のキャラクタセットのひとつ。ISO/IEC 2022のエスケープシーケンスを利用して文字集合を切り替える7ビットのコードであることを特徴とする (アナウンス機能のエスケープシーケンスは省略される)。俗に「JISコード」と呼ばれることもある。
目次 |
[編集] 概要
日本語表記への利用が想定されているキャラクタセットで、日本語の利用されるネットワークにおいて、日本の規格を応用したものである。あらゆるキャラクタセットがそうであるように、自然言語以外へ適用が可能である。また文字集合としては、日本語で用いられる漢字、平仮名、片仮名はもちろん、ラテン文字、ギリシア文字、キリル文字なども含んでおり、学術や産業の分野での利用も考慮したものとなっている。また、その名に、いみじくもJP
というISOの国・地域コードがついているのが、由来を明確にしている (ちなみにISOの日本語の言語コードはja
だ)。
文字集合としてJIS X 0201のC0集合(制御文字)、JIS X 0201のラテン文字集合、ISO 646の国際基準版図形文字、JIS X 0208の1978年版(JIS C 6226-1978)と1983年および1990年版が利用できる。1986年以降、日本の電子メールで用いられてきたJUNETコードを、村井純・Mark Crispin・Erik van der Poelが1993年にRFC化したもの。後にJIS X 0208:1997の附属書2としてJISに規定された。MIME で用いるキャラクタセットとして IANA が登録している。
なお、符号化の仕様についてはISO/IEC 2022#ISO-2022-JPも参照。
[編集] 類似のキャラクタセット
「ISO-2022-JP」という呼称は、「ISO-2022-JP」で始まる名称のキャラクタセットの総称として使われることもある[要出典]。これには以下のようなキャラクタセットがある。なお、一部は MIME で用いるキャラクタセットとして IANA が登録している。
- ISO-2022-JP-1
- RFC 2237。ISO-2022-JPを拡張し、ISO-2022-JPの文字集合に加え、JIS X 0212を利用できるようにしたもの。
- ISO-2022-JP-2
- RFC 1554。ISO-2022-JPを拡張し、ISO-2022-JPの文字集合に加え、JIS X 0212、KS X 1001、GB 2312、ISO 8859-1、ISO 8859-7を利用できるようにしたもの。
- ISO-2022-JP-3
- JIS X 0213:2000の附属書2に記述される符号化表現で、ISO-2022-JPの漢字集合をJIS X 0213に変えるなどしたもの。IANAによるキャラクタセット登録が提案されたが、RFC 2278(当時。RFC 2978により廃止された)の手続きに従っていない(いっぺんに複数の文字コードを登録する手続きは存在しないのに6つ同時に申請されている)などの理由により却下された。
- ISO-2022-JP-2004
- JIS X 0213:2004の附属書2に記述される符号化表現。ISO-2022-JP-3の漢字をJIS X 0213:2004に改めたもの。IANAによる登録はまだされていない。
[編集] ISO-2022-JPと機種依存文字
「JISコード」という名前でWindows上で実際に使われているものは、ISO-2022-JPの非標準な拡張で、CP932 (MicrosoftによるShift_JISの亜種) と同等の機種依存文字を追加したCP50220という名前の文字コードが多い。CP50220を実装したアプリケーションとしてはInternet ExplorerやOutlook Expressがある。また、秀丸エディタやThunderbirdのようなMicrosoft社以外のWindowsアプリケーションでもCP50220は利用されている。ただし、ISO-2022-JPの範囲の文字に限定して使わなければ、異なる製品間では文字化けの元となる。そのため、Windows用のメーラーであってもCP50220の拡張文字を使用すると警告を出したり、あえて使えないように制限しているものも存在する。
また、キャラクタセット名をISO-2022-JPとしているのに、文字集合としてはJIS X 0212 (いわゆる補助漢字) やJIS X 0201の片仮名文字集合 (いわゆる半角カナ) をも符号化している例がある。半角カナについてはエスケープシーケンスにも複数の方式があり、方式によってはISO/IEC 2022に準拠すらしていない[1]。受信側のメーラーがこれらの独自拡張に対応していない場合、その文字あるいはその文字を含む行、時にはテキスト全体が文字化けすることがある。
[編集] 参考資料
執筆にあたっては以下の資料を参照した。
- J. Murai 他 (1993年6月). "RFC 1468 Japanese Character Encoding for Internet Messages (『インターネットメッセージのための日本語文字符号化』)".
- M. Ohta 他 (1993年12月). "RFC 1554 ISO-2022-JP-2: Multilingual Extension of ISO-2022-JP (『ISO-2022-JP-2: ISO-2022-JPの多言語拡張』)".
- K. Tamaru 他 (1997年11月). "RFC 2237 Japanese Character Encoding for Internet Messages (『インターネットメッセージのための日本語文字符号化』)".
- 日本規格協会 (2000年). "JIS X 0213:2000 『7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合』 (7-bit and 8-bit double byte coded extended Kanji sets for information interchange) 附属書2「ISO-2022-JP-3符号化表現」".
- 日本規格協会 (2004年). "JIS X 0213:2000/AMENDMENT 1:2004 『7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合 (追補1)』 (7-bit and 8-bit double byte coded extended Kanji sets for information interchange (Amendment 1)) 附属書2「ISO-2022-JP-2004符号化表現」".
- "Rejection of registration of new Japanese charsets" - ISO-2022-JP-3登録の却下の経緯
- ^ JIS X 0201 片仮名, 森山 将之, 1997年6月3日
カテゴリ: 出典を必要とする記事 | ISO | 文字コード