Big5
出典: フリー百科事典『ウィキペディア(Wikipedia)』
Big5(ビッグファイブ、中国語名:大五碼あるいは五大碼)は、繁体字中国語圏で最も一般的に使われている文字コード(文字集合)。漢字13,053字を収録するが、そのうち2字は重複している。台湾や香港、マカオなどの繁体字地域で普及しているが、2003年にCNS 11643の附属書で追認されるまでは公的規格ではなかった。WindowsやMac OSといったオペレーティングシステムで採用されたことにより定着したデファクトスタンダードである。
1984年5月1日に台湾の資訊工業策進会(Institute for Information Industry)が制定した。5大パソコンメーカーであったエイサー(宏碁)、マイタック(神通)、佳佳、ゼロワン(零壱)、FIC(大衆)が共同で策定したことによりこの名がある。
2バイトで約13000字を収容し、第一バイトは0xA1~0xC6および0xC9~0xF9、第二バイトは0x40~0x7Eおよび0xA1~0xFEの範囲をとる。大きく分けて、非漢字、常用漢字、次常用漢字の3つのブロックで構成され、漢字は画数順に配列されている。一部、重複している漢字や、配列の誤りがある。
符号空間がシフトJISと似ており、第二バイトに0x5Cが含まれるため、シフトJISの抱える円記号問題と同様の問題をも抱えている。ただし、シフトJISはJIS X 0208文字集合の符号化方式の一つであるのに対して、Big5は文字集合と符号化方式が一体化しており、通常これ以外の符号化方式で利用されない点が大きく異なる。
いくつかの独自拡張があるが、中でも倚天(Eten)のものと香港大学(HKU)のものが古くから知られている。倚天の拡張は仮名を含んでおり、Big5ベースのシステムで日本語を表現する方法としてさかんに用いられた。
[編集] 関連項目
カテゴリ: 文字コード | 台湾の言語 | 香港 | コンピュータ関連のスタブ項目