KS X 1001
出典: フリー百科事典『ウィキペディア(Wikipedia)』
KS X 1001は、韓国でハングルや漢字をあらわすのに用いられている文字コード(文字集合)の規格。 以前はKS C 5601といい、現在でもこの名称で呼ばれることが多い。 単にKSコードとも呼ばれる。
JIS X 0208に似た94×94文字集合で、ハングル2350字、漢字約4000字の他、英数字や仮名を含んでいる。 ハングルについては、字母を組み合わせて構成した1音節を1文字とみなしてコードを振る「完成型コード」であり、すべての可能な組み合わせを符号化しているわけではないので、表現できない音節が多数存在し、批判の声も多かった。
漢字は読みの順に排列されている。 韓国語では原則として漢字は一字一音であるが、複数の読みを持つ漢字がわずかながらあり、この規格ではそのような漢字をそれぞれの読みの位置に重複して符号化していることが大きな特徴である。 もっとも多いのは「樂」で、4個所に重複符号化されている。 この方式は、コードから文字の読みを機械的に判定できるという利点があるが、文字コードとしての大原則に反しているという批判もある。 なお、このように重複符号化されている漢字は、UnicodeおよびISO/IEC 10646においても互換性のため重複符号化されている。
KS X 1001をEUCで符号化したものを韓国語EUC (EUC-KR) というが、実際にはKS X 1001が他の符号化方式で用いられることはほとんどないため(ISO-2022-KRというものもあるがほとんど使われていない)、単にKS C 5601といっただけでEUC-KRを意味している場合が多い。
[編集] 関連項目
カテゴリ: コンピュータ関連のスタブ項目 | 文字コード | 大韓民国