幽霊文字
出典: フリー百科事典『ウィキペディア(Wikipedia)』
幽霊文字(ゆうれいもじ)とはJIS基本漢字に含まれる、典拠不明の文字の総称。幽霊漢字(ゆうれいかんじ)、幽霊字(ゆうれいじ)とも呼び、英語ではghost charactersと訳される。
目次 |
[編集] 概説
JIS C 6226(後のJIS X 0208)で規定された、いわゆるJIS第1第2水準漢字を「JIS基本漢字」と呼ぶ。これは当時の通産省が1978年に制定したもので、表向きには日本で使われている漢字のうちで、これだけあればとりあえず困らない、という状況を作ることを目指し、地名や苗字に使われる文字にも対象とされていた。
しかし、こうした作業を行った者たちは、必ずしも漢字や国字の専門家とは言えず、JIS基本漢字をまとめる際に、原典の文字の書き写しを誤ったり、見間違えるといったミスが介入し、この結果、JIS基本漢字には約60字、一説には100字を越えるという見方もあるが、多くの「何に使われるのかわからない文字」が混入することとなった。これが幽霊文字である。
幽霊文字の例(カッコはShiftJIS) | |||||
垉 | (9AB3) | 垈 | (9AB0) | 墸 | (9AD5) |
壥 | (9ADD) | 妛 | (9BAA) | 岾 | (9BB1) |
彁 | (9C5A) | 恷 | (9C8E) | 挧 | (9D6A) |
暃 | (9DF1) | 椦 | (9E9B) | 橸 | (9EEF) |
汢 | (9F89) | 熕 | (E090) | 碵 | (E1F1) |
穃 | (E26D) | 粐 | (E2E2) | 粭 | (E2E4) |
粫 | (E2E6) | 糘 | (E2F2) | 膤 | (E452) |
蟐 | (E5AA) | 袮 | (E5D7) | 軅 | (E75F) |
鍄 | (E7FB) | 閠 | (E880) | 靹 | (E8D6) |
駲 | (E971) | 鵈 | (E9FC) |
代表的なものに「妛」や「彁」などがあり、これらは康熙字典にも収録されていない。特に「彁」は典拠のみならず用例すら不明である(同定不能)。
JIS基本漢字が制定され、パソコンやワープロに実装されるようになると、次第にそれらの文字が「何のためにあるのか」「どこで使う文字なのか」「何と読むのか」といった謎が浮上していった。これを受けて国立国語研究所の笹原宏之らが調査を開始し、それらの文字が誤字であったり、まったくの典拠不明字であるといったことが判明した。
[編集] 幽霊文字の数
幽霊文字といったとき、それがすべてで何文字あるのか、明確な数字を挙げることはできない。調査の結果として典拠が見付からなかったとするものが19字報告されているが、この数で決定というわけでもない。なぜならば、あくまでも現時点では見当たらないというだけであり、制定時に参考とした、今となっては名前もわからない文献や、それが執筆された当時にあってはその文字を用いる地名や人名などがあったかもしれないという余地は残されるからである。
前述の「妛」は構成する文字要素から通称「やまいちおんな」と呼ばれ、「」(山かんむりに女と書き「あけび」と読む)の誤字とされているが、この「誤字」にも「妛芸凡(あきおうし)という苗字が存在した」という都市伝説にも似た話が丹羽基二の著書『苗字 この不思議な符牒』(芳文館)に存在する。とはいえ、同著者同出版社の『日本苗字大辞典』では「」の字が使われており、『苗字 この不思議な符牒』自体が誤植もしくはJIS基本漢字による印刷が行われた可能性もある。一方、TRONコードのGT書体枠にはこれによく似た文字として、更に「」や「」が収録されている。
なお、こうした「存在していたとされる」という話の場合、仮に過去もしくは現在も、そうした人名や地名があったとし、且つ、JIS基本漢字制定時に参照された資料に書かれており、さらに制定作業に携わった者の手による書き写しミスなどが介入しなかったとしても、それらの資料が必ずしも本来記述されるべき「正しい」とされる文字や字形によって書かれていたとは限らない。また、資料にある地名が必ずしも行政の区画整理に基づく正式なものとも限らない。その地域における、一部の住民の間で使われていたローカルな呼び名であった可能性もあり、「本当に実在していたか否か」という議論は、幽霊文字という問題を残したとは言え、歴史的地理的な側面ではあまり大きな意味を持つものとはいえない。
[編集] 存在していたと言われる幽霊文字を用いた地名の例
- 粫 - 粫田(うるちだ)
- 橸 - 石橸(いしだる)
- 軅 - 軅飛(たかとぶ)
なお、「椦」という字は群馬県前橋市にある「橳島」(ぬでしま)の「橳」という字を誤った字体で登録したという。
[編集] 辞書での扱い
幽霊文字は典拠不明の文字であるために、少なくともJIS基本漢字が制定される以前の主な辞典には記載されていない。仮にそれが誤字であろうと、あるいは忘れられた過去やごく一部で使われていた実在の文字であろうと、読みが不明であることには変わりがない。
とはいえ、パソコンやワープロでは、その文字が実装されている以上、変換して文字が出てこないというのは具合が悪く、多くの場合は便宜的に形声文字として解釈した「音読み」を割り当てている。これに倣い、文字コードを記載した漢和辞典や漢字字典でも、これらの便宜的な読みを掲載することが一般的となっている。
なお、MS-IMEによる逆引きでは空白文字に直される。
[編集] 幽霊文字が残されている理由
笹原宏之らによって幽霊文字の調査は行われたが、これは1997年のJIS漢字改正の一環であった。JIS漢字の改正では1983年のいわゆる「83JIS改正」で字形や文字コードの差替えを行うという変更がされたために大きな混乱を招いた過去があり、それを再び起こすわけにはいかなかった。また、既にUnicodeにはJIS基本漢字が収録されており、この時期になっての変更は、単に国内だけの問題に留まるものではなかった。
加えて今昔文字鏡が撤退したことにより既存文書が事実上上位互換不能となったTRONコードの様を見ており、もはや幽霊文字であることを以って廃止や文字差替えなどの変更を行うことは避けねばならない事情があった。特に今昔文字鏡はライセンス上、他の文字コード体系との変換を禁止しており、今昔文字鏡領域の文字が使われた文書は大漢和辞典領域や後に収録されたGT書体領域の文字へと直すこともできず、BTRON仕様OSである「超漢字」はバージョン2以下と3以降との間に大きな障害を残す結果となった。BTRON仕様は限られたシェアであり、かつ、多くは使用頻度の低い古字や俗字などであったが、そうしたことを以ってしても混乱を招くという現象は、単に「あまり使わない文字だから」という理由による文字コード改正の危険性を物語っていた。
結果として幽霊文字は今尚JIS基本漢字に残され、フォントさえ用意すれば世界中のコンピュータで利用可能となっている。
[編集] 使用例
元来、典拠不明の文字であり、仮に正字や字義がわかったとしても使用頻度が低いことには違いない。
実際に使用されている例としては、誤字であると判明したものは本来の字の代用とすることもある。また、なお典拠不明であったり別字ではあっても、よく似た字形の文字の代用に使うこともあり、いわゆる異字、代替字、俗字としての存在理由ができつつある。
また、「何の文字なのかわからない」「読みも不明である」ということを逆手に取って、暗号文書の文字として用いる者もいる。いわゆる忍者文字のようなものともいえる。
そして、幽霊文字紹介としての使用も見られ、皮肉にもインターネット上ではこの使われ方がもっとも多いとされる。幽霊文字について解説をする以上、具体例としてそのうちの何文字かを挙げねばならず、「幽霊文字としての幽霊文字」という利用である。言うまでもなく、それは本項目のページ自身も含まれる。