手書き文字認識
出典: フリー百科事典『ウィキペディア(Wikipedia)』
手書き文字認識(Handwriting Recognition)とは、認識可能な手書き入力を受け取るコンピュータの機能である。入力方法により「オフライン手書き文字認識」と「オンライン文字認識」に区別される。
目次 |
[編集] オフライン手書き文字認識
紙の上に書かれた文書イメージを光学スキャンすることで認識する(光学文字認識)。
手書き文字を画像データとして取り込み、文字コードを自動的に抽出し、テキストデータに変換してアプリケーションに受け渡す。これで得られるデータは、手書き文字の静的な表現とみなすことができる。手書き文字認識は光学文字認識に基づいている。システムは、画像を前処理し、文字列の中に適切な分節を見つけて、最もそれらしい単語を見つける必要がある。
この技術は、保険会社のようなたくさんの手書きの文書を処理するビジネスで使われて、成功している。認識の質は、文書を構造化することによって大幅に向上させることができる。
紙質の劣化が著しい資料や文献を残す為、この方式で文書を保存することがある。テキストデータとして扱われるので、検索性が大幅に向上する。但し、文字種によっては誤認識する確率が著しく高いか、まったく認識できないことがある。この場合、読み取ったまま画像データとして保存せざるを得ない。
[編集] オンライン手書き文字認識
特殊なタブレットやPDAにおいて、ペンまたはスタイラスを用いて入力領域(時に全画面)に文字を書き込む。
[編集] 仕組み
この方式のインターフェイスには一般に以下の要素が含まれる。
- ユーザーが書き込むのに使うペンまたはスタイラス
- 接触を感知する平面の入力域 出力ディスプレイと統合されているか、隣接していることがある。(入力装置としての)タブレットまたはタッチパネルが用いられる。
- ペンまたはスタイラスの動きとその結果として生じている曲線を、デジタルのテキストに翻訳して解釈するソフトウェアアプリケーション
センサーがペンの先端の座標 X(t)、Y(t) を検知し、ペンを動かした時の軌跡を読み取る。これらのデータはデジタルインキと呼ばれ、手書き動作の表現とみなすことができる。この信号を、認識アルゴリズムに従い文字データベースとのパターンマッチングを行い、書かれた文字をテキスト情報に変換し、アプリケーションに受け渡す。この処理が行われる際、文字列の中から分節を探し、前後の文字種から適切な文字を推測し、補完するものもある。
[編集] 実装例
手書き文字入力を提供した最初のPDAは、アップルコンピュータの「ニュートン」である。ニュートンOSが実装されたPDA「メッセージパッド」は、効率化されたユーザーインターフェイスの有利さを世間に知らしめた。しかし、ニュートンは商業的に成功しなかった。価格や処理スピードの問題に加え、ユーザーの書き込みパターンを学習するソフトウェアの信頼性が低かったことも普及を妨げた原因の一つとして挙げられている。ニュートンOS 2.0では、モードレスエラー修正などの現在の認識システムでも見られないユニークな機能を含めて手書き文字認識が大いに改善されたものの、それ以前に悪い第一印象が形成されてしまっていた。
類似の試みとして、Go社の「Penpoint オペレーティングシステム」があった。NCRやIBMなどの様々なメーカーが同OSを組み込んだ機器を製造した。IBMのThinkPadタブレット・コンピュータは、Penpoint オペレーティングシステム と IBM の手書き文字認識技術を使っていた。この認識システムは後に、マイクロソフトの「Windows for Pen」と、IBMの「Pen for OS/2」に移植された。これらはどれも商業的には成功しなかった。
palmOne(現 Palm, Inc.)は、グラフィティ認識システムに基づくPDAのシリーズを開発、販売した。「グラフィティ」とは、アルファベットと一対一で対応する一筆書きのパターンの集まりであり、これを採用することにより認識精度は飛躍的に高まった。ユーザーは、アルファベットに似ているが書き順や形の違う(一致するものもある)入力パターンを覚える必要があったものの、一旦覚えてしまえば、高速かつ正確な認識により快適な入力を行うことができた。但し、アルファベットやアラビア数字、一部の記号以外の文字を入力するには、インプットメソッドによる変換作業が必要だった。
シャープは、アップルコンピュータとの提携により、ニュートンOSを搭載したPDAのハードウェアを製造していた。シャープはニュートンOSの日本語ローカライズを行い、日本国内で販売することを検討していたが、ニュートンの商業的失敗が明らかになると、独自路線に一本化した。同社が製造、販売していた電子手帳を拡張し、ニュートンのようなペンオペレーションによるUIを組み込んだ。自社ブランドによるPDA「PI-3000」は、日本国内で同種の商品としては異例のヒットを記録した。同社はPDAにザウルスの愛称を冠してシリーズ化し、数度のアーキテクチャ変更を経て今日まで販売が続けられている。手書き文字認識エンジンは年々改良されており、ある程度のくせ字や崩し字でも精度は低いが認識できる(但し、書き順を間違うと格段に精度が落ちる場合がある)。認識に要する時間はやや長く、あまり高速な入力はできない。
マイクロソフトは、ペンオペレーションを前提としたUIを持つOS「Windows Mobile」を開発し、ライセンス販売している。同OSは、汎用性の高いエンベッド向けOSであるWindows CEをベースに、ペン操作に向いたUIや、PDAとして利用するのに必要なコンポーネントを組み合わせたものである。かつてはキーボードを搭載した「Handheld PC」というセグメントがあったが、後にペン操作に一本化した。Windows Mobileを採用したPDAは、Palmから顧客を奪い一定のシェアを確保したものの、新規需要の掘り起こしにまでは至っておらず、Symbian OSなどを採用したスマートフォンに押されている。
デスクトップOSをベースにした手書き文字認識システムには、Windows XP Tablet PC Editionがある。タブレットPCは、タッチパネルを装備した特殊なノート型パーソナルコンピュータで、スタイラスを用いてスクリーン上に文字を手書きで入力できるようになっている。OSは手書きされたパターンを認識し、それを通常のテキストに変換する。マイクロソフトのシステムは、ユーザの書き込みパターンを学習せず、類似した字形を含む内部の認識データベースとのマッチングを行っている。このシステムは、Windows Mobileの中で使用されている手書き文字認識システムとは異なる。
汎用OSを使ったものとしては、生保・損保業界では、タッチパネル搭載、キーボードなしのハンディPCに、Tablet PC Editionではないデスクトップ向け汎用OSと、独自の手書き認識エンジンを組み込んだものが使用されることがある。また、キオスク端末として、ペンオペレーション可能な小型PCが利用されていることがある。これは、利用者の利便性向上の他、キーボード操作を無効にしてシステムの安全性を確保するという目的もある。
[編集] 将来の展望
最近では、デジタル要素を仕込んだペンで紙に文字を書いて、そこからデジタル化されたテキストを得る試みがなされている。その製品としての成否は今後のことであろう。
手書き文字認識は入力方式として一般化してきたが、いまだにデスクトップコンピュータなどで広範囲に使われるには至っていない。キーボードによる入力の方が速くて信頼性が高いという見方が一般的である。PDAでも、キーボードが徐々に導入されてグラフィティなどの手書き文字認識を置き換えている。