誠

プリンタ用表示
ニュース

「モバイル文字認識」が開くカメラ付き携帯の新たな可能性

富士通フォーラム2006で紹介されていた、カメラ付き携帯で撮影した写真から文字を認識する「モバイル文字認識」という技術。気になったので詳しく調べてみた。
2006年06月16日 23時59分 更新

 富士通フォーラムのセミナー会場でふと耳にしたのが、カメラ付き携帯電話を使った「モバイル文字認識」という技術だ。あいにくとデモ展示はされなかったようだが、富士通研究所で開発が進められているという。実現したら、携帯のカメラで写真を撮るという行為からさまざまな可能性が生まれそうなモバイル文字認識。手元にある情報からその一端を紹介しよう。

看板などの文字を単語レベルで認識

 文字認識というと、これまではスキャナで新聞や雑誌などの文字原稿を読み取り、それをパソコンで処理してテキストデータとして活用する、という程度のものだった。光学系で文字を読み取るこの技術(および装置)は一般的にOCR(Optical Character Reader)と呼ばれ、市販ソフトの普及および低廉化とともに、企業や家庭で広く使われるようになっている。

 近年はカメラ付き携帯電話にも、マクロ撮影機能を利用した文字認識機能が搭載されるようになってきた。とはいえ、雑誌をまるまる1ページ取り込むようなパソコンの使い方とは異なり、多くの場合は名刺や雑誌などの一部分から、電話番号やURLを読み取るなどの用途に限定されている。

 そんな中で、いくつかのメーカーが研究に取り組んでいるのが、モバイル環境下での文字認識技術だ。持ち歩きのできるデジタルカメラをスキャナ代わりにして、もっと手軽に文字情報を取り込もうというわけだ。すでにNEC、松下電器産業、シャープなどが研究を重ね、一部は製品化にこぎつけているという。

 富士通研究所が開発中のモバイル文字認識は「ACR(Advanced Character Recognition)」と呼ばれる。直訳すると“先進的な文字認識”となる。スキャナの代わりにデジタルカメラやビデオカメラ、カメラ付き携帯電話などを利用して、屋外の看板や掲示物などから文字情報を読み取る技術だ。取り込みの対象は雑誌の記事のような長い文章ではなく、単語レベルになる。

 だが、比較的コントラストがハッキリしている印刷物に比べ、屋外にある看板などから文字情報を正しく読み取ることは、たとえ単語レベルとはいっても至難の業だ。さらにスキャナと違って、カメラは対象物との距離があるため、画像の歪みやボケなどが認識の際に問題となる。

 ACRではこうした問題への解決策として、画像劣化モデルを利用している。これは、あらかじめ劣化した文字のパターンを辞書としてサーバ内に置いておき、撮影した画像をサーバに送信してそれらと比較、最適な候補を抽出するというものだ。この仕組みを使うことで、150〜200dpi程度の低解像度で劣化した文字でも認識することができるという。

 また、ACRでは複数のフォント、および劣化レベルに対応。特に他社の技術と圧倒的に異なるのが、白黒2値化処理を施さずに濃淡画像中から直接文字の特徴を取得するという点。dual-eigen-space法と呼ばれる手法を適用することで、2値化処理における画像劣化がないため、認識精度が他社の技術に比べ大きく向上している。サーバ内で生成される辞書の容量にもよるが、ACRでは劣化した文字であっても90%を超える文字認識率を達成できる見込みだ。

標識や看板からの位置情報検出や写真からの関連情報収集も

 では、こうした技術が完成したらどのようなことができるのだろうか。富士通研究所が応用シーンのひとつとして挙げているのが、車載カメラによる標識や看板の認識だ。例えば、町を走行してる車から周囲の風景を取り込んで、そこから認識された文字情報を既存の地図に重ねていけば、最新のタウンマップが出来上がる。サーバ次第では外国語の翻訳も可能だから、活躍の場は国内に限らない。

 認識された文字情報はそのまま検索エンジンに利用できるから、店の電話番号や営業時間など、関連情報へのアクセスも簡単だ。電光掲示板や映像広告のテロップなども文字情報として認識できるようになれば、これはもう、人間の目の役割とほとんど変わらない。

 また、周囲の看板や地番表示などの認識文字を地図情報と比較することで、自分が今いる場所を地図上で知ることができる。周囲の景色を撮影してどんどんサーバに送り込むことで、GPS機能に頼らない正確な位置情報の把握も可能になる。

 もちろん、GPS機能がすべての製品に実装されれば、この点での優位性はほとんどない。だが、正確な現在位置から漠然と周囲の情報を提供されるのと違い、カメラで撮影した画像は自らが興味の対象としたものだ。関心のある情報だからこそ、そこから自動的に検索、収集される関連情報には利用価値がある。

 ふと思い立って撮影した1枚の写真でも、そこに写っている物事に関連した情報がどんどん集まってくる。まるで近未来を描いた映画のワンシーンのようだが、近年のロボット関連技術の進化などとあわせて考えると、決して映画の中だけの話ではないだろう。

 「モバイル文字認識技術が利用できるのは、おおよそ2008年頃」(富士通研究所)というように、私たちの目に触れるようになるのはもう少し先の話だ。だがACRが完成すれば、ライフスタイルに大きな変化が訪れるように思う。携帯電話に搭載されたカメラ機能が、新たな扉を開くことになるかもしれない。

[江戸川,ITmedia]

Copyright© 2016 ITmedia, Inc. All Rights Reserved.