IBM、音声認識を大幅改良

» 2006年01月26日 11時13分 公開
[ITmedia]

 米IBMは1月24日、あらかじめ決められたコマンドではなく、自然な音声コマンドを利用できる音声技術を発表した。

 この技術は「IBM Embedded ViaVoice 4.4」に組み込まれてリリースされた。「携帯機器やカーナビ向けの組み込み音声技術の大きな前進だ」とIBMは発表文で述べている。

 これまで、ユーザーが音声認識システムを操作するには、決められたフレーズやコマンドを覚えなくてはならなかった。だがIBMの新技術では、例えばカーラジオの周波数を合わせるには、単に「Tune to 104.3」「Set the radio station to 104.3」「Change the radio station to 104.3」などと言うだけでいい。

 Embedded ViaVoice 4.4の「フリーフォームコマンド認識」は、高度な統計言語モデルと意味解釈を利用して、音声認識システムが自然言語を理解できるようにしている。また同製品では新しい音響モデル、強化版の音響モデルトレーニング、発話と(クラクションなどの)一時的な雑音の区別の改善により、雑音下での認識精度を向上させているという。複数言語のコマンドも認識できる。

 またIBMはこの日、VoiceBoxが同社の音声認識技術を音声検索プラットフォーム「VoiceBox Navigator」に統合することを明らかにした。衛星ラジオのXM Satellite Radioがこのプラットフォームを採用する。ドライバーはXMラジオに話しかけることで、ラジオのチャンネルを探したり、ボリュームを調整したりできるようになる。

Copyright © ITmedia, Inc. All Rights Reserved.