米IBMは1月24日、あらかじめ決められたコマンドではなく、自然な音声コマンドを利用できる音声技術を発表した。
この技術は「IBM Embedded ViaVoice 4.4」に組み込まれてリリースされた。「携帯機器やカーナビ向けの組み込み音声技術の大きな前進だ」とIBMは発表文で述べている。
これまで、ユーザーが音声認識システムを操作するには、決められたフレーズやコマンドを覚えなくてはならなかった。だがIBMの新技術では、例えばカーラジオの周波数を合わせるには、単に「Tune to 104.3」「Set the radio station to 104.3」「Change the radio station to 104.3」などと言うだけでいい。
Embedded ViaVoice 4.4の「フリーフォームコマンド認識」は、高度な統計言語モデルと意味解釈を利用して、音声認識システムが自然言語を理解できるようにしている。また同製品では新しい音響モデル、強化版の音響モデルトレーニング、発話と(クラクションなどの)一時的な雑音の区別の改善により、雑音下での認識精度を向上させているという。複数言語のコマンドも認識できる。
またIBMはこの日、VoiceBoxが同社の音声認識技術を音声検索プラットフォーム「VoiceBox Navigator」に統合することを明らかにした。衛星ラジオのXM Satellite Radioがこのプラットフォームを採用する。ドライバーはXMラジオに話しかけることで、ラジオのチャンネルを探したり、ボリュームを調整したりできるようになる。
Copyright © ITmedia, Inc. All Rights Reserved.
Special
PR注目記事ランキング