音声認識コマンド

 音声認識は、マイクロホンから入力された音声信号から雑音除去後、音素と呼ばれる音波の最小単位を特定しそれをてがかりに単語に変換後、テキスト出力する。カーナビでは、声による目的地入力や音楽検索などに用いられている。最近は認識能力向上のため、スマホなどと連携しクラウド上のAIを利用するようになってきている。逆にスマホがなければ音声認識が使えない、しかもサーバ利用は有料というものも出てきて、かえって不便を強いられることもある。

 使用しているカーナビ NR-MZ200 は、今では市販ナビでは珍しくスマホ不要の単独(スタンドアロン)で動作する音声認識機能をもっており、さらに、音声案内中でも声を聞き取る割り込み認識機能(バージイン発話)や搭乗者の会話から目的地を予想し検索の準備をして応答を速くする周辺検索アシスト機能などを備えている。
 音声認識は指定ボタン押しか「声で操作」というウェイクアップコマンドの発話で開始できる。目的地の検索の際は住所、施設名、ジャンルの組み合わせや電話番号を音声で伝えることができ、検索の結果が3つ表示され、それのひとつを選んだ後は「ここに行く」の発話でルート検索が始まる。NR-MZ200の認識可能コマンドのリストはマニュアルには載っていないので、リスト確認画面から読み取った。下表はそれを整理したものである。

NR-MZ200の音声コマンド
種類音声コマンド
ジャンル検索 現在地周辺の"コンビニ"など[ジャンル] 目的地周辺の[ジャンル] ルート目的地周辺の[ジャンル] ○○県(市町村)の[ジャンル]
目的地指定 [住所] ○○県(市町村)のキーワード 電話番号検索  自宅へ帰る 
登録地 "会社","実家"など[登録地名] 特別登録地(数字1~3) 現在地登録 [登録地名称]へ行く
画面表示 スタンダード スタンダード2画面 高速略図 PsideP(地図とAVの2画面表示)
ルート選択 推奨ルート 有料優先ルート 一般優先ルート 省エネルート 別ルート探索 迂回ルート探索
ルート情報 全ルート ルート詳細情報 目的地までどのくらい 経由地までどのくらい 経由地(数字1~5)までどのくらい
ルート消去 ルート消去 経由地消去 経由地(数字1~5)消去 案内中断 案内再開 取り消し
日時 今何時 今日は何日
ちなみに、前に使っていた トヨタ NHZA-W60G ではこんなにたくさんのコマンドを持っていた。→ こちらを参照

 実際に使用する中で、概ね良好に認識するのを確認しているが、いくつか特定の施設名や地名でとんでもない変換・検索をしてくれることもある。たとえば、こんな具合である。

発話音声認識結果検索結果補足

国府宮こうのみや
 このみや 1 このみ屋
2 おこのみや
3 おこのみ焼あい
何度も「このみや」と誤変換。
やっと正しく認識し「国府宮」を候補として表示しても、
読み上げ時には「こいのみや」と発音 ^^;
「ヤマト運輸」 やまとのゆ 1 大和の湯
「やまとゆ」、「やまとうゆ」への誤変換も多い。
 やまとうゆ 1 福山東陽郵便局
2 ヤマト運輸中国支社
3 大和裏地ボタン専門店
なぜ頭に「福」がつくものが1番目に出る?
 やまとうんゆ 1 山藤クリーニング
2 山藤屋クリーニング
3 やまとう内科クリニック 
なぜか「福島県」から優先して表示する。
で、自車位置の県に切り替えたらこれ。
「やまとう」のみで一致させてる。

 上記のように「ヤマト運輸」「国府宮」などは何度試みても正しく認識・検索してくれなかった。行きたい目的地を何度話しても正しく変換・検索してくれない時ほど腹立たしいことはない。上位機種の NR-MZ300PREMI-3 ではさらにWi-Fiを経由して繋がるクラウド上のサーバも使って認識能力を上げているとのことなので、ぜひ試してみたいものだ。

 さて、ナビ交換とそのまわりの整備が一段落し、次のナビ本体を模索する中、各メーカの現状の旗艦クラスモデルにおける音声認識の機能を調べて比較してみたので、その一覧表を掲載する。

販売元三菱電機TOYOTAクラリオンケンウッドパイオニア
型名NR-MZ300PREMI-3NSZT-Y68TNXV997DMDV-M906HDLAVIC-CQ910-DC
外観
画面の大きさ8インチ9インチ9インチ9インチ9インチ
画面品質WVGAHDHDHDHD
HDMI入力××



単独動作×××
クラウド
通信手段Wi-FiWi-FiBluetoothBluetoothWi-Fi
接続方法テザリング等テザリング等アプリ(有料)
IntelligentVoice
スマホアプリ
VOIPUT
テザリング等
施設検索
楽曲検索×CDからの録音のみSD,USB/iPod内SD,USB内×
その他機能ニュース検索電話自宅エアコン制御楽曲編集・電話電話
スマホ連携×SmartDeviceLinkApple CarPlay
Android Auto
××
赤外線制御×××
備考(Wi-Fiルータ機能)

販売元アルパインパナソニックデンソーテン
型名XF11NX-PR-NRCN-F1X10BDAVN-D10W
外観
画面の大きさ11インチ10インチ7インチワイド
画面品質WXGA(HD)HDWVGA
HDMI入力×



単独動作××
クラウド××
通信手段Bluetooth
接続方法
スマホアプリ
Drive P@ss
施設検索×
楽曲検索×××
その他機能ソース・カメラ切替
スマホ連携×Android Auto×
赤外線制御×××
備考×××
※表中の「スマホ連携」はBluetooth/USB接続でのスマホ内楽曲/動画の再生機能は除く。


 デンソーテン機は今のラインナップでは音声認識は非対応だが、それ以外のほとんどがクラウド上のサーバに接続して音声認識を行っている。さらに、三菱、トヨタ機の音声認識は本体とサーバの機能を組み合わせたハイブリッド型となっている。Wi-Fi接続はスマホのテザリングまたはルータの使用で可能となるが、Bluetooth接続で使用するクラリオン、ケンウッド、パナソニック機は各社の専用アプリを入れたスマホが必須となる。
 なお、パイオニア機のサーバ音声認識は目的地の検索のみで候補の選択からルート設定、案内開始作業は手操作のみのようだ。また、音声による楽曲検索対応は各社まちまちである。  

 そして、最近は音声認識どころかカーナビ本来の機能をスマホに丸投げしようという流れが出てきている。海外ではすでにApple CarPlayやAndroid Autoなどスマホのカーナビアプリを実行する環境だけを提供するカーオーディオが一般化し、日本でもトヨタがディスプレイオーディオ「DA」を新車の車載器とするようになってきた。いずれも音声認識はクラウド上のAIを利用し、カーナビアプリの操作や楽曲の検索・再生、電話の通話操作等をハンズフリーでできるようにしている。下記にスマホ連携AIカーナビをまとめておく。

 スマホ連携環境 CarPlayAndroid Auto SDL(SmartDeviceLink) 
開発元AppleGoogleフォード、トヨタを始めとする
SDLコンソーシアム
カーナビアプリ
Apple純正ナビ
Yahooカーナビ
GoogleMap
カーナビタイム
GoogleMapLineカーナビ
クラウドAISiri Googleアシスタント Clova




(新サイトへ)