音声認識は、マイクロホンから入力された音声信号から雑音除去後、音素と呼ばれる音波の最小単位を特定しそれをてがかりに単語に変換後、テキスト出力する。カーナビでは、声による目的地入力や音楽検索などに用いられている。従来はスタンドアロンで音声認識機能を備えていたが、最近は認識能力向上のため、スマホと連携しクラウド上のAIを利用するようものが増えてきた。スマホがなければ音声認識が使えない、しかもサーバ利用は有料というものも出てきて、以前より不便になったと思わないわけもでもない。

1 VOIPUT
 MDV-M907HDLではKenwoodの無料スマフォアプリ VOIPUT 経由で音声認識を行う。VOIPUTは株式会社フュートレックの音声認識技術vGate ASRを採用することで、iOS向けの音声入力に対応しノイズが多い走行中の車内においても便利な音声検索機能を快適に使うことができるとのこと。VOIPUTを起動したiPhoneとカーナビとはBluetoothで接続し、カーナビのマイクから入力した音声をインターネット上のサーバで認識し、目的地など検索結果をナビに表示する。マジックワードとして「を聴きたい」「で楽曲検索」を末尾につけるとマルチAVブラウザ登録の音楽の検索結果も表示してくれる。以下が使用の様子である。

(1)準備
 あらかじめiPhone上でアプリVOIPUTを起動して活性化させておく。
 もし、起動していない、あるいはバックグラウンドで動いている場合はナビからも起動の指示ができる。ナビの[MAP/AV]ボタンを長押ししてSIRIを呼び出し、「ボイプット」と話せばよい。
 下図ではあえてVOIPUT起動が目で確認できるようHDMI接続によるiPhone画像のミラーリングをさせているが、SIRIを呼び出すのは他のAVソースの再生中でも単に地図画面でも良い。iPhoneの画面を見なくてもSIRIが起動指示に対しピピと音を発してくれるので起動確認ができる(音が返ってこなければうまく言葉を認識していないので再度SIRIに命令する)。

ここでSIRIに対し「ボイプット」と発話

VOIPUT起動が確認できる

(2)音声検索開始
 [HOME]を長押ししてメニュー画面を表示させ、[VOICE]をタッチする。音声受付が開始される。

(3)認識検索例1 「ディズニーランド」と発話 

うまく音声認識している

検索結果表示

ピンを立てて候補を地図表示

(4)認識検索例2 「名古屋でケーキを食べたい」と発話 

これも認識良好

検索結果 ここで2番目をタッチ

地図表示

と、ここまでは順調なのだが、ここで音楽検索をすると・・・。

(5)認識検索例3 「サンダーバードを聴きたい」と発話

「を聴きたい」を誤認識
当然 検索不可

   それではと「サンダーバードで楽曲検索」と発話

正しく認識

検索結果表示 2番目をタッチ

無事に音楽再生

(6)認識検索例4 「中島みゆきを聴きたい」と発話 繰り返し

アーティスト名を誤認識
 
「です」が勝手について施設検索エラー
 このほか、「・・・置きたい」
などの誤認識多発
   ではと、「中島みゆきで楽曲検索」を発話 繰り返し

だめだ
 
ひどい
 
意味不明
   めげず何度か「中島みゆきで楽曲検索」の発話を繰り返すうちに、やっと・・・

正しく認識

検索結果表示 1番目タッチ

音楽再生

 このほか、「さだまさし」「やまがたすみこ」など収録しているアーティストで試しても結果は惨憺たる状況。楽曲検索はとても安心して使えない。思うに末尾に入れる「を聴きたい」「で楽曲検索」のマジックワードの設定がよくない気がする。たとえば「音楽検索」という言葉を先頭に入れて話すとかできればもっとよい結果が出るのではないかと思う。

 このほか、MDV-M907HDL では「○○県○○市○○町○○」といった住所検索、電話の相手先や音楽のタイトル名編集時の音声入力ができるが、こちらも誤認識は少なくない。SIRIやグーグルのAI並の認識能力を望みたいものだ。これらAIの認識結果がカーナビに入力できるとありがたい。ちなみに、クラリオンカーナビの音声認識ではスマホアプリ連携でグーグルアシスタントを利用しており、認識率が高そうで羨ましい。ただ、クラリオンは外資が入ってからは目立った新製品を出しておらず、音声入力による自宅エアコン制御、アイボの出迎えなどといった付加機能を年々追加しているのみである。


2 NR-MZ200の音声認識機能
 NR-MZ200 は、スマホ不要の単独(スタンドアロン)で動作する音声認識機能を持っていて、さらに、音声案内中でも声を聞き取る割り込み認識機能(バージイン発話)や搭乗者の会話から目的地を予想し検索の準備をして応答を速くする周辺検索アシスト機能などを備えている。
 音声認識は指定ボタン押しか「声で操作」というウェイクアップコマンドの発話で開始できる。目的地の検索の際は住所、施設名、ジャンルの組み合わせや電話番号を音声で伝えることができ、検索の結果が3つ表示され、それのひとつを選んだ後は「ここに行く」の発話でルート検索が始まる。下表はNR-MZ200の認識可能コマンドを整理したものである。

NR-MZ200の音声コマンド
種類音声コマンド
ジャンル検索 現在地周辺の"コンビニ"など[ジャンル] 目的地周辺の[ジャンル] ルート目的地周辺の[ジャンル] ○○県(市町村)の[ジャンル]
目的地指定 [住所] ○○県(市町村)のキーワード 電話番号検索  自宅へ帰る 
登録地 "会社","実家"など[登録地名] 特別登録地(数字1~3) 現在地登録 [登録地名称]へ行く
画面表示 スタンダード スタンダード2画面 高速略図 PsideP(地図とAVの2画面表示)
ルート選択 推奨ルート 有料優先ルート 一般優先ルート 省エネルート 別ルート探索 迂回ルート探索
ルート情報 全ルート ルート詳細情報 目的地までどのくらい 経由地までどのくらい 経由地(数字1~5)までどのくらい
ルート消去 ルート消去 経由地消去 経由地(数字1~5)消去 案内中断 案内再開 取り消し
日時 今何時 今日は何日

 さらに、その前に使っていた トヨタ NHZA-W60G ではこんなにたくさんのコマンドを持っていた。→ こちらを参照

 NR-MZ200の音声認識は精度的には少しおちゃめのところはあるが、ほぼ言うことを聞いてくれる。スマホ不要で使い勝手はこちらの方が優れているので、なんとか、MDV-M907HDLとの2台体制の中でうまく使い分けていきたい。