AI:Google home miniで 音声解析に触れてみよう

AIについて勉強しようにも、学習ハードルが高く、テストデータも既存のものを使って検証してみるのが精いっぱい。
私生活で意識してAIを活用しているという方は少ないと思います。

今回は家電量販店で良くセールしているコレ、「Google home」を使って、お手軽にAIを体感してみたいと思います。

●Google homeの仕組み

Google homeは一体どのような仕組みで動いているのでしょうか?非常に簡素に図示すると以下のようになります。

それではAIは上図のどこに使われているのでしょうか?
答えは「音声認識」を行っている「言語解析サービス」の部分になります。
※「言語解析サービス」は本説明のために便宜的に付けた名称であり、正式名称ではありません。
「言語解析サービス」で音声データ、音の波をコンピュータが識別しやすい形に
変換、
特徴となる部分を抜き出し、AIがこれまで学習してきたデータと似ているものを探し出してテキストデータへと変換します。

●音声認識させてみよう

Google homeが本当に音声を聞き取れているか、アプリの中身を見て確認してみましょう。

1.Actions on Googleでプロジェクトを建てる

音声からテキストデータを受け取る先として、Actions on Googleにプロジェクトを作ります。

https://console.actions.google.com/u/0/にアクセスし、「New project」をクリック。

プロジェクト名を任意に、言語指定を日本語に、国を日本に設定して、プロジェクト作成します。

テンプレートから「Conversation」を選択して、プロジェクト作成完了です。

2.エコーバック用のアプリ作成

Actions on Googleが受け取った言葉をごにょごにょする部分の設定を行います。スマートホーム用のアプリ起動用の言葉を決めるため、「Decide~」をクリック。

今回は「ティーエスワン音声認識」を設定、Saveボタンを押して変更を設定後、Actionsをクリック。

Dialogflow(形態素分析など、文章を理解するためのサービスです。今回は受け取ったデータの出力に使います)と連携します。
※次ページ移行でDialogflowとGoogleアカウントの紐付けを求められます。問題がなければ次へ

言語設定を日本語にしてCREATEクリック。音声をDialogflowへ連携させる設定が完了しました!

左サイドバーより、「Integrations」のタブをクリックし、テストモードでアプリを起動しましょう。
これでGoogle homeからDialogflowへ音声データを連携させる設定はすべて完了です!

3.話しかけてみた

「ティーエスワン音声認識につないで」と話しかけることで、今回作った専用アプリとGoogle homeが連携されます。
DialogflowのHistoryから、Actions on Googleからどんなデータが連携されたのか、見ることができます。

「ティーエスワンサイコー」と話しかけてみました。AIが「ティーエスワン」部分を「PS1」と認識したり、「TS1」と認識したりしていますね。

●まとめ

今回は「Google home」を通して、音声データを文字列化することができました。

音声データをファイル出力へ出力したり、別システムへリクエストを投げたりできる…
色々なことができそうじゃありませんか!?それはまた次の機会で。