M5Stack Module LLMの簡単なアプリケーションとして音声制御赤外線リモコンを作ってみました。私が使っているM5CoreS3 IoT開発キットではPORT.A/B/Cが装備されていて、各種Groveモジュールが接続できます。このPORTを使わない手はありません。今回はM5GOに付属していたIRユニット(U002)を活用してみます。

赤外線リモコンを作る
私の部屋の明かりはPanasonic製でリモコン制御ができます。まずはLLMを使わずにM5CoreS3だけでIRユニットを制御し赤外線リモコンとして動かしてみます。IRユニットには赤外線の送信部と受信部が組み込まれています。

これをM5CoreS3のPORT.Bに接続します。赤外線LEDが目的物に向くようにしてください。

このIRユニットを制御するためにArduinoで利用できるライブラリとしてIRremoteESP8266がありますので、ライブラリマネージャーからインストールします。

サンプルプログラムにあるリモコン信号を受信してダンプしてくれるアプリケーションIRrecvDumpV2を動かしてリモコンの情報を確認します。IRユニットはM5CoreS3のPORT.Bに接続しますが、これに対応するGPIO番号にプログラムを書き換える必要があります。M5Core2ではこの値が異なるので以下にまとめておきます。
| Model | kRecvPin | kIrLed |
|---|---|---|
| M5CoreS3 | 8 | 9 |
| M5Core2 | 36 | 26 |
M5CoreS3の場合はIRrecvDumpV2を以下のように書き換えます。
| |
これを動かして、リモコンを操作すると赤外線信号の情報がシリアルモニタに表示されます。これをメモしておきます。私の環境では以下のようになりました。
リモコンで消灯ボタンを押したとき
| |
リモコンで点灯ボタンを押したとき
| |
これらの情報を参考にして簡単な送信プログラムを作成し、明かりをON/OFFできるか試してみます。
| |
うまく動作すればM5CoreS3から部屋の明かりを制御することができます。IRsendクラスの使い方はIRremoteESP8266のドキュメントを参考にしてください。メーカーごとにメソッドや引数が異なるので注意してください。
音声認識と音声合成にリモコン機能を組み込む
Module LLMのサンプルプログラムとしてウェイクアップワードをトリガに音声認識を行うKWS(Key Word Spoting)_ASR(Automated Speech Recognition)と音声合成を行うTTS(Text To Speech)が提供されています。

これを参考にしてリモコンプログラムを作成しました。ソースコードはGitHubにあげておきました。
https://github.com/kanpapa/M5Stack_LLM/blob/main/Arduino/M5_KWS_ASR_IR_TTS/M5_KWS_ASR_IR_TTS.ino
音声認識リモコンを動かしてみる
残念ながら私の英語の発音ではうまく認識してくれないので、Google翻訳の発音機能を使用して動作させてみます。
仕様としては、最初にwake upキーワードのHELLOを認識し、その直後の音声で"good morning"でライトを点灯し、“good night"でライトを消灯するようにしています。
動画のようにうまく動作しました。もちろんローカルLLMで動作していますので、ネットワークに接続する必要もありません。
まとめ
様々な機器をM5Stackに接続している場合に、Module LLMを応用することで面白い使い方ができそうです。今回はLLM(Large Language Model)による推論は使っていませんが、環境センサーで部屋の状況をモニタリングした結果をLLMに渡して最適な状態を推論し、適切なリモコンを動作させることで、AI制御で快適な部屋にできるかもしれません。
ただ私の英語はなかなか聞き取ってくれないので、日本語対応が進めばより使い勝手が良くなると思います。
