D-Robotics RDK X5のAI機能を試してみた

D-Robotics RDK

前回はすでに用意されているロボット用のアプリケーションを使用してルンバを動かしてみました。他にもロボットで使えそうなサンプルアプリケーションが用意されています。ここではロボットの目や声や思考を実現できそうなものを試してみます。

カメラ画像認識

5.2.6 模型推理 | RDK DOC
功能介绍

MIPIカメラで読み込んだ画像に対して、人体検出、年齢認識、顔のキーポイント検出、手のキーポイント検出、手のジェスチャー認識を行った推論結果をWeb経由で表示してくれます。

実際に動作させたときの動画です。手のキーポイントを検出できています。

これによりロボットの目の役割が実現できそうです。

テキスト読み上げ

5.2.8 文本转语音 | RDK DOC
功能介绍

テキストデータをトピックとして与えることでそれを読み上げてくれるサンプルプログラムです。実行したところ私の環境ではうまく動かずエラーとなってしまいます。

RDK X5だけでなく、RDK X3でも同様の状態なのでissueをあげておきました。ロボットが応答を返すのに使いたい機能なのでぜひ動かしたいのですが、一旦issueの対応を見守ることにします。

大規模言語モデル

5.2.9 大语言模型 | RDK DOC
功能介绍

こちらは残念ながらサポートモデルがRDK X3のみとなっていて、RDK X5はサポートされていません。ダメもとで試したところ、以下のようなエラーになってしまいました。

ただし、次の章にある大規模言語モデルの機能を発展させた視覚言語モデルがロボットでは有効だと思われます。

視覚言語モデル

5.2.10 视觉语言模型 | RDK DOC
功能介绍

画像データを与えることで、その画像が何であるかを推論してくれます。デモプログラムを動かしたところパンダの画像に対してパンダの説明を返してくれました。

この写真はジャイアントパンダです。ジャイアントパンダは、主に中国の四川省、陝西省、甘粛省に生息する、丸顔の大型哺乳類です。写真のジャイアントパンダは地面に座っており、竹と竹の葉に囲まれており、周囲の環境はまるで自然の竹林のようです。白黒の体と丸顔はジャイアントパンダの特徴的な姿で、竹を食べることに集中しています。
  :

試しにRDK X5の画像を与えてみたところ、次のような答えが返ってきました。

これは電子機器の写真です。写真からわかるように、これは電子機器の筐体で、回路基板、コンデンサ、抵抗器など、様々な電子部品で覆われています。機器の上部には大きなディスプレイ画面があり、その下にはUSBポートやHDMIポートなどの複数の接続ポートとインターフェースがあります。機器の下部にも複数のスロットとインターフェースがあり、他の機器との接続やデータの転送に使用できます。機器全体の設計は比較的複雑で、部品が密集していることから、その複雑な構造と機能が見て取れます。

なかなか細かいところまで答えが返ってくるのでびっくりです。

放熱について

RDK X5でCPU/BPU/DDR/GPUの各温度を表示するにはhrut_somstatusコマンドを使います。同時にクロック等も表示されます。

ドキュメントによると動作温度95度を超えると自動的にスピードが落ちるようです。これまでの実験ではまだそこまでの温度には至っていませんが、気になったのでRaspberry Pi 4用のヒートシンクをつけてみました。

写真のようにほぼぴったりのサイズです。別途購入した専用ケースを使用すれば放熱も安心なのですが、今後のTurtlebot3への取り付けを考えると、なるべく基板のままで使用したいのです。

ヒートシンクをつけた状態で、手の動きを検知するプログラムを動かしたところ70度近辺で落ち着いているようです。これであればヒートシンクだけでTurtlebot3にも取り付けできそうです。

アプリケーションを終了すると徐々に低下していきます。

アイドルの時は60度近辺で落ち着くようです。

まとめ

次回はRDK X5をTurtlebot3に取り付けて、OriginBot にどこまで近づけるかを試してみます。

タイトルとURLをコピーしました