DePINと組み込み知能の統合:技術的課題と将来の展望

はじめに: 2 月 27 日、Messari は「分散型物理 AI の構築」に関するポッドキャストを主催し、FrodoBot Lab の共同創設者である Michael Cho 氏を招待しました。彼らは、ロボット工学分野における分散型物理インフラストラクチャ ネットワーク (DePIN) の課題と機会について話し合いました。この分野はまだ初期段階ですが、大きな可能性を秘めており、現実世界での AI ロボットの動作方法を完全に変える可能性があります。しかし、大量のインターネット データに依存する従来の AI とは異なり、DePIN ロボット AI テクノロジーは、データ収集、ハードウェアの制限、評価のボトルネック、経済モデルの持続可能性など、より複雑な問題に直面しています。

今日の記事では、この議論の要点を分析し、DePIN ロボティクスが直面する問題、分散型ロボティクスの拡張における主な障壁は何か、そして DePIN が集中型アプローチよりも優れている理由について説明します。最後に、DePIN ロボティクスの将来を探り、DePIN ロボティクスにとって「ChatGPT の瞬間」が訪れるかどうかを確認します。

DePIN インテリジェントロボットのボトルネックはどこにありますか?

Michael Cho 氏が FrodoBot の開発に初めて取り組み始めたとき、最大の悩みの種はロボット工学技術のコストでした。市販のロボットの価格が法外に高いため、現実世界で AI アプリケーションを推進することが困難になっています。彼の最初の解決策は、既存のほとんどのプロジェクトよりも価格を抑えることを目指して、わずか 500 ドルの低コストの自律型ロボットを構築することでした。

しかし、マイケル氏と彼のチームが研究開発をさらに深めていくうちに、コストが本当のボトルネックではないことに気づきました。ロボット工学における分散型物理インフラストラクチャ ネットワーク (DePIN) の課題は、「高価かどうか」という問題よりもはるかに複雑です。 FrodoBotLab が進化を続けるにつれ、DePIN ロボット技術におけるいくつかのボトルネックが徐々に表面化してきました。大規模展開を実現するには、以下のボトルネックを克服する必要があります。

ボトルネック 1: データ

大量のインターネット データでトレーニングされる大規模な「オンライン」 AI モデルとは異なり、具現化された AI は知能を開発するために現実世界と対話する必要があります。問題は、現在世界にはこのような大規模なインフラがなく、このデータをどのように収集するかについて合意が得られていないことです。具現化された AI のデータ収集は、主に次の 3 つのカテゴリに分類できます。

▎1つ目のカテゴリーは、人間がロボットを手動で操作する際に生成されるデータである「人間操作データ」です。このデータは高品質で、ビデオ ストリームとアクション ラベル (人間が何を見て、どのように反応するか) をキャプチャします。これは、AI を訓練して人間の行動を模倣する最も効果的な方法ですが、欠点はコストがかかり、労力がかかることです。

▎2番目のカテゴリは合成データ(シミュレートされたデータ)であり、ロボットが起伏のある地形を歩くように訓練するなど、複雑な地形で移動するためのロボットの訓練に役立ち、一部の特殊な分野では非常に役立ちます。しかし、料理など変化に富んだ作業の場合、シミュレーション環境はあまりうまく機能しません。ロボットに卵を焼くように訓練することを想像してください。フライパンの種類、油の温度、部屋の状態の小さな変化が結果に影響し、仮想環境ですべてのシナリオをカバーすることは困難です。

▎3つ目のカテゴリーはビデオ学習で、現実世界のビデオを観察してAIモデルに学習させるというものです。このアプローチには可能性がありますが、インテリジェンスに必要な実際の物理的で直接的なインタラクティブなフィードバックが欠けています。

ボトルネック2: 自律性のレベル

マイケル氏は、初めて FrodoBot を実際の世界でテストしたとき、主にラストマイルの配達にロボットを使用したと述べました。データから判断すると、結果は実際にはかなり良好で、ロボットは配達タスクの 90% を正常に完了しました。しかし、現実の世界では、10% の失敗率は受け入れられません。 10回のうち1回配達に失敗するロボットは商品化できません。自動運転技術と同様に、無人運転車は 10,000 回の運転成功記録を持つことができますが、1 回の失敗で商業消費者の信頼を失ってしまいます。

したがって、ロボットが本当に役立つためには、成功率は 99.99% 近く、あるいはそれ以上である必要があります。しかし問題は、精度が 0.001% 向上するごとに、指数関数的に時間と労力が必要になることです。多くの人は、この最後のステップの難しさを過小評価しています。

マイケル氏は、2015年にグーグルの自動運転車のプロトタイプに座ったとき、完全自動運転がすぐそこまで来ていると感じたと回想する。 10年経った今でも、レベル5の完全自律走行をいつ達成するかについては議論が続いています。ロボット工学の進歩は直線的ではなく指数関数的であり、一歩前進するごとに難易度が劇的に増大します。この最後の 1% の精度を達成するには、何年も、あるいは何十年もかかる可能性があります。

ボトルネック3: ハードウェア: AIだけではロボットの問題を解決できない

言い換えれば、AI モデルが強力であっても、既存のロボット ハードウェアでは真の自律性を実現する準備がまだ整っていません。たとえば、ハードウェアで最も見落とされがちな問題は触覚センサーの欠如です。Meta AI の研究など、現在の最善の技術でも、人間の指先の感度にはほど遠いのです。人間は視覚と触覚を頼りに世界とやりとりしますが、ロボットは質感、グリップ、圧力のフィードバックについてほとんど知りません。

遮蔽の問題もあります。物体が部分的に遮られていると、ロボットがそれを認識して操作することが難しくなります。人間は物体の全体像を見ることはできなくても、直感的に理解することができます。

認識の問題に加えて、ロボットアクチュエータ自体にも欠陥があります。ほとんどのヒューマノイドロボットはアクチュエータを関節に直接配置しているため、かさばり、潜在的に危険です。対照的に、人間の腱の構造はよりスムーズで安全な動きを可能にします。これが、既存のヒューマノイドロボットが硬直して柔軟性に欠けているように見える理由です。 Apptronik のような企業は、より多くの生物にヒントを得たアクチュエータの設計を開発していますが、これらの革新が成熟するには時間がかかるでしょう。

ボトルネック 4: ハードウェアの拡張がなぜ難しいのか?

コンピューティング能力のみに依存する従来の AI モデルとは異なり、インテリジェント ロボット テクノロジーを実装するには、現実世界に物理デバイスを展開する必要があります。これは大きな資本上の課題をもたらします。ロボットの製造には費用がかかり、大規模な実験を行うことができるのは最も裕福な企業だけだ。最も効率的なヒューマノイドロボットでさえ、今では数万ドルの費用がかかり、大規模な導入はまったく現実的ではありません。

ボトルネック5: 評価の有効性

これは「目に見えない」ボトルネックです。考えてみてください。ChatGPT のような大規模なオンライン AI モデルは、ほぼ瞬時に機能をテストできます。新しい言語モデルがリリースされると、世界中の研究者や一般ユーザーは、基本的に数時間以内にそのパフォーマンスに関する結論を導き出すことができます。しかし、物理的な AI を評価するには現実世界での展開が必要であり、これには時間がかかります。

テスラの完全自動運転(FSD)ソフトウェアは良い例です。テスラが事故なく100万マイル走行した場合、それは本当にレベル5の自動運転を達成したことを意味するのでしょうか? 1000万マイルはどうですか?ロボットの知能の問題は、それを検証する唯一の方法が、最終的にどこで失敗するかを確認することであり、それは大規模で長期的なリアルタイム展開を意味します。

ボトルネック6: 人材

過小評価されているもう一つの課題は、ロボット AI の開発には人間の労働が依然として不可欠であるということです。 AIだけでは不十分です。ロボットには、トレーニング データを提供する人間のオペレーター、ロボットを稼働させ続けるためのメンテナンス チーム、そして AI モデルを継続的に最適化するための重要な研究者/開発者が必要です。クラウドでトレーニングできる AI モデルとは異なり、ロボットには継続的な人間の介入が必要であり、これは DePIN が取り組む必要があった大きな課題でした。

将来: ロボット工学における ChatGPT の瞬間はいつ来るのでしょうか?

ボットにとっての ChatGPT の時代が到来すると考える人もいます。マイケルはやや懐疑的だった。彼は、ハードウェア、データ、評価の課題を考えると、汎用ロボット AI が大規模に導入されるまでにはまだまだ時間がかかると考えています。それでも、DePIN のロボット工学技術の進歩は希望を与えてくれます。ロボット技術の開発は分散化されるべきであり、少数の大企業によって管理されるべきではない。分散型ネットワークの規模と調整により、資本負担を分散できます。大企業が何千台ものロボットを購入することに頼るのではなく、貢献できる個人を共有ネットワークに組み込むことが可能です。

たとえば、まず、DePIN はデータの収集と評価を高速化します。単一の企業が限られた数のロボットを展開してデータを収集するのを待つ代わりに、分散型ネットワークを並行して実行し、はるかに大規模なデータを収集できます。たとえば、最近アブダビで行われた AI 対人間のロボット競技会では、DeepMind やテキサス大学オースティン校などの研究機関の研究者が、人間のプレイヤーを相手に AI モデルをテストしました。人間がまだ優位に立っているとはいえ、研究者たちは現実世界のロボットとのやりとりから収集した独自のデータセットに興奮している。これは、ロボットのさまざまなコンポーネントを接続するサブネットワークの必要性を強調しています。研究コミュニティの熱意は、完全な自律性が長期的な目標のままであっても、DePIN ロボットがデータの収集とトレーニングから実際の展開と検証まで具体的な価値を実証していることを示しています。

一方、AI を活用してチップや材料工学を最適化するなど、AI 主導のハードウェア設計の改善により、タイムラインを大幅に短縮できる可能性があります。具体的な例としては、FrodoBot Lab が他の機関と協力して NVIDIA H100 GPU の箱 2 つを確保したことがあります。箱 1 つに H100 チップが 8 個入っています。これにより、研究者は、ロボットの展開から収集された現実世界のデータに基づいて AI モデルを処理および最適化するために必要な計算能力を獲得できます。このようなコンピューティング リソースがなければ、最も価値のあるデータセットであっても十分に活用することはできません。ロボティクス ネットワークでは、DePIN 分散コンピューティング インフラストラクチャへのアクセスを通じて、世界中の研究者が資本集約型の GPU 所有権に制限されることなくモデルをトレーニングおよび評価できることがわかります。 DePIN がデータとハードウェアの進歩をクラウドソーシングすることに成功すれば、ロボット工学の未来は予想よりも早く到来するかもしれません。

さらに、ミームトークンを持つ旅行インフルエンサーボットである Sam のような AI エージェントは、分散型ロボットネットワークの新しい収益化モデルを実証します。 Sam は自律的に動作し、複数の都市で 24 時間 365 日ライブ放送しており、そのミーム トークンの価値は高まっています。このモデルは、DEPIN を搭載したスマート ロボットが、分散型所有権とトークン インセンティブを通じて独自の財務を維持する方法を示しています。将来的には、これらの AI エージェントはトークンを使用して人間のオペレーターに支援料を支払ったり、追加のロボット資産をレンタルしたり、現実世界のタスクに入札したりすることもでき、AI 開発と DePIN 参加者の両方に利益をもたらす経済サイクルが生まれます。

最終まとめ

ロボット AI の開発には、アルゴリズムだけでなく、ハードウェアのアップグレード、データの蓄積、資金援助、人間の参加も必要です。これまで、ロボット産業の発展はコストの高さと大企業の優位性によって制限され、イノベーションのペースが妨げられてきました。 DePINロボットネットワークの構築は、分散型ネットワークの力により、ロボットのデータ収集、コンピューティングリソース、資本投資を世界規模で調整できることを意味し、AIトレーニングとハードウェアの最適化を加速するだけでなく、開発の敷居を下げ、より多くの研究者、起業家、個人ユーザーが参加できるようになります。また、ロボット産業が少数のテクノロジー大手に依存するのではなく、グローバルコミュニティの推進により、真にオープンで持続可能なテクノロジーエコシステムへと移行することを期待しています。