目が覚めると、多くの友人が、独立した思考、複雑なタスクの計画と実行、完全な結果の提供が可能な、世界で真に普遍的な AI エージェントであると主張する #manus を読むように勧めてくれました。とてもクールに聞こえますが、仕事を失うことに対する友人の多くの不安の声は別として、それは Web3 DeFai シーンの爆発的な成長に何をもたらすのでしょうか?私の考えは次のとおりです。
1) 約1か月前、OpenAIは同様の製品「Operator」を発売しました。AIはブラウザ内でレストランの予約、買い物、チケットの予約、テイクアウトの注文などのタスクを自律的に完了できます。ユーザーは視覚的に監視し、いつでも制御を引き継ぐことができます。
このエージェントの出現について議論する人は多くありません。なぜなら、これはツールによって呼び出される単一のモデル駆動型フレームワークだからです。ユーザーが重要な決定にはまだ介入が必要だと考えると、タスクを実行するためにエージェントに頼るという考えが失われます。
2) Manusは、履歴書の審査、株式の調査、不動産の購入など、より多くの応用シナリオがあることを除けば、表面上はそれほど違いがないように見えますが、実際には、その背後にあるフレームワークと実行システムの違いがあります。Manusは、マルチモーダルな大規模モデルによって駆動され、革新的なマルチ署名システムを採用しています。
つまり、AI は人間が行うアクションの PDCA サイクル (計画-実行-確認-改善) を模倣する必要があり、これは複数の大規模なモデルが連携して完了します。各モデルは特定のリンクに焦点を当てているため、タスクを実行する際の単一モデルの意思決定リスクを軽減できるだけでなく、実行効率も向上します。いわゆる「マルチ署名システム」は、実際にはマルチモデルコラボレーションのための意思決定検証メカニズムであり、複数の専門モデルからの共同確認を要求することで意思決定と実行の信頼性を保証します。
3) この比較により、manus の利点が明確に強調されます。ビデオ デモで示された一連の操作体験と組み合わせると、本当に素晴らしい体験が得られます。しかし客観的に言えば、Manus の Operator の反復的なイノベーションはまだ始まりに過ぎず、破壊的な革命のレベルにはまだ達していません。
重要な点は、実行するタスクの複雑さと、非統一的な標準ユーザー入力プロンプトが入力された後の大規模モデルのフォールト トレランスと配信結果の成功率の定義にあります。そうでなければ、この一連のイノベーションに従って、Web3 の DeFai シナリオをすぐに成熟した形で適用できるでしょうか?明らかに、これは不可能です。
たとえば、DeFai シナリオでは、エージェントがトランザクションの決定を実行するには、Oracle レイヤー エージェントがオンチェーン データを収集して検証し、データの統合と分析を実行し、オンチェーンの価格をリアルタイムで監視してトランザクションの機会を捉える必要があります。このプロセスは、リアルタイム分析に大きな課題をもたらします。1 秒前には有用であったトランザクションの機会は、Oracle の大規模モデルがトランザクション実行エージェントに送信された後には存在しなくなる可能性があります (裁定ウィンドウ)。
これは、実際には、実行の決定を行う際のこのタイプのマルチモーダル大規模モデルの最大の弱点、つまり、インターネットに接続し、チェーンにアクセスしてリアルタイム レベルのデータを取得および分析し、そこから取引機会を分析し、トランザクションをキャプチャする方法を明らかにしています。インターネット環境は実際にはそれほど悪くありません。多くの電子商取引サイトの注文価格はリアルタイムで変化しないため、マルチモーダルコラボレーション全体に大きな動的バランスの問題を引き起こすことは容易ではありません。チェーン上であれば、そのような課題はほとんど常に存在します。
4) したがって、全体として、マヌスの出現は確かにWeb2分野の友人たちの間で不安の波を引き起こすでしょう。結局のところ、多くの非常に反復的な事務作業や情報処理の仕事は、AIに置き換えられるリスクに直面する可能性があります。しかし、彼らには彼ら自身のことについて心配させてください。
DeFai アプリケーション シナリオを促進する上での web3 の役割を客観的に理解する必要があります。
私たちはそれが非常に重要であることを認めなければなりません。結局のところ、LLM OSとLess Structureが提案するよりインテリジェントな概念、特にマルチ署名システムは、Web3がDeFiとAIの組み合わせを拡大するための大きなインスピレーションを提供します。
これは、ほとんどの DeFai プロジェクトにおける大きな誤解を実際に修正するものです。AI エージェントの自律的な思考や意思決定などの複雑な目標を達成するために、大規模なモデルに依存しないでください。これは、金融のシナリオでは単純に実用的ではありません。
真の DeFai ビジョンを実現するには、単一の AI モデルの機能の上限、マルチモーダルインタラクティブコラボレーションの原子性保証、マルチモーダルシステムの統一されたリソーススケジューリングと制御、システムのフォールトトレランスとフォールト処理メカニズムなどの複雑な問題を解決する必要があります。
たとえば、Oracle レイヤー エージェントは、オンチェーン データを収集および分析し、価格を監視して効果的なデータ ソースを形成する役割を担います。
意思決定エージェントは、Oracle から提供されたデータに基づいてリスクを分析および評価し、一連の意思決定とアクション プランを策定します。
実行層エージェントは、意思決定層によって提供されたさまざまなソリューションに従って実行し、ガス料金の最適化、クロスチェーンのステータス、トランザクションのソートの競合など、実際の状況を考慮します。
この一連のエージェントが同時に強力になり、巨大なシステムフレームワークが確立された場合にのみ、真の DeFai 革命が開始されます。