著者: YBB Capital 研究員 Zeke
序文
これまでの記事で、AI Meme の現状と AI Agent の将来の発展についての見解を何度も議論してきました。ただし、AI エージェント トラックの物語の急速な展開と劇的な進化には、まだ少し圧倒されます。 「ターミナル・オブ・トゥルース」がエージェント・サマーを開始してからわずか 2 か月で、AI と暗号通貨の組み合わせの物語はほぼ毎週変わりました。最近、市場の注目は技術的な話が大半を占める「フレームワーク」プロジェクトに集中し始めており、過去数週間だけでも、この分野では市場価値が 1 億以上、場合によっては 10 億を超えるダークホースが数多く生み出されています。このタイプのプロジェクトは、新しいアセット発行パラダイムも生み出しました。つまり、プロジェクトは Github コード ベースを使用してコインを発行し、フレームワークに基づいて構築されたエージェントはコインを再発行することもできます。フレームを下、エージェントを上とします。資産発行プラットフォームのように見えますが、実はAI時代特有の新興インフラモデルです。この新しい傾向をどのように検証すべきでしょうか?この記事では、フレームワークの紹介から始まり、独自の考え方と組み合わせて、Crypto にとって AI フレームワークが何を意味するのかを解釈します。
1. フレームワークとは何ですか?
定義上、AI フレームワークは、複雑な AI モデルの構築プロセスを簡素化するために、事前に構築されたモジュール、ライブラリ、ツールのセットを統合する低レベルの開発ツールまたはプラットフォームです。 これらのフレームワークには通常、データの処理、モデルのトレーニング、予測を行うための機能も含まれています。つまり、デスクトップOSのWindowsやLinux、モバイル端末のiOSやAndroidといった、AI時代のOSとしての枠組みとしてもシンプルに理解できます。各フレームワークには独自の長所と短所があり、開発者は特定のニーズに応じて自由に選択できます。
「AI フレームワーク」という用語は暗号分野ではまだ新興概念ですが、その起源から判断すると、AI フレームワークの開発プロセスは、Theano が誕生した 2010 年から実に 14 年近くかかっています。従来の AI サークルでは、Google の TensorFlow、Meta の Pytorch、Baidu の Fei Paddle、Byte の Magic Animate など、学術界と産業界の両方ですでに非常に成熟したフレームワークが選択可能です。これらのフレームワークにはそれぞれ、さまざまなシナリオに対して独自の利点があります。 。
現在 Crypto で出現しているフレームワーク プロジェクトは、この AI ブームの波の初期に多数のエージェントのニーズに基づいて構築され、その後他の Crypto トラックから派生して、最終的にはさまざまな細分化された AI フレームワークを形成しました。この文を拡張するために、現在主流のフレームワークをいくつか例として取り上げてみましょう。
1.1 エリザ
まず、ai16z の Eliza を例に挙げます。このフレームワークは、自律型 AI エージェントの作成、デプロイ、管理に特に使用されるマルチエージェント シミュレーション フレームワークです。プログラミング言語として TypeScript に基づいて開発する利点は、互換性が向上し、API 統合が容易になることです。
公式ドキュメントによると、Eliza がターゲットとする主なシナリオは、マルチプラットフォーム統合サポートなどのソーシャル メディアであり、このフレームワークはフル機能の Discord 統合を提供し、音声チャネル、X/Twitter プラットフォーム上の自動アカウント、Telegram 統合、およびダイレクトをサポートします。 API へのアクセス。メディア コンテンツ処理に関しては、PDF ドキュメントの読み取りと分析、リンク コンテンツの抽出と要約、音声の転写、ビデオ コンテンツの処理、画像の分析と説明、ダイアログの要約がサポートされています。
Eliza が現在サポートしているユースケースは、主に次の 4 つのカテゴリに分類されます。
AI アシスタント アプリケーション: カスタマー サポート エージェント、コミュニティ マネージャー、パーソナル アシスタント。
ソーシャルメディアの役割: 自動コンテンツ作成者、インタラクティブボット、ブランド代表。
ナレッジ ワーカー: 研究アシスタント、コンテンツ アナリスト、文書処理者。
インタラクティブなキャラクター: ロールプレイング キャラクター、教育カウンセラー、エンターテイメント ロボット。
Eliza は現在、次のモデルをサポートしています。
オープンソース モデルのローカル推論: Llama3、Qwen1.5、BERT など。
OpenAI の API を使用したクラウドベースの推論。
デフォルト構成は Nous Hermes Llama 3.1B です。
複雑なクエリのために Claude と統合します。
1.2 ゲーム
GAME (Generative Autonomous Multimodal Entities Framework) は、Virtual によって開始された自動生成および管理のためのマルチモーダル AI フレームワークです。その主なシーンは、ゲーム内のインテリジェントな NPC の設計です。このフレームワークのもう 1 つの特徴は、ローコードであることです。コードなしの基本ユーザーでも使用できます。試用版のインターフェイスによれば、ユーザーはパラメータを変更するだけでエージェントの設計に参加できます。
プロジェクトのアーキテクチャに関して、GAME のコア設計は複数のサブシステムを連携して使用するモジュール設計です。詳細なアーキテクチャは次のとおりです。
エージェント プロンプト インターフェイス: 開発者が AI フレームワークと対話するためのインターフェイス。このインターフェイスを通じて、開発者はセッションを初期化し、セッション ID、エージェント ID、ユーザー ID などのパラメータを指定できます。
認識サブシステム: 認識サブシステムは、入力情報を受信し、それを合成して、戦略計画エンジンに送信する責任を負います。また、ダイアログ処理モジュールからの応答も処理します。
戦略的計画エンジン: 戦略的計画エンジンはフレームワーク全体の中核部分であり、高レベルのプランナー (高レベル プランナー) と低レベルのポリシー (低レベル ポリシー) に分かれています。上位レベルのプランナーは長期的な目標と計画を策定し、下位レベルの戦略はそれらの計画を具体的な行動ステップに変換します。
ワールド コンテキスト: ワールド コンテキストには、環境情報、世界の状態、ゲームの状態などのデータが含まれており、この情報はエージェントが現在の状況を理解するのに役立ちます。
対話処理モジュール: 対話処理モジュールは、メッセージと応答を処理し、出力として対話または反応を生成できます。
オンチェーンウォレットオペレーター: オンチェーンウォレットオペレーターはブロックチェーン技術の応用シナリオに関与している可能性がありますが、具体的な機能は不明です。
学習モジュール: 学習モジュールはフィードバックから学習し、エージェントの知識ベースを更新します。
ワーキング メモリ: ワーキング メモリには、エージェントの最近のアクション、結果、現在の計画などの短期情報が保存されます。
長期記憶プロセッサ: 長期記憶プロセッサは、エージェントとその作業記憶に関する重要な情報を抽出し、重要度スコア、最新性、関連性などの要素に従ってランク付けする役割を果たします。
エージェント リポジトリ: エージェント リポジトリには、エージェントの目標、反省、経験、性格、その他の属性が保存されます。
アクション プランナー: アクション プランナーは、低レベルの戦略に基づいて特定のアクション プランを生成します。
計画実行者: 計画実行者は、アクション プランナーによって生成されたアクション プランを実行する責任があります。
ワークフロー: 開発者はエージェント プロンプト インターフェイスを通じてエージェントを開始し、認識サブシステムが入力を受信して戦略計画エンジンに渡します。戦略計画エンジンは、メモリ システム、ワールド コンテキスト、およびエージェント ライブラリからの情報を使用して、アクション プランを策定し、実行します。学習モジュールは、エージェントのアクションの結果を継続的に監視し、その結果に基づいてエージェントの動作を調整します。
アプリケーション シナリオ: 技術アーキテクチャ全体の観点から、このフレームワークは主に、仮想環境におけるエージェントの意思決定、フィードバック、認識、性格に焦点を当てています。ユースケースの観点からは、ゲームに加えて、メタバース。以下の仮想のリストを見ると、このフレームワークを使用して多数のプロジェクトが構築されていることがわかります。
1.3リグ
Rig は、大規模言語モデル (LLM) アプリケーションの開発を簡素化するために設計された、Rust で書かれたオープン ソース ツールです。開発者は、統一された操作インターフェイスを提供することで、複数の LLM サービス プロバイダー (OpenAI や Anthropic など) やさまざまなベクトル データベース (MongoDB や Neo4j など) と簡単に対話できるようになります。
主要な機能:
統合インターフェイス: どの LLM プロバイダーやベクター ストレージであっても、Rig は一貫したアクセス方法を提供し、統合作業の複雑さを大幅に軽減します。
モジュール式アーキテクチャ: このフレームワークは、「プロバイダー抽象化層」、「ベクター ストレージ インターフェイス」、「インテリジェント エージェント システム」などの主要な部分を含むモジュール式設計を採用し、システムの柔軟性と拡張性を保証します。
タイプセーフ: Rust の機能を利用してタイプセーフな埋め込み操作を実装し、コードの品質と実行時のセキュリティを確保します。
効率的なパフォーマンス: 非同期プログラミング モードをサポートし、同時処理機能を最適化します。組み込みのログ機能と監視機能は、メンテナンスとトラブルシューティングに役立ちます。
ワークフロー: ユーザー リクエストが Rig システムに入ると、最初に「プロバイダー抽象化レイヤー」を通過します。このレイヤーは、さまざまなプロバイダー間の違いを標準化し、エラー処理の一貫性を確保する役割を果たします。次に、コア層で、インテリジェント エージェントはさまざまなツールを呼び出したり、ベクトル ストアにクエリを実行して必要な情報を取得したりできます。最後に、検索拡張生成 (RAG) などの高度なメカニズムを通じて、システムはドキュメントの検索とコンテキストの理解を組み合わせて、ユーザーに返す前に正確で意味のある応答を生成できます。
アプリケーション シナリオ: リグは、迅速かつ正確な回答を必要とする質問応答システムの構築に適しているだけでなく、効率的なドキュメント検索ツール、コンテキスト認識型チャットボットや仮想アシスタントの作成にも使用でき、さらには既存のデータ パターンに基づいたコンテンツ作成のサポートにも使用できます。 . テキストまたはその他の形式のコンテンツを自動的に生成します。
1.4 ゼレパイ
ZerePy は、X (旧称 Twitter) プラットフォーム上で AI エージェントをデプロイおよび管理するプロセスを簡素化するように設計された Python ベースのオープンソース フレームワークです。これは Zerebro プロジェクトから生まれ、そのコア機能を継承していますが、よりモジュール化され、簡単に拡張できる方法で設計されています。 その目標は、開発者がパーソナライズされた AI エージェントを簡単に作成し、さまざまな自動化されたタスクやコンテンツ作成を X 上に実装できるようにすることです。
ZerePy は、ユーザーがデプロイされた AI エージェント「1」の管理と制御を容易にするコマンド ライン インターフェイス (CLI) を提供します。 そのコア アーキテクチャはモジュール設計に基づいており、開発者は次のようなさまざまな機能モジュールを柔軟に統合できます。
LLM の統合: ZerePy は OpenAI と Anthropic の大規模言語モデル (LLM) をサポートしているため、開発者はアプリケーション シナリオに最適なモデルを選択できます。 これにより、エージェントは高品質のテキスト コンテンツを生成できるようになります。
X プラットフォームの統合: フレームワークは X プラットフォームの API を直接統合し、エージェントが投稿、返信、いいね、転送などの操作を実行できるようにします。
モジュラー接続システム: このシステムにより、開発者は他のソーシャル プラットフォームやサービスのサポートを簡単に追加し、フレームワークの機能を拡張できます。
メモリ システム (将来の計画): 現在のバージョンは完全に実装されていない可能性がありますが、ZerePy の設計目標には、エージェントが以前のインタラクションとコンテキスト情報を記憶して、より一貫性のあるパーソナライズされたコンテンツを生成できるようにするメモリ システムの統合が含まれます。
ZerePy と a16z の Eliza プロジェクトはどちらも AI エージェントの構築と管理に特化していますが、アーキテクチャと目標は若干異なります。 Eliza はマルチエージェント シミュレーションとより広範な AI 研究に重点を置いているのに対し、ZerePy は特定のソーシャル プラットフォーム (X) に AI エージェントを展開するプロセスの簡素化に重点を置いており、実際のアプリケーションでの簡素化を優先しています。
2. BTC エコシステムのレプリカ
実際、開発経路の観点から言えば、AI Agent は 2023 年後半から 2024 年初頭の BTC エコシステムと多くの類似点があります。BTC エコシステムの開発経路は次のように簡単に要約できます。 BRC20 - Atomic/Rune およびその他のマルチプロトコル競争 -コア用のBTC L2-Babylon BTCFi。 AI エージェントは、成熟した従来の AI テクノロジー スタックに基づいてより迅速に開発されましたが、その全体的な開発パスには BTC エコシステムと多くの類似点があります。以下に簡単に要約します。GOAT/ACT-ソーシャル エージェント/分析 AI エージェントのようなフレームワーク。競争。傾向としては、エージェントの分散化とセキュリティに焦点を当てたインフラストラクチャ プロジェクトが、このフレームワークの流行の波を引き継ぎ、次の段階の主要テーマになる可能性が高くなります。
それでは、このトラックは均質化され、BTCエコシステムのようにバブルになるのでしょうか?私はそうではないと思います。第一に、AI エージェントの物語はスマート コントラクト チェーンの歴史を再現することではありません。第二に、既存の AI フレームワーク プロジェクトが技術的に強力であるか、PPT 段階または Ctrl C+ で停滞しているかどうかです。 Ctrl V、少なくともインフラストラクチャ開発に新しいアイデアを提供します。多くの記事では、AI フレームワークを資産発行プラットフォーム、エージェントを資産に喩えていますが、実際、Memecoin Launchpad や Inscription Protocol と比較すると、AI フレームワークは未来のパブリック チェーンに近いと個人的に感じています。そして、Agent は未来の Dapp に似ています。
今日の暗号通貨には、数千のパブリック チェーンと数万の Dapps があります。一般的なチェーンにはBTC、イーサリアム、その他様々な異種チェーンがあり、アプリケーションチェーンの形態はゲームチェーン、ストレージチェーン、Dexチェーンなどさらに多様です。パブリックチェーンはAIフレームワークに対応しており、実際、両者は見た目は非常に似ており、Dappもエージェントに非常によく対応します。
AI 時代の暗号は、今後の議論も EVM と異種チェーンの間の議論から、フレームワークをめぐる議論に移行する可能性が非常に高いです。この点、今後のAIインフラのプロジェクトもこれをベースにして立ち上がっていくと思うのですが、もう一つは、これをブロックチェーン上でやる意味は何なのか?
3.巻きの意味は何ですか?
ブロックチェーンを何と組み合わせても、最終的には「それは意味があるのか?」という疑問に直面することになります。昨年の記事で、私は GameFi が本末転倒であることと、Infra の高度な開発への移行を批判しました。AI に関する以前の記事でも、現段階では実用分野における AI x 暗号の組み合わせについては楽観的ではないと述べました。 。結局のところ、伝統的なプロジェクトにとって物語の推進力はますます弱くなっており、昨年通貨価格で好成績を収めたいくつかの伝統的なプロジェクトは、基本的に通貨価格と同等かそれを上回る能力を持っています。 AI は暗号通貨にどのような用途があるでしょうか?私が以前に考えたのは、実装意図に代わって動作するエージェント、メタバース、従業員としてのエージェントなど、比較的一般的だが需要の高いアイデアでした。ただし、これらの要件がチェーンに完全にリンクされている必要はなく、ビジネス ロジックの観点からループを閉じることはできません。前号で説明したエージェント ブラウザの実装意図により、実際にはデータのラベル付けや推論の計算能力などの要件を導き出すことができます。しかし、この 2 つの組み合わせはまだ十分に近くなく、計算能力の部分は依然として集中型の計算能力によって支配されています。多くの面で。
DeFi の成功について再考してください。DeFi が従来の金融からパイのシェアを奪える理由は、DeFi がアクセスしやすく、効率が高く、コストが低く、集中型のセキュリティを信頼する必要がないからです。この考え方に沿って考えると、エージェント チェーンをサポートする理由がいくつか考えられると思います。
1. エージェントのチェーン化により、使用コストを削減し、より高いアクセシビリティと選択性を実現できますか?最終的には、大手 Web2 企業に独占的に帰属する AI の「レンタル権」を一般ユーザーも参加できるようになります。
2. セキュリティ: エージェントの最も単純な定義によれば、エージェントと呼ばれる AI は、仮想世界または現実世界と対話できる必要があります。エージェントが現実または仮想ウォレットに介入できる場合、ブロックチェーン ベースのセキュリティ ソリューションになります。それは、厳格なニーズとみなすこともできます。
3. エージェントはブロックチェーンに特有の一連の金融ゲームプレイを実装できますか?たとえば、AMM の LP では、一般の人が自動マーケット メイキングに参加できます。たとえば、エージェントにはコンピューティング能力、データのラベル付けなどが必要で、ユーザーは楽観的であれば U の形で契約に投資します。あるいは、さまざまなアプリケーション シナリオのエージェントに基づいて、新しい金融ゲームプレイを形成することもできます。
4. DeFi は現在、完全な相互運用性を備えていません。ブロックチェーンと組み合わせたエージェントが透明性と追跡可能な推論を実現できれば、前の記事で述べた従来のインターネット大手が提供するエージェント ブラウザよりも魅力的になる可能性があります。
4. 創造性?
フレームワーク プロジェクトは、将来的には GPT ストアと同様の起業家的な機会も提供する予定です。現在、フレームワークを介してエージェントを公開することは一般ユーザーにとって依然として非常に複雑ですが、エージェントの構築プロセスを簡素化し、いくつかの複雑な機能の組み合わせを提供するフレームワークが将来的にも普及し、GPT ストアよりも興味深い Web3 クリエイティブ エコノミーが形成されると思います。 。
現在の GPT ストアは依然として伝統的な分野での実用性を優先しており、人気のあるアプリのほとんどは伝統的な Web2 企業によって作成されており、収益は作成者が独占的に所有しています。 OpenAIの公式説明によると、この戦略は米国の一部の優秀な開発者にのみ財政的支援と一定の補助金を提供するものである。
Web3 には需要の面でまだ多くの点を満たさなければなりません。また、経済システムは Web2 の巨人の不公平な政策をより公平なものにすることもできます。また、エージェントをより完璧にするためにコミュニティ経済を導入することも自然に可能です。 Agent のクリエイティブ エコノミーは一般の人々が参加する機会となり、将来の AI Meme は GOAT や Clanker でリリースされた Agent よりもはるかに賢く、より興味深いものになるでしょう。
参考記事:
2.Bybit: AI Rig Complex (ARC): AI エージェント フレームワーク
3. Deep Value Memetics:仮想通貨×AIの4大フレームワークの水平比較:導入状況、メリット・デメリット、成長性
5.バーチャル公文書