著者: YBB Capital 研究員 Zeke
1. 注目から始まる新しいものへの好みと古いものへの嫌悪感
過去 1 年にわたり、アプリケーション層の物語がインフラストラクチャの爆発的なスピードに対応できなかったため、暗号化の分野は徐々に注目のリソースを争うゲームになってきました。 Silly Dragon から Goat、Pump.fun から Clanker まで、注目を集める戦いはますます複雑になってきています。最もありきたりな人目を引く実現から始まり、注目を求める需要者と供給者が統合されるプラットフォーム モデルにすぐに変化し、その後、シリコンベースの生物が新しいコンテンツ プロバイダーになりました。ミームコインのさまざまな奇妙なキャリアの中で、ついに個人投資家とVCが合意に達することを可能にする存在、それがAIエージェントです。
注目というのは究極的にはゼロサムゲームですが、確かに憶測が物事を乱暴に動かす可能性があります。 UNIに関する記事では、ブロックチェーンの最後の黄金時代の始まりを振り返りましたが、DeFiの急速な成長の理由は、数千から数十のさまざまなマイニングプールで実行されたCompound Financeによって始まったLPマイニング時代に由来しています。何千ものApyが出入りするのは、当時のチェーン上での最も原始的なゲーム方法でしたが、最終的な状況はさまざまなマイニングプールが崩壊し、羽毛で覆われたということでした。しかし、金鉱業者の狂気の流入により、確かにブロックチェーンに前例のない流動性が残され、DeFiはついに純粋な投機から脱却し、支払い、取引、アービトラージ、ステーキングなどのあらゆる面でユーザーのニーズを満たす成熟した軌道を形成しました。経済的ニーズ。 AI Agent も現段階でこの野蛮な段階を経ています。私たちが模索しているのは、Crypto が AI をどのようにより適切に統合し、最終的にアプリケーション層を新たな高みに押し上げることができるかということです。
2. インテリジェントエージェントはどのようにして自律的になるのでしょうか?
前回の記事では、AI Meme: Truth Terminal の起源と AI Agent の将来性について簡単に紹介しましたが、この記事ではまず AI Agent 自体に焦点を当てます。
AI エージェントの定義から始めましょう。エージェントは、AI の分野では古い用語ですが、定義が明確ではありません。主に自律性を重視しています。つまり、環境を認識して反映できる AI はすべてエージェントと呼ぶことができます。今日の定義では、AI エージェントはインテリジェント エージェントに近く、人間の意思決定を模倣する大規模なモデルのシステムをセットアップすることです。このシステムは、学術界では、AGI (汎用人工知能) を実現する最も有望な方法とみなされています。 )。
初期の GPT バージョンでは、大きなモデルが非常に人間に似ていることをはっきりと認識できましたが、多くの複雑な質問に答えるとき、大きなモデルはいくつかの適当な答えしか与えることができませんでした。本質的な理由は、当時の大規模なモデルが因果関係ではなく確率に基づいていたことです。第二に、人間のツール、記憶、計画などの能力が欠けており、AI エージェントがこれらの欠点を補うことができます。つまり、式でまとめると、AI Agent(インテリジェントエージェント)=LLM(大規模モデル)+Planning(計画)+Memory(記憶)+Tools(ツール)となります。
プロンプトの言葉(プロンプト)に基づく大きなモデルは、より静的な人間に似ており、それを入力したときにのみ生き返ります。インテリジェント エージェントのターゲットは、より現実的な人間です。現在のサークル内のインテリジェント エージェントは、主に Meta のオープン ソース Llama 70b または 405b バージョンに基づいて微調整されたモデルです (この 2 つは異なるパラメータを持っています)。API アクセス ツールを記憶して使用する機能がありますが、人間の助けや入力が必要な場合があります。他の側面(他のエージェントとの交流や協力を含む)から、今日でもサークル内の主要なエージェントが KOL の形でソーシャル ネットワーク上に存在していることがわかります。インテリジェント エージェントをより人間らしくするには、計画とアクションの能力にアクセスする必要があり、計画におけるサブ思考の連鎖が特に重要です。
3. 思考の連鎖 (CoT)
思考連鎖 (CoT) の概念は、2022 年に Google によって出版された論文「Chain-of-Thought Prompting Elicits Reasoning in Large Language Models」で初めて登場しました。この論文では、一連の中間言語モデルを生成することでモデルを強化できると指摘されています。推論ステップ。推論機能は、モデルが複雑な問題をよりよく理解し、解決するのに役立ちます。
一般的な CoT プロンプトには、明確な指示、タスクの説明、理論的根拠またはタスク解決の原則的な例をサポートする論理的根拠、および具体的な解決策のデモンストレーションの 3 つの部分が含まれています。この構造化されたアプローチは、モデルがタスクの要件を理解し、論理的推論を通じて徐々にそれにアプローチするのに役立ちます。 . に答えることで、問題解決の効率と精度が向上します。 CoT は、数学的な問題解決、プロジェクト レポートの作成、その他の単純なタスクなど、詳細な分析と複数のステップから成る推論を必要とするタスクに特に適しています。CoT は明らかな利点をもたらさないかもしれませんが、複雑なタスクの場合はパフォーマンスを大幅に向上させることができます。段階的な解決戦略を通じてモデルのエラー率を削減し、タスク完了の品質を向上させます。
AI エージェントを構築する際、CoT は重要な役割を果たします。エージェントは受信した情報を理解し、それに基づいて合理的な決定を下す必要があります。CoT は、エージェントが入力された情報を効果的に処理および分析するのに役立ちます。これは、この方法だけでなく、分析結果を具体的な行動指針に変換するための順序立てた考え方を提供します。エージェントの意思決定能力の信頼性と効率性が向上し、意思決定プロセスの透明性も高まります。 CoT は、タスクを複数の小さなステップに分解することで、エージェントが各意思決定ポイントを慎重に検討し、情報の過負荷によって引き起こされる誤った決定を減らすのに役立ち、エージェントの意思決定プロセスをより正確にします。 、ユーザーはエージェントの意思決定の根拠を理解しやすくなります。 CoT は、環境と対話する際に、エージェントが継続的に新しい情報を学習し、行動戦略を調整できるようにします。
効果的な戦略として、CoT は大規模な言語モデルの推論能力を向上させるだけでなく、よりインテリジェントで信頼性の高い AI エージェントを構築する上でも重要な役割を果たします。 CoT を活用することで、研究者や開発者は、複雑な環境により適応し、高度な自律性を備えたインテリジェント システムを作成できます。 CoT は、実際のアプリケーション、特に複雑なタスクを処理する際に、タスクを一連の小さなステップに分解することで、タスク解決の精度が向上するだけでなく、モデルの解釈可能性と制御可能性も向上します。 。問題解決に対するこの段階的なアプローチにより、複雑なタスクに直面したときに情報が多すぎたり複雑すぎたりすることによって引き起こされる誤った決定を大幅に減らすことができます。同時に、このアプローチにより、ソリューション全体のトレーサビリティと検証可能性も向上します。
CoT の中核となる機能は、計画、行動、観察を組み合わせて、推論と行動の間のギャップを埋めることです。この思考モードにより、AI エージェントは遭遇する可能性のある異常な状況を予測する際に効果的な対策を立てることができ、外部環境と対話しながら新しい情報を蓄積し、事前に設定された予測を検証し、新しい推論の根拠を提供することができます。 CoT は、AI エージェントが複雑な環境で効率的な作業効率を維持できるようにする、強力な精度と安定性を備えたエンジンのようなものです。
4. 疑似欲求を修正する
Crypto は AI テクノロジー スタックのどの側面と統合されますか?昨年の記事では、コンピューティング能力とデータの分散化が中小企業や個人の開発者がコストを節約するための重要なステップであると信じていましたが、Coinbase によってまとめられた今年の Crypto x AI のセグメント化されたトラックでは、より詳細な区分が見られました。
(1) コンピューティング層 (AI 開発者にグラフィックス プロセッシング ユニット (GPU) リソースを提供することに重点を置いたネットワークを指します)。
(2) データ層 (AI データ パイプラインの分散アクセス、オーケストレーション、検証をサポートするネットワークを指します)。
(3) ミドルウェア層 (AI モデルまたはエージェントの開発、展開、ホスティングをサポートするプラットフォームまたはネットワークを指します)。
(4) アプリケーション層 (B2B または B2C を問わず、オンチェーン AI メカニズムを利用するユーザー指向の製品を指します)。
これら 4 つの部門層にはそれぞれ壮大なビジョンがあり、その目標はすべてシリコンバレーの巨大企業がインターネットを支配する次の時代と戦うことです。私が昨年述べたように、シリコンバレーの巨大企業によるコンピューティング能力とデータの独占的管理を本当に受け入れる必要があるのでしょうか?彼らの独占下にあるクローズドソースの大きなモデルは、その内部がブラックボックスです。科学は今日の人類の最も人気のある宗教です。将来、大きなモデルによって答えられるすべての文が、多くの人々によって真実とみなされるでしょう。真実はどうすべきか?シリコンバレーの巨人のビジョンによれば、インテリジェントエージェントは最終的に、財布で支払う権利や端末を使用する権利など、想像を超えた権限を持つようになるでしょう。人々に悪意がないことを保証するにはどうすればよいでしょうか。
分散化が唯一の答えですが、場合によっては、これらの壮大なビジョンにどれだけの買い手がいるのかを総合的に合理的に検討する必要があるでしょうか?以前は、商業的な閉ループを考慮せずに、理想化によって引き起こされたエラーを補うためにトークンを使用できました。今日の状況は非常に深刻であり、Crypto x AI は実際の状況に基づいて設計する必要があります。たとえば、コンピューティング パワー レイヤーがパフォーマンスの低下と不安定性に苦しんでいるときに、供給の両端のバランスをどのようにとるかです。集中型クラウドの競争力に匹敵する。データ レイヤー プロジェクトには実際のユーザーが何人いますか? 提供されたデータの実際の有効性を確認するにはどうすればよいですか? このデータを必要とする顧客はどのような人ですか?他の 2 つのレベルにも同じことが当てはまります。この時代では、一見正しいと思われる疑似ニーズはそれほど必要ありません。
5.ミームはSocialFiを使い果たしました
最初の段落で述べたように、Meme は Web3 に準拠した SocialFi フォームを超高速で開発しました。 Friend.tech は、このラウンドのソーシャル アプリケーションを立ち上げた最初の Dapp でしたが、熱心なトークン設計に敗れました。 Pump.fun は、トークンやルールのない純粋なプラットフォームの実現可能性を検証しました。 Pump.fun では、ミームの投稿、ライブブロードキャスト、メッセージの送信、取引がすべて無料で行えます。これは、課金対象が異なることと、Pupm.fun のゲームプレイがより Web3 であることを除いて、今日の YouTube や Instagram などのソーシャル メディアのアテンション エコノミー モデルと基本的に一致しています。
Base の Clanker はすべてのマスターです。エコロジーによって個人的に管理されている統合エコロジーのおかげで、Base は完全な内部閉ループを形成するための補助として独自のソーシャル Dapp を持っています。インテリジェント エージェントである Meme は、Meme Coin の 2.0 形式です。人々は常に新しいアイデアを探しており、トレンドから判断すると、Pump.fun がそのトレンドの最前線に立つのは時間の問題です。ケイ素ベースの生物のランダムなアイデアが、炭素ベースの生物の低俗なミームに取って代わります。
Base については何度も言及していますが、その内容は毎回異なります。タイムラインから見ると、Base が先手になったことはありませんが、常に勝者です。
6. インテリジェントエージェントには他に何があるのでしょうか?
実用的な観点から見ると、従来の AI 分野におけるエージェントの構築から判断すると、エージェントが分散化されることは将来的に長期間にわたって不可能であり、単純な分散化と推論プロセスのオープンソースによっては解決できません。問題は、Web2 コンテンツにアクセスするにはさまざまな API にアクセスする必要があり、そのランニング コストが非常に高価であることです。思考チェーンの設計とマルチエージェントのコラボレーションは、通常、依然として人間を媒体として依存しています。おそらくUNIのような適切な統合形態が現れるまで、私たちは長い移行期間を経ることになるでしょう。しかし、前回の記事と同様に、私たちの業界における Cex の存在と同じように、インテリジェント エージェントは業界に大きな影響を与えるだろうと今でも考えており、これは間違っていますが重要です。
スタンフォードとマイクロソフトが先月発行した記事「AI エージェントの概要」では、医療業界、インテリジェント マシン、仮想世界におけるエージェントのアプリケーションについて詳しく説明されており、この記事の付録では、多くの GPT-4V がエージェント A テストに参加しています。トップ 3A ゲームの開発の場合。
分散化との組み合わせの速度についてあまり主張する必要はありません。私は、インテリジェント エージェントが完了できる最初のパズルがボトムアップでの能力と速度であることを願っています。必要な物語の廃墟と空のメタバースがたくさんあります。適切な段階で、次期UNIとしてどうするか検討していきます。
参考文献
大型モデルの「創発」の思考連鎖とはどのような能力なのか?作者:脳極体
エージェントを 1 つの記事で理解すると、大規模モデルの次の目的地になります。著者: LinguaMind