作者: Kevin, the Researcher at BlockBooster

AI Agent 框架作為產業發展的關鍵拼圖,可能蘊藏著推動科技落地與生態成熟的雙重潛力。市場中熱議的架構有:Eliza, Rig, Swarms, ZerePy等等。這些框架透過Github Repo吸引開發者,建立聲望。以「庫」發幣的形式讓這些框架,和光同時具備波和粒子的特質類似,Agent框架同時具備嚴肅外部性和Memecoin的特性。本文將重點放在解讀框架的「波粒二象性」以及Agent框架為何能成為最後一角。

Agent框架帶來的外部性能夠在泡沫消退後留下春芽

從GOAT誕生開始,Agent敘事衝擊市場的力度不斷上升,如同一位功夫大師,左拳“Memecoin”,右掌“行業希望”,你總會在其中一招裡敗下陣來。其實,AI Agent 的應用場景並未嚴格區分,平台、框架與具體應用之間界線模糊,但根據代幣或協議的偏好仍可大致分類。但是,根據代幣或協議的發展偏好還是可以分為以下幾類:

  • Launchpad:資產髮型平台。 Base 鏈上的Virtuals Protocol 和clanker,Solana 鏈的Dasha。

  • AI Agent 應用:遊離於Agent和Memecoin之間,在記憶記憶體的配置上有出彩的地方,例如GOAT,aixbt等。這些應用一般來說是單向輸出的,輸入條件非常有限。

  • AI Agent 引擎:Solana 鏈的griffain 以及base鏈的Spectre AI。 griffain可以做到從讀寫模式進化到讀、寫、行動的模式;Spectre AI 是RAG引擎,鏈上搜尋。

  • AI Agent框架:對框架平台來說,Agent本身就是資產,所以Agent 架構是Agent的資產發行平台,是Agent的Launchpad。目前代表性的項目有ai16,Zerebro , ARC和這兩天熱議的Swarms。

  • 其他小方向:綜合型Agent Simmi;AgentFi協定Mode;證偽類別Agent Seraph;實時API Agent Creator.Bid。

進一步討論Agent框架,可以看出它具有充分的外部性。有別於各大公鍊和協議的開發者只能在不同開發語言環境中選擇,而產業內總的開發者規模並沒有呈現對應市值增速的成長。 Github Repo是Web2和Web3開發者建立共識的之所,在這裡建立開發者社區,比任何一個協議單獨開發出來的「一插即用」包對Web2開發者的吸引力和影響力更強大。

本文提到的4種框架都已開源:ai16z的Eliza 框架獲得6200​​顆星;Zerebro的ZerePy框架獲得191顆星;ARC的RIG 框架獲得1700顆星;Swarms的Swarms框架獲得2100顆星。目前,Eliza 框架被廣泛用於各種Agent應用,是覆蓋範圍最廣的框架。 ZerePy的開發程度不算高,發展方向主要在X上,尚且不支援本地LLM和整合記憶體。 RIG的相對開發難度最高,但能給開發者最大限度地實現效能最佳化的自由。 Swarms除了團隊推出mcs之外還沒有其他用例,但Swarms可以整合不同框架,有較大想像空間。

此外,上述分類中,把Agent引擎和框架分割開來,或許或造成疑惑。但我認為二者是有差別的。首先,為什麼是引擎?聯想現實生活中的搜尋引擎來類比是相對契合的。不同於同質化的Agent應用,Agent引擎的性能在其之上,但同時是完全封裝的,透過api介面來調整的黑盒。使用者可以以fork的形式來體驗Agent引擎的效能,但是又不能像基礎架構那樣掌握全貌和客製化自由。每個使用者的引擎就像在調教好的Agent上產生一個鏡像,是對鏡像做互動。而框架本質上是為了適配鏈,因為在Agent做Agent框架,最終目的都是和對應的鏈有整合,怎樣定義數據交互方式,怎樣定義數據驗證方式,怎樣定義區塊大小,怎樣平衡共識和性能,這些是框架需要考慮的事情。而引擎呢?只需要在某一個方向,充分微調模型和設定資料互動​​還有記憶體之間的關係就行,效能是唯一評價標準,而框架則不然。

用「波粒二象性」的視角去評估Agent框架或許是確保走在正確方向上的前提

Agent執行一次輸入輸出的生命週期中,需要三個部分。首先是底層模型決定了思考深度和方式,然後記憶體是自訂的地方,在基礎模型有了輸出之後,根據記憶體再修改,最後在不同的客戶端完成輸出操作。

AI Agent 框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

來源:@SuhailKakar

為了證實Agent框架具有“波粒二象性”,“波”具有“Memecoin”的特徵,代表社區文化和開發者活躍度,強調Agent 的吸引力和傳播能力;“粒”代表“行業預期”的特徵,代表底層效能、實際用例和技術深度。我會分別從兩個面向結合三個框架的開發教學為例進行說明:

快速拼接式的Eliza框架

  1. 設定環境

AI Agent 框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

來源:@SuhailKakar
  1. 安裝Eliza

AI Agent 框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

來源:@SuhailKakar

3.設定檔

AI Agent 框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

來源:@SuhailKakar

4.設定Agent性格

AI Agent 框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

來源:@SuhailKakar

Eliza的框架相對來說,易於上手。它是基於TypeScript,這是大多數Web 和Web3 開發者都熟悉的語言。框架簡潔,沒有過度抽象,讓開發者輕鬆地加入自己想要的功能。透過步驟3,看到Eliza可以多客戶端集成,可以將其理解為多客戶端集成的組裝器。 Eliza支援DC, TG和X等平台,也支援多種大語言模型,可以透過上述社群媒體實現輸入,LLM模型來輸出,並且支援內建記憶管理,可以讓任意習慣的開發者快速部署AI Agent。

由於框架的簡潔性和介面的豐富性,Eliza大大降低了存取的門檻,實現了相對統一的介面標準。

一鍵使用式的ZerePy框架

1.Fork ZerePy的庫

AI Agent 框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://replit.com/@blormdev/ZerePy?v=1

2.配置X和GPT

AI Agent 框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://replit.com/@blormdev/ZerePy?v=1

3.設定Agent性格

AI Agent 框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://replit.com/@blormdev/ZerePy?v=1

效能優化式的Rig框架

以建構RAG(檢索增強生成) Agent為例:

1.配置環境和OpenAI key

AI Agent 框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

2.設定OpenAI 客戶端並使用Chunking 進行PDF 處理

AI Agent 框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

3.設定文檔結構和嵌入

AI Agent 框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

4.創建向量儲存和RAG agent

AI Agent 框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://dev.to/0thtachi/build-a-rag-system-with-rig-in-under-100-lines-of-code-4422

Rig(ARC)是一個基於Rust 語言面向LLM 工作流引擎的AI 系統建構框架,它要解決更底層的效能最佳化問題,換句話說,ARC 是一個AI 引擎「工具箱」,提供AI 呼叫、效能最佳化、資料儲存、異常處理等後台支撐服務。

Rig 要解決的是「呼叫」問題,以幫助開發者更好選擇LLM,更好優化提示詞,更有效管理token,以及如何處理並發處理、管理資源、降低延遲等,其重點在於AI LLM 模型和AI Agent 系統協作過程中如何「用好它」。

Rig是一個開源Rust 函式庫,旨在簡化LLM 驅動的應用(包括RAG Agent)的開發。因為Rig開放的程度更深,因此對開發者要求更高,對Rust和Agent的理解要求也更高。 這裡的教學是最基礎的RAG Agent的設定流程,RAG透過將LLM 與外部知識檢索結合來增強LLM。在官網的其他DEMO中,可以看到Rig具備以下特徵:

  • LLM介面統一:支援不同LLM provider的一致api,簡化整合。

  • 抽象工作流程:預先建構的模組化元件讓Rig可以承接複雜AI系統的設計。

  • 集成向量存儲:內建對裁體存儲的支持,在RAG Agent等相似的搜尋類Agent中提供高效性能。

  • 嵌入靈活:提供易於使用的API,用於處理嵌入,在RAG Agent等相似的搜尋類Agent開發時,降低語意理解的難度。

可以看出相較於Eliza,Rig為開發者提供了額外的效能最佳化的空間,幫助開發者更好地調試LLM和Agent的呼叫和協作優化。 Rig以Rust 驅動性的效能、利用Rust 優勢零成本抽象化和記憶體安全、高效能、低延遲的LLM 操作。能夠在底層層面上,提供更豐富的自由度。

分解組合式的Swarms框架

Swarms旨在提供企業級生產級多Agent編排框架,官網提供了數十種workflow和Agent平行串行架構,這裡介紹其中一小部分。

Sequential Workflow

AI Agent 框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://docs.swarms.world

順序Swarm 架構以線性順序處理任務。每個Agent在將結果傳遞給鏈中的下一個Agent之前完成其任務。此架構可確保有序處理,並且在任務具有依賴關係時非常有用。

用例:

  • 工作流程中的每個步驟都依賴前一個步驟,例如裝配線或順序資料處理。

  • 需要嚴格按照操作順序的場景。

層次化架構:

AI Agent 框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://docs.swarms.world

實現自上而下的控制,由上級Agent協調各下級Agent之間的任務。其中Agent同時執行任務,然後將其結果回饋到循環中進行最終聚合。這對於高度可並行化的任務非常有用。

電子表格式架構:

AI Agent 框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

資料來源: https://docs.swarms.world

用於管理同時工作的多個代理的大規模群體架構。可同時管理數千個代理,每個代理都在自己的執行緒上運行。它是監督大規模代理輸出的理想選擇。

Swarms不僅是Agent框架,還可以相容於上述Eliza, ZerePy和Rig框架,以模組化的思想,在不同工作流程和架構中最大化釋放Agent效能,以解決對應問題。 Swarms的構思和開發者社群進展都沒問題。

AI Agent 框架是補全拼圖的最後一角?框架的「波粒二象性」如何解讀?

  1. Eliza:易用性最強,適合初學者和快速原型開發,特別適合社群媒體平台的AI互動。框架簡潔,方便快速整合和修改,適合不需要過度效能優化的場景。

  2. ZerePy:一鍵部署,適合快速開發Web3和社群平台的AI Agent應用。適合輕量級AI應用,框架簡單,配置靈活,適用於快速建置和迭代。

  3. Rig:專注於效能最佳化,尤其在高並發和高效能任務中表現出色,適用於需要細緻控制和最佳化的開發者。框架較為複雜,需要一定的Rust知識,適合更有經驗的開發者。

  4. Swarms:適合企業級應用,支援多Agent協作和複雜任務管理。框架靈活,支援大規模並行處理,並提供多種架構配置,但由於其複雜性,可能需要更強的技術背景來有效應用。

總體來說,Eliza 和ZerePy 在易用性和快速開發方面具有優勢,而Rig 和Swarms 更適合需要高效能和大規模處理的專業開發者或企業應用。

這就是Agent框架具有「產業希望」特性的原因,上述框架仍處於早期階段,當務之急是搶佔先發優勢並建立活躍的開發者社群。框架本身的效能高低以及相對Web2流行應用來說是否落後都不是主要矛盾。只有源源不斷湧入開發者的框架才能最終勝出,因為Web3產業始終需要吸引市場的注意力,框架性能再強,基本面再雄厚,如果難以上手導致無人問津,則本末倒置。在能夠框架自身能夠吸引開發者的前提,具有更成熟和更完整的代幣經濟模型的框架會脫穎而出。

而Agent框架有著「Memecoin」特性這一點,則非常好理解。上述框架代幣都沒有合理的代幣經濟設計,代幣沒有用例或用例非常單一,沒有經過驗證的商業模式,也沒有行之有效的代幣飛輪,框架只是框架,和代幣之間沒有完成有機結合,代幣價格的成長除了FOMO之外,難以獲得基本面上的助力,沒有足夠的護城河來確保穩定且持久的價值成長。同時,上述的框架本身也顯得比較粗糙,其實際價值和當前市值並不匹配,因此有著強烈的「Memecoin」的特性。

值得注意的是,Agent框架的「波粒二象性」並不是缺點,不能將其粗暴的理解為既不是純粹的Memecoin,又沒有代幣用例的半罐水。正如我在上一篇文章中提到的觀點:輕量化的Agent覆蓋著模棱兩可的Memecoin面紗,社區文化和基本面不會再成為矛盾,一種新的資產發展路徑正在逐漸浮出水面;儘管Agent框架初期存在泡沫與不確定性,但其吸引開發者和推動應用程式落地的潛力不容忽視。未來,具備完善代幣經濟模型和強大開發者生態的框架,或將成為這條賽道的關鍵支柱。