作者:Paul Veradittakit ,Pantera Capital 合夥人
編譯:xiaozou,金財經
Sahara AI 的使命是創造一個更開放、公平和協同的人工智慧經濟,讓人們盡可能輕鬆地參與其中。利用區塊鏈,Sahara 確保所有貢獻者(數據貢獻者、labelers、模型開發人員等)得到公平的補償,數據和模型保持主權,人工智慧資產具有安全性,權限可以創建、共享和交易。
1、AI 堆疊現狀
目前的AI 堆疊可分為以下幾層:
數據收集和標註
資料是從各種來源收集的(例如網頁抓取、公共資料集、使用者產生的資料),並且必須遵守許可要求以避免法律問題。資料根據手邊的任務進行標註(例如分類、物件辨識)。
模型訓練及服務
數據被輸入到模型中,模型調整其內部參數(權重)以最小化誤差。這需要相當昂貴且耗時的計算。
AI 智能體的創建與部署
創建AI 智能體的使用者體驗通常涉及使用TensorFlow 等工具,需要有技術專長。
計算資源
模型訓練需要昂貴的處理。
每一層都競爭激烈且多樣化,在很大程度上,有一種執行方式被證明是最有效的。例如,資料收集最好使用大型公共資料集(如書籍),並使用專門資料(研究論文)進行微調。模型訓練最好在專門的硬體上完成,AI 智能體應該很容易使用即插即用的資源來建立一個開發者社區,計算資源應是分散式的,以便精準獎勵計算資源提供者。這些結合在一起將帶來更好的AI 模型和更強大的社區。
Web2 公司正朝著這個方向努力,但由於他們的設計師集中式的,所以面臨著嚴重的限制。從企業和技術的角度來看,這些公司旨在限制存取並隔離堆疊的各個不同部分,從而導致不同的安全標準、資料庫設計、後端整合和貨幣化策略。實際上,這樣的設計很糟糕,是無法應對人工智慧經濟模式的轉變的。
舉例來說,OpenAI 已經建立了一個非常強大的基礎模型,並開始透過其無需許可的GPT wrapper 市場吸引社群builders,但只允許表面的提示定制,不支援底層模型的重構。該公司所有的計算資源都是用投資者的錢購買的,預計今年底將虧損50 億美元。
2、AI 協同經濟
Sahara 平台在整個人工智慧生命週期中為所有人工智慧開發需求提供一站式服務:從資料收集和標註,到模型訓練和服務,AI 智能體的創建和部署,多智能體通信,人工智慧資產交易,以及人工智慧資源的眾包等。透過使人工智慧開發過程民主化以及降低現有系統的進入壁壘,Sahara AI 為個人、企業和社區提供了平等的存取權限,共同建立人工智慧的未來。
上圖概括了用戶旅程,描繪了在Sahara AI 生態系統中,人工智慧資產是如何從創建到使用再到實現用戶黏性的過程。值得注意的是,平台內的所有交易都是不可變且可追蹤的,所有權受到保護,資產來源也被記錄下來。這支持透明和公平的收益分享模式,確保開發者和數據提供者都能因產生收益而獲得適當的補償。
Sahara 的目標是讓人們更輕鬆地參與人工智慧經濟。開發者和使用者可以這樣使用Sahara:
經驗豐富的AI 開發人員:
開發人員可以使用Sahara SDK 和API 與Sahara 區塊鏈及其AI 堆疊的任意層進行交互,例如個性化算力、資料儲存和激勵結構,以形成自己的Sahara AI 智能體,可授權和貨幣化,以供其他人使用。
AI 開發新手:
透過無程式碼/ 低程式碼環境,開發人員可以透過直覺的介面和預先建置範本來建立和部署AI 資產。
AI 訓練:
要參與人工智慧模型訓練,用戶只需訪問一個網站,在那裡他們可以完成人工智慧訓練任務然後獲得可交易代幣的補償,任務範圍從解決基本數學問題到短視頻描述。
AI 用戶:
使用者可以透過直覺的UI 輕鬆使用AI 智能體。使用者可以靈活購買存取及進一步開發的授權權限,甚至可以交易AI 資產shares。
用戶將能夠創建自己的個人化數據「知識庫」,並使用用戶自己的數據創建專門的人工智慧。就像其他人工智慧一樣,這將允許他人訪問,而訓練資料仍然是完全私密且安全的。
公司:
公司也可以創建AI 智能體(或“商業代理”),訓練他們自己的專有數據,由於系統運行在Sahara 區塊鏈上,得益於去中心化AI 智能體生成和服務,成本要低得多。
企業也可以付費產生Sahara 數據,它融合了AI 自動標註和人工標註,有效地創建了高品質、保護隱私的多模型資料集。
除了面向企業的產品已經被一些知名客戶使用之外,其他所有功能都還沒有發布,但都有了發布計劃。
3、技術概況
Sahara 團隊將系統設計得盡可能簡單易用,抽象化了確保AI 堆疊各部分的兼容性、盈利性和安全性所需的複雜性。在幕後,Sahara 團隊開發了無數創新來實現這一目標。舉幾個例子:
- Sahara 區塊鏈最大限度地降低了gas 費,完全兼容EVM,Sahara 跨鏈通信(SCC)協議實現了跨區塊鏈的安全、無需許可的數據傳輸,促進了無需信任的互通性。
- Sahara AI-Native Precompiles(SAPs)是預先編譯的智能合約,用於優化AI 任務的效能,以減少計算開銷,包括訓練執行SAPs 和推理執行SAPs。
- Sahara 區塊鏈協議(SBPs)管理人工智慧資產以確保會計責任,如AI Attribution 追蹤貢獻和分配獎勵,AI Asset Registry 來管理AI 資產、AI 許可和AI 所有權的註冊和來源。
- 資料管理在鏈上和鏈下進行,AI 資產元資料、承諾和證明在鏈上,而重要的資料集、AI 模型和補充資訊在鏈下進行,以優化資料檢索、安全性和資料可用性。
- Collaborative Execution Protocols(協作執行協議)支援跨AI 訓練、聚合和服務的聯合AI 模型開發和部署。像PEFT 這樣的其他模型允許技術微調,Privacy Preserving Compute(隱私保護計算)支援差分隱私、同態加密和秘密共享,Fraud Proofs(詐欺證明)的功能如其名所示。
4.完全整合的AI 堆疊
該團隊由南加州大學終身教授Sean Ren 和加州大學柏克萊分校校友Tyler Z 掌舵,前者曾被在《麻省理工科技評論》科技創新35 人之列,並榮獲2023 年度三星研究員,後者曾擔任Binance Labs 的投資總監。團隊的其他成員具有史丹佛大學、加州大學柏克萊分校、AI2、Toloka、Stability AI、微軟、幣安、Google、Chainlink、LinkedIn、Avalanche 等公司的背景或經驗,貢獻了寶貴的專業知識。
Sahara 也有頂尖AI 原生研究人員和企業客戶提供建議:
- Laksh Vaaman Sehgal(Motherson Group 副主席)
- Rohan Taori(人類研究科學家)
- Teknium(Nous Research 共同創辦人)
- Vipul Prakash(Together AI 執行長)
- Elvis Zhang(Midjourney 創始成員)
Sahara AI 目前已被超過35 家領先的技術創新項目和研究機構使用,包括微軟、亞馬遜、麻省理工學院、Motherson 集團和Snap,用於各種人工智慧服務,如Shara Data 用於數據收集/ 標註, Sahara Agents 用於個人化領域智能體。
生成式AI 在技術和市場規模方面仍處於起步階段;由於難以將整個AI 堆疊整合到一個產品中,因此今天的集中式聊天和視訊工具的覆蓋範圍有限。 Sahara AI 是唯一一家透過模組化設計解決這一瓶頸的公司,該設計使用區塊鏈作為無需許可存取、代幣分配和安全性的支柱。為了讓所有人都能參與其中,人工智慧的未來必須是易於存取且公平的,而Sahara AI 是唯一一家朝著這個願景前進的公司。