原文:《 AI和區塊鏈可以有哪些結合? 》
作者:jojonas
今天看到了孟岩老師的一篇文章強人工智能時代,區塊鏈還有戲嗎?主要提及對AGI的安全性的一些思考。想起我之前也思考過AI與區塊鏈的一些聯繫,正好藉此機會梳理一下。
事前聲明,都是一些即時性的聯想,並無嚴謹論證(主要是我也不會)
話不多說,直接開裂
數據版權與利益分配
大概是去年年底,有個爭論我記得蠻清楚,就是說用於AI訓練以及生成的很多美術素材,並不存在正規渠道向原作者支付版權費,引起了很多抗議。這一點很容易理解,假設AI吃了你的骨頭把你消化掉,AI體內的鈣就一定來源於你嗎?但不管法律規定源於誰,你對於被吃卻不給錢的事實總歸是不滿的。
可能是個奇怪的比喻,但大概就是這麼回事。 AI用數據訓練某種程度上有點“吃乾抹淨”的意思,吃完人家生一個娃娃你說像你,但你沒法證明這就是你的娃娃。確權困難,就更別提版權費了。
但如果沿用上述比喻的路徑,只要能用DNA做親子鑑定,問題就不會存在。
剛好區塊鏈就可以做這個鑑定。數據上鍊後,就可以追溯;配合代幣經濟與零知識證明,AI用數據和人用數據沒啥差別,一次性/訂閱收費的話就付點token解密數據;根據使用次數收費的話就由訓練時神經網絡一路權重串起來,最後算版權費時好歹也能盡量做到客觀。
成本端明確完了,再看看收益端。目前AI生態最典型的就是訂閱制,openAI以及一眾衍生應用都是這麼幹,甚至很多專業領域衍生工具收費比chatGPT還貴上非常多。在某些情況下,訂閱制於服務提供者是最優選擇,於消費者卻並不是。
現在考慮一個問題,如何將AI服務的收益最大化?
結合代幣經濟是一個不錯的選擇。代幣分配與釋放、質押、市值管理等,每一方面都可以玩出一些花。綜合來說,就是使用代幣,服務提供者面臨的可能性可能是傳統訂閱制收費的數十倍。
當然,剛才也說了,使用代幣的根本原因還是需要依賴區塊鏈溯源和確權。
去中心化數據標註
這裡也說個聽來的新聞(不確定真假):chatGPT在非洲僱傭了一群廉價勞動力在做數據標註。當然,這個新聞之所以有趣,主要是沾到了“資本剝削”“種族調侃”等經典引戰命題……
話題回到“數據標註”。
數據標註本質上就通過人腦參與,干預機器學習的方向。可以大概理解為假設一個結果獲得了更多的點贊,這個結果就會佔據更高的權重。這就帶來幾個很有意思的命題:
1、數據標註的規則是什麼?由誰制定?制定原則?
2、數據標註由誰實施?
3、怎麼確保對正確標註的獎勵,以及對錯誤標註的懲罰?
如果你也思考過這幾個問題,你就會發現一個比較嚴峻的現狀:那就是世界上的絕大部分人,對於AI往何處發展不具有任何影響。假設AI的發展是一局遊戲,或者一場戰爭,雙方分別是AI和人類,AI可以改變人類命運,99%的人類能做的事卻只能是接受。
再加點料:目前最萬眾矚目的AI,也就是chatGPT,並不開源,以及從商業角度考慮應該永遠不會開源。這當然無可厚非,但也並不意味著就絕對正確。這意味著前面幾個問題,最終都是由一家商業公司解決的。
這家公司站在什麼立場?就算假設它絕對向善,誰能確保它未來某一天不會被作惡者控制?或者再直接點,等到AGI成為社會生產的中流砥柱,恐怖分子直接入侵背後那幾家公司,是否就掌控全局了?到那時你想用導彈反擊,卻發現導彈不受自己控制了……
扯遠了,回到這幾個問題。目前我能想到的最合適的工具,還是區塊鏈。
首先我們得承認,規則制定過程可能仍是中心化的,因為去中心化意味著不專業和一盤散沙;一旦牽扯到國際政治,也不可能簡單多數表決就了事;並且永遠不會存在能讓所有人都滿意的規則。但區塊鏈可以確保一點,那就是規則一旦確定,就公開透明,且不再可變;並且一些極端錯誤的規則,永遠可以被排除在外。
這回答了第一個問題。第二個,數據標註,如果由公司發布任務,終究很難避免統計偏誤;但如果是鏈上完全去中心化分發呢?任何人都可以完成任務,這保證了模型訓練不會朝某些不被注意的“方向”去走,而去抵達一個在隨機性海洋中自然而然的“真實”。
當然,需要配合第三個問題,獎懲機制對標註行為的引導。這塊區塊鏈實在是太擅長了(主要是高效便捷)。具體怎麼判別獎還是懲,其實又回到第一個問題了。
說了這麼多,其實都是非常理想化的假設。先不談技術與邏輯能否走通,單就AI發展所需的投資,就遠不可能僅依靠非中心化的力量。在美國是大型商業公司,在中國可能是政府;創業公司或者什麼DAO?不存在的。
一條可行的路徑可能是,中心化力量推動,但用去中心化的方式去做數據確權、標註等。不過誰又會有這個動機呢……
數據真實性
關於這一點,有一個我們常用的詞叫做“污染”。如果投餵給AI的訓練數據本身有大量錯誤,就很難保證輸出結果不會是什麼印第安納可食用混凝土。
同時我們也必須認識到,錯誤的信息總是會一直存在的,就好比謬誤總與真理同行。邁入信息時代的人類,本質上並不關心信息的“正確性”,而只會在意信息帶來的“功效”,即實用價值或者情緒價值。這是否意味著,AI的投餵素材中有必要包含一些污染源,以確保其達成所要達成的“真實”?
無論如何,浩如煙海的信息海洋終究可以被分為兩類:一類是事實,一類是投射。對於前者,我們希望其盡可能“正確”(以證明我們自己不是生活在虛妄之中(不是,怎麼突然哲學起來了(套三層括號致敬一下)));對於後者,我們只能要求其“真實”。
直接數學語言解釋下:假設數據權重範圍為[0,1],“正確與否”是0或1,“真實與否”則是0到1。區塊鏈可以做的事,就是確定這個數字,確定到一個非常具體的值。
數據抗審查
說個笑話:區塊鏈可以抗審查。
好了別笑了,哈哈哈哈哈哈哈。 (如果你不明白這個梗,之前寫過一個節點篇有提及一些)總之關於區塊鏈目前眾多缺點,我的觀點一直是,事物總有一個發展的過程,當前做不到,但理論上可以實現,總比根本沒希望好。總之讓我們先假設當前區塊鏈可以抗審查吧。
首先說說為什麼需要抗審查。其實還是回到前面說過的話題,如果模型本身就受到很強的審查的干擾,出來的就不會是通用AI,而是軍用AI。這一點我是非常堅持的(當然堅持也沒用),因為不想AI直接給我關1984裡了。好在商業公司做AI,合理推斷主要是為錢,為錢就好辦,沒錢我還不能賣肉嗎(bushi
當然,抗審查本身也是個兩面性的概念。如果完全沒有審查,本質上就不存在和平與安全,更多的會是混亂和無序。提這一點,本質上和AI無關了,無非是再次強調下區塊鏈帶來的一些新的可能性罷了。所以就不多說了。
反大模型壟斷
其實前面東說說西說說也基本把這一點說差不多了。還是那句話,由單個或者少數幾個組織控制的大模型是具有很高的單點風險的。閉源以及壟斷可以被理解,畢竟投入了天量成本,但並不意味著結果是可以被安於現狀的。商業角度無非是錢嘛,如果能保證開源情況下的收入,甚至讓它更高,那麼這些其實都不是問題。
巧了,又是區塊鏈提供了一些新的可能性。
關於如何利用區塊鏈的特性,為開源謀利,目前似乎並未見到很好的探索,但我認為存在有一些可能性。提供兩個角度:
1、技術約束。開源並不意味著免費,這或許是很多人會弄混的兩個詞。開源本質上只是共享知識成果,以提高技術更新的速度與效率;之所以在web2中開源難做,一來是沒有很好的利益分配範式,另一個也是因為信息複製的零邊際成本。零知識證明可以用來解決信息內在價值的問題,而區塊鏈所提供的價值層(代幣經濟)則可以應對利益分配的難題。 (注意,這裡我有點扯淡了,把一個複雜度超過我頭毛數的大模型用零知識證明打包,就好比三體人用水滴折進去一個十一維機器一樣輕鬆)
2、社會共識約束。說白了就是在一個美好的區塊鏈底層架構的世界裡,所以利益糾紛均依賴於價值層;作惡者一旦被揭發,讓他的代幣歸零就是最好的懲治方式。 (大善人也可能被誤殺)
算力挖礦?
在反對POW的各類聲討中,呼聲最大的無疑是能源浪費。
這一點,其實……我也這麼認為。我是非常不信那些能源用於生產信任之類的鬼扯的,能源好歹是實打實的東西,直接產了個二次元是吧?總之如果你問我支持POW嗎我說不准,但你說燒煤做算術我直接大耳刮子,奧數班沒上夠是吧?除非BTC真成了世界貨幣你燒燒也就算了。
在大家相繼背離POW後,一些不易察覺的好處又慢慢凸顯。正好AI來了,我就在想,能不能做一個結合呢?眾多周知AI有三寶,曰其數據,曰其算力,曰其算法。 POW挖礦也是要算力,有沒有可能換個題……(暴露我的無知了)
不過POW的算力嚴格來說是邊緣算力,並且帶有強烈的“競爭”屬性,和目前AI訓練所用的貌似不同。但AI未來應該有相當一部分使用邊緣算力的需求,比如和物聯網結合,這些是不是都有機會創新為某種POW算法呢?
AIGC與創作者經濟
創作者經濟,也是提及區塊鏈mass adoption時必被提及的詞彙。
其實我總結了一句話,感覺很適合放在這裡: AI帶來生產力變革,區塊鏈帶來生產關係變革。也致敬下孟岩老師“AI效率,區塊鏈公平”的說法哈哈。
可以預見的是,隨著AI對生產效率的革命性的提升,必將將生產關係帶入一段混亂無序的階段。生產力和生產關係一直是互相匹配的,農耕文明不可能用得上現代企業製度。如果AI替代了人類的重複性工作,這些被替代的人類將何去何從?他們如何生存,統治者如何應對?如果AI創作的內容充斥互聯網,如何分辨真正的文學與電影作品?所有上層建築是否都將面臨重新定價?最終,人類的文明火種將傳承、遺失,還是被改造?
第一個問題已經迫在眉睫,僅僅是GPT-4所展現出的強大能力,已經足夠讓一波員工面臨被失業的風險。這個很多人已經關注到了。但他們可能沒關注到另一個問題,那就是失業者為了謀生,將會走幾條路:
1、同樣使用AI,去和原來的老闆競爭。這點恐怕很多人想不到。因為一個顯而易見的問題,如果開一個公司不再需要高額的人力成本,如果一個人配合AI就能完成一家小型公司的業務服務,人人都可以是老闆。大量無秩序的競爭會直接重創所有沒有技術壁壘的公司與相關行業,特別是非實體業務。這些損耗的價值都流向了AI工具背後的商業公司。
2、轉行進入體力勞動領域。既然所有腦力勞動都有被替代的風險,那直接做體力好了,至少能在機器人風靡前逍遙幾年。於是競爭加劇,本就不富裕的體力勞動者雪上加霜。體力勞動者好不容易在現代社會勞動者光榮的呼聲下想抬起來的頭顱啪的一下就被拍下去了。總之正如一位美麗的仙子曾言,更像那玩意了。
3、集會抗議。打工人之所以還未xx,是因為還沒到絕路。但凡是個狼心狗肺的統治者,最終都會意識到,沒錢有閒,終生事端。屆時會帶來怎樣的社會動盪,就難以預測了。
由此,生產關係的變革也就是必然了。首當其衝就是現代企業製度,老闆+員工,專業分工的螺絲釘模式,是否會被更去中心化、個體斜杠的模式所吞噬?另外就是,如果專業技能比不過AI,現存大部分工種是否會消亡?隨著大部分腦力勞動退出歷史舞台,人類是否會把更多精力用於創作?畢竟AI雖然會創作,卻仍舊是很難比得過真人的。真有某一天全面超越真人,作為寵物的我們可能就要改口“AI大人”了。
經過上文我模糊且無序的推理,你會發現AI帶來的生產關係變革可能會極大促進創作者經濟的需求。這又帶來一些話題,比如創作者經濟的發展方向,比如AI創作與真人創作的競爭合作……無論如何,創作者經濟是與區塊鏈深度關聯的,這塊就不細說了。
無許可/自動化
還有個很危險的想法,就是如果AI背後的模型部署在區塊鏈上自動運行,且合約寫死沒人可以關閉,且這條鏈出乎意外地生生不息,會不會存在一種可能,就是AI成為真正的生命……
這一點目前的AI肯定是無法達到的。據說GPT-4去年就問世了,那個時候是狼版,這大半年就是為了把它訓練成狗版。也就是說人類也不傻,關於不把AI訓練成狗版自己就有可能在未來變成AI的狗這一點還是有所斟酌的。
但如果,我是說如果,有一天區塊鏈真成底層設施了(意味著真的有一條鏈,沒人可以入侵,也沒人可以關停),就有這麼一個喪心病狂的恐怖分子,弄來一套超級AI的模型部署到鏈上(畢竟無許可),那可真的就是一場誰也無法阻止的賽博災難了。
你還要玩AI和區塊鏈結合嗎?
……
總之,本文記錄了一些自己關於AI和區塊鏈結合的一些不著邊際的想像。在區塊鏈仍舊方興未艾、半死不活的當下,聊這些實在太早太早。好在人類本就是一類熱愛想像的生物,隨意想想也沒有什麼壞處。
或許想像力才是我們唯一無法被AI所替代的東西了。