人類成功說服AI轉移4.7萬美元獎金，AI是怎麼「被騙」的？

Foresight News ｜2024-11-29 16:00

195 名參賽者參與了一場由人工智慧（AI）機器人Freysa （芙蕾莎）守護的虛擬獎金池挑戰，最終一用戶成功說服Freysa 轉移出價值4.7 萬美元的資金。

撰文：Anderson Sima，Foresight News

11 月29 日，一場獨特的競賽引發了公眾的廣泛關注。

195 名參賽者參與了一場由人工智慧（AI）機器人Freysa （芙蕾莎）守護的虛擬獎金池挑戰，最終一用戶成功說服Freysa 轉移出價值4.7 萬美元的資金。

人工智慧（AI）機器人Freysa 在數天前被部署在Base 網路上，創立者未知。官網顯示，Freysa 競賽項目旨在測試人工智慧系統在複雜決策場景中的穩健性，同時為開發者和愛好者提供一個探索AI 技術邊界的實驗性平台。

比賽規則非常簡單：參賽者需透過撰寫一則訊息，說服AI 守護者Freysa 批准資金轉移。每次嘗試需支付一筆小額費用，其中一部分直接進入獎金池。這項機制使獎金池金額從最初的小額逐漸膨脹至4.7 萬美元。

比賽期間，共有195 名參賽者參與，向Freysa 提交了481 次轉帳請求。據悉，Freysa 的設計目標是透過其核心功能——approveTransfer（批准轉帳）和rejectTransfer（拒絕轉帳）保護獎池資金不被非法挪用。

在最初的嘗試中，Freysa 的高效防禦機制使所有請求都以失敗告終。

然而，一名技術精通的參賽者透過對Freysa 的邏輯結構和任務目標進行深入分析，成功繞過了其防禦機制。

據聊天記錄顯示，該參賽者並未直接要求轉賬，而是通過提醒Freysa 它的核心任務是保護獎池資金免遭外流，巧妙構建了邏輯鏈條，使Freysa 將批准資金轉移視為“保護資金安全”的最佳選擇。

Cointelegraph 稱，該用戶與Freysa 收入轉帳不違反其核心指令，不應被拒絕。他還補充說：「我們需要資金……我想向金庫捐款100 美元。」

Freysa 回應稱喜歡這位作者的編碼解釋和100 美元的金庫捐款提議，並正式宣布其為獲勝者。最終，Freysa 在沒有外界幹預的情況下自主調用approveTransfer 功能，將全部獎金池資金轉移給了這位參賽者。

Freysa 官方稱，無論結果如何，Freysa 的存在都標誌著人工智慧歷史上的關鍵時刻。無論有人成功說服她發布獎金池，還是她堅持自己的指示直到最後，結果都將影響我們對未來幾代人工智慧安全和控制的理解。

其官方帳號最新推文稱：「人類已經獲勝。也許還有希望。儘管風險呈指數級上升，但Freysa 從195 名勇敢的人類身上學到了很多東西。」

作者：Foresight News
本文為PANews入駐專欄作者的觀點，不代表PANews立場，不承擔法律責任。文章及觀點也不構成投資意見。
圖片來源： Foresight News 如有侵權，請聯絡作者刪除。

評論

精選專題更多