對話 SIG 合夥人 Tim Gong:AI agent 不是一個工具,而是一個與人協作的新物種



富有創造力的人與機器的協同,是未來主流的工作狀態。

對話人:

王峰:藍港互動創始人、火星財經及Elenment發起人

Tim Gong:SIG中國創始合夥人、ByteTrade董事長

編者按:2023年除夕,王峰與Tim Gong進行了一場對話,話題涉及資訊排序、熵和公鏈以及Web3的未來(鏈接:王峰除夕對話Tim Gong:關於資訊排序、熵及Web3的明天)。這場對話已經過去一年時間,這一年ChatGPT如日中天,LLMs 對資訊的產生與分發都帶來了深刻的影響,Tim Gong博士的認知有了哪些更新,其領導的ByteTrade又做了哪些工作?在聖誕前夕,王峰再次對話Tim Gong。

2022年6月,SIG宣佈領投總部位於新加坡的Web3 資訊應用的基礎軟體平臺 ByteTrade 新一輪4000萬美元,SIG中國創始合夥人Tim Gong出任該公司董事長。Tim Gong畢業於上海交通大學物理專業,在普林斯頓大學獲電子工程學博士。SIG是位元組跳動的最早期的投資方,也一直是最大投資股東。

去年除夕夜王峰與Tim Gong探討了“為什麼需要有去中心化的資訊分發”,也就是大家常講的Web3。在此之後,OpenAI 發佈了 ChatGPT。在過去的一年,LLMs 對資訊的產生與分發都帶來了深刻的影響。許多 SIG 投資的 Web3、雲計算、或者 AI 公司在過去一年中也及時抓住機會,調整了產品方向。讓我們看看Tim Gong在這一年中有了什麼更新。

以下是王峰與Tim Gong的對話全文

1、很多創業者與投資人現在都在討論 AI native 的產品與公司。什麼是您所理解的AI native?

可能一個比較常見的定義是“離開了 AI 就不工作的產品”。比如 copilot 這類產品可能就算不上是 AI native。畢竟離開了 AI 的 google search,Microsoft office 與 GitHub codespaces 仍然是挺有用的產品,而 AI 提供的價值是 incrementally 提高了體驗。

而 AI agent 這樣的產品,只要求用戶用自然語言交互,由 AI 來理解,計劃,推理,與執行整個任務,則是 AI native 的。AI agent 不是一個工具,而是一個與人協作的新物種。

從人找資訊(以 Google 為代表的蒐索),到資訊找人(以位元組為代表的推薦),再到 personal AI agent 幫助人生產與消費資訊。我們一直在發明新的方法來實現熵減。

2、作為一個新物種,AI agent 是要取代人類嗎?

當然不是。我想起了曾鳴教授最近提的觀點:“富有創造力的人與機器的協同,是未來主流的工作狀態。”

目前市場上大家對 AI agents 的定義比較廣泛。任何給大模型提供了知識,記憶,感觀(“眼睛與耳朵”),以及行動能力(“手”)的應用,都是 agent。當然 agent 也包括了機器對人的直接延伸,比如大模型驅動的機器人,個人 IoT 智慧設備,或者數位孿生的環境。目前市場上的大模型應用創業公司,基本上 100% 是在做 agents。

3、如果 AI agent 是未來的主要產品形態,這對未來的整個軟體生態會帶來什麼影響呢?

我想起來曾鳴教授曾說過:“Web2 的軟體生態是讓人更好地變成工具” ,我認為未來的軟體生態會主要為 AI agent 服務。因為人只需要與 AI agents 交互了,其他的軟體都與人沒有直接關係了。Agents 或者“機器人”可以幫助你獲得資訊,幫助你掙錢(工作或者交易),幫助你學習,甚至幫助你社交。你個人的 agent 是你最信任也是最有用的陪伴,你與它交互就可以了。

舉例來說,最近在大模型領域特別流行的 prompt engineering(提示詞工程),包括 RAG 這種用私有知識庫來補充 prompt 上下文的技術,都是以服務 AI agent 為目標的軟體。這才是在基礎軟體層面的 AI native。

Mistral AI 的創始人最近也說,相對較小的開源 LLMs,比如 7B 參數的模型,能讓開發者自己運行,同時可能湧現足夠的“智慧”,可能才是 agent 創新的 sweet spot。

4、說到開源的 LLMs,也有一些人仍不看好。最近的 OpenAI dev day 發佈的一系列產品顯示了一夜崛起的科技大公司的絕對優勢。OpenAI 的先發優勢如此之強,AI 的未來是中心化的嗎?

開源大模型現在迭代速度越來越快,越來越有競爭力。我前幾天在 Hugging Face 上搜了一下,光是基於 Llama2 架構重新訓練或者微調的開源大模型就有上千個,而它們在性能榜單上與 OpenAI 的差距也在不斷縮小。

而且在 OpenAI Dev Day 上發佈的一系列產品,從模型微調,RAG 知識庫,結構化輸出,到應用編排都已經早有很好的開源方案。甚至可以說在應用這個層面上,OpenAI 在追趕模仿開源的創新。

5、但是,LLM 研發與推理需要的GPU 資源需要很大投入,所以是非常容易中心化的。有很多人說,GPU rich (富有 GPU)的大廠與 GPU poor (缺乏 GPU)的創業公司差距只會越拉越大。

我不同意這個說法。簡單來說,現在最重要的開源大模型 llama2 不就是 GPU rich 的 meta 發佈的?而同樣 GPU rich 的 Google, 微軟,亞馬遜,到今天也沒見發佈什麼有影響力的東西。GPU 顯然不是創新的充分條件。創新靠的是人,不是 GPU。開源最大的優勢是能把人聚在一起。而且隨著 GPU 算力變得越來越便宜,模型訓練的主要矛盾可能越來越會是數據,尤其是私域的數據,而不是算力。

甚至 GPU rich 也不是大模型創新的必要條件。在個人電腦與邊緣機房有大量冗餘的 GPU。它們也許並不適合訓練模型,但是對於佔 95% 應用工作量的微調與推理,這些去中心化的 GPU 資源是大有用武之地的。

但是我更期待的是進一步的科技創新,比如用 CPU 運行大模型推理。整個社會有大量閒置的 CPU 算力與內存。目前這方面前沿的工作很多。包括我們的 portfolio 公司,比如 Second State,實現了在個人筆計本電腦甚至 IoT 邊緣設備上離線地運行大模型。

我很期待去中心化 AI 大模型應用的未來。

6、您講了去中心化 AI agents 的可行性。但是它們是必要的嗎?在您的設想中去中心能解決用戶的什麼需求呢?

同時,正因為 AI Agent 有可能全面掌握我們每個人的資訊入口與出口,我們需要對它有高度的信任。我們不可能允許它被其他人控制,也很難容忍廣告商的商業引導。這就決定了,agents 是私有的,是去中心化的。企業與個人需要的去中心化基礎設施。

更進一步說,個人的機器人助手, IoT 智慧設備,或者數位孿生,本來就是用戶自己擁有的電腦,本質上就是去中心化的。在 ByteTrade,我們把這個基礎設施叫做“私有的邊緣雲”。

但是,私有的 agents 是需要協作的。就像人一樣,每個 agent 都需要與別的 agents 交換資源。這種交換可能是算力(比如你的 agent 有空閒的 GPU),可能是資訊,可能是資產,也可能是現實社會的許可權(比如你的 agent 有政府牌照可以交易某種受限資產)。這些都是全新的機會。

7、人與人的協同靠的是組織關係。人與機器的協同是靠什麼實現的呢?

現代商業文明的基礎是貨幣,也就是人與人之間的價值交換網絡。我們的智慧 agents 也需要一個價值交換網絡,讓 agents 之間以及 agents 與人之間能實現商業協作。

李飛飛博士在最近的一個訪談中提到,“When we think about this technology, we need to put human dignity, human well-being—human jobs—in the center of consideration.” 人與 AI agent 的交互與協作必須要維護人的尊嚴。

今天我們已經有了這樣網路的基礎技術。就是基於區塊鏈的去中心化賬本技術。整個 crypto 與 web3 社區對去中心化點對點交易系統進行了大量的嘗試與創新。在 ByteTrade,我們把這種可以量化與交易的 agent 貢獻叫做 Proof of Intelligence (PoI)。這個 intelligence 是廣義的“智慧”,是人或者機器智力勞動的結果。

8、這個世界每個人都需要接受一個 DID (去中心化的身分)嗎?

Sam Altman 的 WorldCoin 講的是 Proof of Personhood。作為 OpenAI 的 創始人,他認識到了在未來的 AI 世界裡,人會是需要“自我證明”才能加入到價值網路的。DID 只是實現這個 vision 的一個具體技術手段。

ByteTrade 的 Proof of Intelligence 把人與智慧 AI agent 放在同一個網路裡進行價值交換。我們認為這裡一開始的主要場景可能是 agent 學習人的喜好,然後代表人與別的 agent 交互。比如

  • 一個 agent 可以是用戶在 VR 世界裡面的孿生,與其他人的 agents 在數字世界裡面互動。

  • 一個 agent 可以出售自己節點上閒置的 GPU 資源,換取另一個 agent 的閒置存儲資源。

  • 一個 agent 可能有一個在某個特定領域表現出色的微調大模型(比如這個 agent 的人類伴侶是一個行業專家)。它可以把這個模型“租”給別的 agents。

  • 一個 agent 可能有私域數據能幫助別的 agents 更好地解決某一類的問題。它可以出售這些數據,或者甚至以這些數據為基礎提供計算服務。

  • 一個 agent 可以運行一個 DAO 或者公鏈的質押結點,與提高質押資金的 agent 分享收益。

這些 agents 之間的交換都是 PoI 的具體表現。這些 PoI 在區塊鏈上可能有各種表現的形式。比如,同質化的計算資源可以是 fungible tokens ,而特殊唯一的數據或者算法則可以是 NFT。具體怎麼為這個 intelligence 定價則是由去中心化的 RFQ 網路(比如 Otomic)或者 NFT 交易平臺(比如 Element)來完成。

9、很明顯,另一個驅動 AI 中心化的巨大力量是政府。不論是中國還是美國的人工智慧產業人士都不會懷疑,中美兩國政府都在試圖“監管”大模型。創投圈子裡面很多人說,監管會影響創新,想聽聽您的看法?

我認為大模型,以至 AGI,對社會產生危害的風險是確實存在的。但是解決問題的方法應該是依賴技術創新與行業自律。比如,大模型固然可以產生假新聞,但是它也能檢測假新聞。我們的每個 agent 可以獨立地對資訊真偽進行判斷,而且它們產生的結果也可以生成 NFT 記錄上鏈。比如,A 的 agent 用 B 的模型加上 A 的數據生成了一個逼真的短視頻,A 會同時發佈一個 NFT 來證明這個視頻的來源。這樣任何看到這個視頻的人都可以對其溯源。

如果不同的 agents 對資訊真偽的判斷有爭議,PoI 還提供了一個很好的機制讓社區達成共識。

Elon Musk 在 X 實現的 community notes 是讓用戶對內容進行投票,在很大程度上是非常成功的嘗試。但是從 OpenAI 董事會的“宮鬥”我們也可以看出,no skin in the game 的投票是非常危險的,很容易被人利用。

用 AI agents 可以規模化地對內容真假進行投票。而 PoI 是一個經濟機制,它可以讓 Agents 以及其代理的人類為投票付出成本,也就是讓他們有 skin in the game。我很期待在這個方向的創業專案!

10、說起創業公司,您擔任董事長的 ByteTrade 已經開始在做這些工作了嗎?

是的,ByteTrade 去年成立的時候就是想要把屬於每個人的計算資源連接起來,構建一個去中心化的“個人雲”。這與我們今天講的 Agent 沒有什麼不同。過去一年的主要變化是 AI 變得更強大了,所以 AI agent 的應用場景與需求都更上了一個臺階。對於 ByteTrade 來說,我們在明年會分步宣發幾個產品模塊。

  • Terminus OS 是我們的個人雲產品。它提供了一個去中心化的計算平臺讓每個人都可以運行開源的 AI 大模型以及 agents。

  • Terminus 裡面會預裝一些核心的應用,尤其是需要高度安全的金融或者區塊鏈應用。比如錢包,驗證身分的 DID 等等。

  • Terminus marketplace 是一個去中心化的應用市場。ByteTrade 與第三方開發者都可以在這裡發佈應用,比如 AI agents,內容推薦引擎,自動交易機器人等等。

  • Otomic 是我們基於 RFQ 的交易網路。它上面主要由 Terminus 裡面運行的機器人進行報價與自動執行交易。這個去中心化的 RFQ 機制可以交易幾乎所有的 crypto 與傳統金融的數位資產與衍生品。

ByteTrade 一方面為開源的大模型與 AI agent 提供去中心化的軟體開發,發佈,與運行的基礎設施,另一方面通過搭建一個基於公鏈的 PoI 價值交換網絡讓 AI agents 的協作成為可能。很希望明年有機會與大家更深入地探討這些問題!

太好了,謝謝龔博士今天的時間,我們非常期待ByteTrade 的產品!

聯系郵箱:0xniumao@gmail.com