對話Kaito CEO:搭建Web3的終極GPT



在新的數據分發範式下,我深信Web3帶來的機遇會完全改變科技公司壟斷數據的經濟邏輯。

深潮
:Sunny

Kaito
:Yu Hu

對話Kaito CEO:搭建Web3的終極GPT插图1

“ 在新的數據分發範式下,我深信Web3帶來的機遇會完全改變科技公司壟斷數據的經濟邏輯。& rdquo;

— Yu Hu

如何高效獲取Web3資訊? 對於普通用戶而言,推特、Discord、Telegram及媒體網站是獲取資訊的主要途徑。 對於更有分析能力的用戶來說,他們可能會選擇使用鏈上數據瀏覽器、治理論壇、播客或者諮詢報告。 Web3資訊相對於Web2更碎片化,主要分散在多個加密原生的社交應用和區塊鏈上,就像是尋寶一樣,與以穀歌為代表的蒐索路徑大相徑庭。

每個行業的發展都會經歷從混亂到有序的過程。 在傳統世界的搜尋引擎誕生之前,資訊同樣極度分散,用戶需要成為蒐索的專家,知道要去哪些不同的網站獲取什麼樣的資訊。 穀歌的出現讓全世界普通用戶可以極其高效地索引整個互聯網的資訊,而大語言模型的出現則更是將資訊索引的效率提升到了一個新的維度。

今天的Web3資訊檢索在什麼階段呢? 相比於幾年之前,我們已經獲得了長足的發展:在Etherscan,Dune,Nansen出現之前,普通用戶要查找區塊鏈資訊就像大海撈針一樣困難。 然而即便在今天,當傳統世界的資訊已經在從搜尋引擎時代跨越入大語言模型時代的時候,Web3的資訊索引因為沒有原生支持的搜尋引擎,仍然停留在資訊極度分散的
前搜尋引擎
時代:用戶需要是獲取資訊的專家,需要知道存倉量,用戶日活,協定收入,社區觀點,治理提案分別都要去哪些不同的通路獲得。 Kaito的創始人兼CEO Yu Hu深信,幾年後當我們回看今天,這樣的原始狀態會是我們幾乎不敢想像的。

Yu Hu早在2020年就看到了Web3資訊索引的痛點:極度分散,缺乏組織,並且不被以穀歌為代表的傳統搜尋引擎相容。 當時,他發現自己的需求實際上正是整個行業的需求。 囙此,他果斷地辭去了工作,全身心地投入到打造Web3搜尋引擎的事業中。 正如Yu所言:“ 我希望引領Web3的資訊索引模式從
前搜尋引擎時代
,進入到搜尋引擎時代,最終跨越至大語言模型時代,為全行業的從業者以及下一個10億Web3用戶提供一個全新的,高效的資訊索引管道。& rdquo;

Kaito的搜尋引擎通過運用Auto GPT框架和多個ChatGPT後端,共同構建了一個代理網絡,可以處理各種任務,包括蒐索、資訊處理、數據清洗和標注,旨在提供更高質量的Web3資訊服務,並積極探索以用戶共創的管道來優化體驗和擴大經濟收益。

在與Yu的深度對話中,我們討論了如何通過AI大語言模型來助力Web3用戶,並探討了如何構建基於社區共創去中心化AI搜尋引擎的未來發展。 作為媒體,我們還與Yu探討了如何將傳統媒體與人工智慧相結合,以提升資訊的真實性和獨特性的途徑。

精彩摘要

  1. 在新的數據分發範式下,我深信
    Web3帶來的機遇會完全改變科技公司壟斷數據的經濟邏輯。

  2. 在WEB2時代,資訊大多存儲在互聯網上。 而在WEB3的世界中,很多資訊存在於區塊鏈上,區塊鏈是和互聯網完全不同的資訊架構。 爬取區塊鏈上的資訊需要設定節點,而不能像Google那樣使用通用的爬蟲體系。

  3. 我們希望未來能與用戶深度共創
    。 如果用戶在我們的平臺上看到不實資訊,我們能有一個迴響機制,讓用戶參與其中,共同改進資訊的質量。

  4. 在Web3的環境下,我們重視數據的所有權,囙此希望用戶能參與到資料處理過程以及產品的共創中來。 只有用戶更多地使用,我們的模型能力才會更加地强大。

  5. 搜尋引擎
    和媒體之間本質上是一個上下游的關係,媒體是合作引擎信息源的一部分,這是最本質的關係。

掉入加密兔子洞

TechFlow:你是如何從劍橋的優秀學生,到
Citadel
基金經理,再到Cryptopunk持有者,最後創辦一家專注Web3和
AI

創業公司
的?

Yu:

我的背景是商科經濟系背景,在傳統金融領域工作了約十年。 我先後在投資銀行和對沖基金工作,最後在Citadel等公司從事次級市場投資。 然而,我在2017年左右接觸到加密貨幣,對這項新興技術產生濃厚興趣,並開始在業餘時間進行相關研究,因為這不僅涉及到新技術,還是全新的資產類別。

在2020年的DeFi夏季,我投入大量時間進行研究。 DeFi是一個相對基礎的概念,不同於其他的點,因為在DeFi中,你可以看到所有的存倉量、收入和其他名額數據,從而進行基本面分析。 我當時做了很多這方面的研究,並尋找機會。

當時,
我深刻感受到資訊在加密行業中的傳播非常混亂和散亂
,類似於我在傳統金融市場中遇到的資訊差异很大。 在傳統金融領域,有很多優秀的金融工具可以幫助大家檢索資訊。

但在區塊鏈領域,連搜尋引擎都無法有效地檢索區塊鏈相關資訊,比如推特、Discord等社交平臺上的資訊。 這讓資訊收集變得非常痛苦。

到了2021年,我購買了CryptoPunk,這個NFT標誌著整個行業的一個重要時刻。 我對Web3的未來充滿信心,這個信心一直延續到現在。

在考慮了行業的發展和自己的興趣後,我在2021年底决定辭職,創業開發一款產品。 我希望開發一款能够解决資訊檢索難題的產品,幫助像我這樣的人。 這就是我創業的初衷。

TechFlow: 2017-2021年間,你的研究重點是什麼? 有哪些關鍵的啟示? 自2017年以來,你對行業的啟發有何變化?

Yu:

我覺得他對我來說最大的啟發是對整個歷程的長線思維。

  • 最早期的啟發是關於不同金融互動管道的認知,因為我之前從事金融領域。 這個啟發在基礎框架下引發了
    對所有權概念不同定價的思考。

我認為這是一個深刻的觀點,因為
它演化成了各個行業方面的基本屬性。

  • 在2020年和2021年,我開始思考過去20年科技巨頭崛起的科技紅利,比如Google、Facebook等科技巨頭的發展。

然而,我更深層次的想法是,如果延續這種模式,再往後50年、100年,科技的格局可能會完全改變,其中最重要的部分可能就是數據的所有權。

我們現在可以免費使用Google、Instagram、Facebook等科技產品,但真正的價值在於這些產品背後巨大的數據。 用戶沒有真正意識到數據的價值,而這些數據完全掌握在科技公司手中。

在新的數據分發
範式
下,我深信Web3帶來的機遇會完全改變這種經濟邏輯。

數據的所有權將回到用戶手中,新產品將以社區共創的管道出現。 這些新產品會在不同層面上影響我們對未來的看法,也會改變數據和用戶互動的邏輯和關係。

Web3的資訊規模和特徵:去中心化和互操作性

TechFlow:
在Kaito,你如何綜合並實現Web3資訊的互操作性
? 這與
Web2
時代的方法有何不同?

Yu:

我先簡單介紹一下,Kaito有兩個覈心的產品。

  • 一個是面向機构用戶的的專業蒐索平臺,為專業人士提供服務(包括研究學者、媒體人員和行業建設者等)。 他們需要花大量時間查閱相關資訊。

  • 另一個面向全體C端用戶市場的搜尋引擎,類似於Web3的Google。

我們主要的綜合過程可以分為三個方面。

  • 首先是源頭
    ,我們要瞭解哪些數據與Web3相關。 例如,我們要篩選出推特和Discord等平臺上的相關資訊,然後通過科技綜合它們。

  • 第二步是整理
    ,我們對這些數據進行清洗和標注,將非結構化的數據轉化為結構化的數據。 我們會在自己的資料庫中進行標注,也可能利用AI和大模型進行理解。

  • 第三步是讓這些數據可讀
    ,即如何與用戶互動。 這可能採用不同的形式,如檢索、信息流、圖表甚至是聊天。 最終目標是與用戶建立緊密的互動,讓這些數據更易於操作。

這三個步驟是我們綜合數據並提供可操作性的關鍵。

Web3和Web2的資訊不同主要有三個方面。

  1. 首先,資訊傳播管道完全不同
    。 在WEB3時代,資訊本質上更加去中心化和混亂。 與Web2時代不同,資訊在Web3時代通常不僅僅依賴官方媒體發佈,即使是官方帳號,如FTX,在發佈重大事件時也更多關注來自社區的帳號。 例如,在Discord等平臺上,資訊傳播就會更加去中心化。

  2. 第二個不同在於資訊承載的基建
    。 在WEB2時代,資訊大多儲存於互聯網上。 而在WEB3的世界中,很多資訊存在於區塊鏈上,
    區塊鏈是和互聯網完全不同的資訊架構
    。 爬取區塊鏈上的資訊需要設定節點,而不能像Google那樣使用通用的爬蟲體系。

  3. 第三個不同在於資訊互動管道
    。 在WEB2時代,數據清洗和標注等過程是高度中心化進行的,像Google和ChatGPT等都有大團隊來進行這些工作。 而在WEB3時代,很多東西可以與用戶共創,通過激勵共創行為來實現。 比如在Web3的範疇內,社區和開發者共同創造了全新的搜尋引擎,為Web3社區帶來新的蒐索體驗。

TechFlow:
Web3的公有領域
和私有領域數據的當前規模是多大? 預計未來會有怎樣的變化?

Yu:

從我們自己收集的數據來看,我們每天會處理約百萬條來自機构的資訊。 如果加上公域數據,這個數位可能會擴大到千萬級別,而一旦再加上私域數據,如Telegram、Discord等,這個數目肯定會超過億級別。 這是我們每天的數據量。 至於未來的發展趨勢,我們可以預見到這一數據量將會繼續增長,因為隨著用戶數量的新增以及資訊來源的日益增多,無論是區塊鏈還是相關的中心化企業,都將面臨這一趨勢。

另外,資訊的性質也可能發生變化。 現時,大多數資訊涉及交易等方面,但隨著區塊鏈應用範圍的擴大,其他領域的資訊也將迅速新增。

人工智慧助力Web3

TechFlow:
你們是如何利用大語言模型模型構建你們的
AI
工作系統的? 此外,你們是如何處理各種
資料來源
並確定最佳答案的?

Yu:

現時,我們採用了Auto GPT的架構,將多個ChatGPT模型部署在後端,這些模型一起構成了一個代理工作系統。

  • 每個代理負責不同的任務。 當用戶提出一個蒐索請求時,我們的第一個代理會分析其語義和需求,並確定應在哪個資料來源中蒐索答案。 我們可能擁有多個代理,每個代理在不同領域有其專長,比如在推特、Discord、研究等不同的資料來源中蒐索資訊。

  • 這些代理之間會交流,找到最佳答案,然後我們會評估這個答案是否符合用戶的問題。 在這個框架下,我們現時使用ChatGPT作為底層的大模型,但同時也在探索微調自己的模型或完全自主訓練我們的模型。

ChatGPT是一個預訓練的模型。 它可以利用自身的知識庫回答用戶的問題,但是對於超出其知識範圍的內容,它就無法回答。 我們和ChatGPT的對接管道是利用它的語義理解和邏輯推理能力,讓它學習當前正在發生的事件,這就是所謂的上下文學習。

我們需要優化的內容很多,囙此有必要使用代理網絡。 對於某些問題,我們可能需要使用更複雜的模型,如GPT-4,而一般來說,比較簡單的模型就可以滿足需求。 這與人類在處理資訊時根據不同情况調用不同的認知能力類似。 對於深度文獻,我們可能需要高度集中去理解,而對於簡單問題,則更容易獲取答案。

同樣地,在資料庫的層面,我們會根據需求方的網絡來運行。 未來我們可能會將資料庫也納入去中心化管理,這樣能更高效地進行擴容。

在數據的清洗、標注和處理過程中,我們希望與用戶共同創造價值,因為數據對於任何AI公司來說都非常重要。

在Web3的環境下,我們重視數據的所有權,囙此希望用戶能參與到資料處理過程中,與我們共同打造我們的產品。 只有用戶越多地使用,我們的模型能力才會更加强大。 用戶體驗也會更好,進而吸引更多用戶使用產品,而大家也能在這個過程中分享經濟收益,這是我們希望實現的共創理念。

TechFlow:
Kaito如何幫助用戶應對區塊鏈行業中的虛假資訊並保證數據質量?

Yu:

我們現時的重點工作有三個方面。

首先,我們對信息源進行篩選。 以推特為例,我們利用社交圖譜的方法來篩選用戶以排除垃圾資訊。

其次,我們注重提供資訊的來源。 平時用戶使用大型語言模型,如ChatGPT時,用戶並不知道搜索結果是如何生成的,而我們為搜索結果都標注了資訊來源,以幫助用戶更好地判斷資訊的可信度。 這一點是我們在傳統大語言模型上做出的重要科技優化。

最後,我們希望能與用戶共創。 如果用戶在我們的平臺上發現無用或虛假資訊,我們也會提供一個迴響機制,讓用戶參與其中,共同提高資訊的質量。

去中心化助力人工智慧

TechFlow:
你如何看待AI
在Web3時代的發展潜力,特別是關於其自我學習和資料共用的能力? 同時,您認為區塊鏈的哪些覈心特性可能對AI的未來發展產生影響?

Yu:

OpenAI和區塊鏈之間實際上沒有直接關係,OpenAI是一個非常重要的AI產出。 其訓練模型是通過大量數據和文獻進行訓練,並且人工標注也是通過雇傭和人來進行的,訓練過程是中心化的運營。 而Web3在其本身可能打開了一個新的格局,並且具有顛覆性。 現在,
有一些人還沒有完全意識到Web3的顛覆性內核

人工智慧的潜力

最近,人工智慧領域的教父Geoff Hinton指出:“ humanity is just a ' passing phase' in the evolution of intelligence”。 ChatGPT儘管已經非常厲害,但依然只是AI產物的一小部分。 所以長遠來看,人工智慧產業有非常大的發展潜力。

不同於我們人類,AI同一模型的多個副本可以共亯新學習到的東西,這是AI的潜在優勢。

現階段,AI尚未完成自己的使命,但我相信它的未來不可限量。 其中,有一項重要的假設:AI的發展不可能放緩,因為發展AI有著强大的驅動力,即使一個國家放緩了AI的研究,其他國家也會繼續推進AI科技的發展。 囙此,AI的發展趨勢將是穩定、持久、而且不可遏制的。

區塊鏈的内容

在這個過程中,區塊鏈的覈心是什麼? 公平、可信、穩定和個人掌控權,我認為這些是區塊鏈最重要的覈心,因為任何中心化的組織都有可能帶來巨大的危險。 這也可以解釋為什麼馬斯克對於OpenAI已經變成了Close AI感到非常不滿。

在某種程度上,我能理解他的觀點。 然而,在這個框架下,如果我們能够從另一個角度對這些東西進行一些限制,比如數據的所有者,或者其他方面的限制,那麼我們整個系統將會有一個比較强大的負反饋原則。

這個思考可能更多是哲學性和抽象性的,但我認為有很多可以驗證的方向。 Web3在AI市場崛起之後變得越來越重要,我認為這是最近我得到的一個思考。

時間將揭示真正的去中心化

在Web3中,我認為本質上並沒有太多的中心化因素,它是一個非常去中心化的東西。 比如行業中有一些負面的例子,從去年到現在發生了許多災難性的事件,比如FTX的問題,還有一些新聞報導,或者是USDC的Depeg事件,它們本質上都涉及到中心化本質。

但真正完全去中心化的東西,比如比特幣和乙太坊等協定,運行非常穩定,它們本身有一個非常强的服務原則,這是非常重要的。 而在剛才講到的一些衍生出來的東西中,可能還包括公平的社區共創等,這些都是在非常去中心化的基礎上產生的。

傳統媒體與
AI
搜尋引擎
的關係

TechFlow:
AI
搜尋引擎
將如何影響媒體行業? 你認為AI能够取代媒體,讓每個人都能創造高品質內容嗎?

Yu:

搜尋引擎
和媒體之間本質上是一個上下游的關係,就好比媒體是合作引擎信息源的一部分,這是最本質的關係。

在大型語言模型出現之前,搜尋引擎一直存在,甚至包括國內的今日頭條等媒體聚合平臺也在使用AI公司進行一些淺層的快訊、梳理和總結等工作,這些都已經應用了AI的能力。

但我認為一些東西永遠不會或者不太會被取代,例如一些專有的資訊,比如專訪、調查報導等,這些都是媒體的獨家價值。

區塊鏈私有數據的隱私保護與數據共創

TechFlow:你能分享一下就是對未來鏈上數據和行為隱私保護的看法。 Kaito有什麼策略來應對這些挑戰?

Yu:

我認為這個話題本身是非常重要的。

在這個問題上,我們是一個中立的引擎,簡單來說,無論是在互聯網上還是區塊鏈上,我們會收錄任何公開的資訊。 但是,對於私有或受保護的資訊,我們現在及將來都不會進行收錄。 因為這些資訊並非所有人都能够訪問。

在共創數據的過程中,我們非常希望站在區塊鏈和人工智慧的交叉點上,與用戶一起共同努力,創造新的數據價值。 我們將目標定位為解决區塊鏈這個領域的問題,囙此本質上更像一家人工智慧公司。 我們現時的團隊成員大多來自較成熟的科技公司,擁有人工智慧相關的背景,同時他們對Web3的前景充滿信心。 我們早期的團隊成員多數來自Web3社區,聚在一起齊心協力創造我們自己的產品。

至於AI和區塊鏈的平衡,我認為在我們的發展過程中,並不存在一個明確的平衡點。 我們運用AI科技解决我們熱愛的垂直領域的需求,無論是資訊索引、分發,還是其他可能涉足的領域,都是為了服務於特定的行業。 我們運用新技術,以更有效率和好的管道提供有用的服務,將其納入相應行業中。

傳統
商業模式
Vs.基於社區共創的經濟模型

TechFlow:所以你現時團隊有考慮過的一種就是社區共建有哪些管道,就是有哪些激勵用戶的管道?

Yu:

我認為最簡單直白的管道就是讓所有用戶貢獻的數據具有一定的經濟效益,並且在監管和合規範圍內運作。 在這個平臺上,每個用戶的蒐索、瀏覽和行為都幫助優化平臺的模型,從而提供更好的用戶體驗。 通過這種正向激勵,我們鼓勵每個用戶積極參與社區共創。 這正是我們的目標所在。

現時,Kaito有兩種商業模式。 一種是機构版,採用傳統的訂閱管道,為機构提供付費服務。 另一種是大眾版,完全免費,但可能會存在一些額外的付費功能,例如類似於ChatGPT的模式。 另外,我們還提供一些數據的API服務,為行業中的其他去中心化協定提供數據支持,這是另外一套商業模式。

TechFlow:
你們是否考慮採用其他激勵管道或使用代幣收款來吸引用戶?

Yu:

我認為這實際上是兩個問題。

首先,我們是否需要代幣,以及在整個生態中代幣有什麼用途?

我覺得代幣是有價值的。 雖然如果沒有代幣,項目肯定可以正常運轉,只要能提供出色的產品和自給自足的盈利模式,比如通過數據或廣告收入,就可以實現良好的營收。

但是對我們來說,更令人興奮的是在早期階段就能打造出與社區共創的概念。 在這樣的框架下,我們認為需要代幣。

具體如何操作,或者後續的想法,需要根據發展情況來决定。 至於訂閱等收費模式是否可以通過代幣來支持,這可能是另一個話題。
對我們而言,代幣的好處顯而易見,無論是從效率還是商業價值的角度來看,代幣都比其他管道更簡單。

另外,從商業角度來看,我們可以完全跳過協力廠商仲介,不必依賴像Stripe這樣的支付公司。 然而,我們也面臨一個挑戰,就是在整個行業中,我們還沒有找到特別好的協力廠商服務公司,能够讓我們輕鬆與所有合規平臺,包括政府和稅務機构進行申報。

在當前行業階段,這可能是我們遇到的一個問題。

TechFlow:那麼就是在代幣的社區治理方面,你最近有研究到什麼比較有意思的經濟模型嗎?

Yu:

最近在加密行業發生了一些大的變化,特別是在代幣治理方面。 以前很多代幣被視為純粹的治理代幣,但現在越來越多的代幣能捕獲經濟價值,例如DYDX等。
這引發了一些擔憂,大家希望能實現一個社區能捕獲經濟價值的狀態,而不僅僅是治理價值。

深潮獨家新聞

TechFlow:
最後一個問題就是能否提供給我們一些獨家內容,比如揭示一下kaito即將到來的里程碑和發展計畫,有沒有什麼我們能期待看到的特別激動人心的新功能或新合作?

Yu:

我們計畫在未來使用戶能够以全新的管道應用搜尋引擎,比如通過截取價格走勢圖進行分析,甚至與鏈下信息源進行互動,實現多模態蒐索。

我們的願景是為所有人提供一個完全不同的、最好的、最便捷的訪問所有相關資訊的管道。 我們相信未來的潜力非常巨大,我們將逐步完善並實現這個願景。 我們希望未來的搜尋引擎能够帶來與現在截然不同的全新體驗。 現時整個行業仍處於早期階段,我們正在探索如何更好地將大語言模型與搜尋引擎結合,以提供簡單而顛覆性的用戶體驗。

搜尋引擎的進步和創新已經產生了翻天覆地的變化。 十幾年前,旅行者沒有Google地圖,在探索世界時只能依賴於Lonely Planet這樣的紙質指南書籍。 現在隨著Google搜尋引擎的出現,我們現在已經可以輕鬆便捷地蒐索到所需的資訊。 然而,我們相信未來的搜尋引擎將以一種超越我們的想像力的管道,帶來更加激動人心和顛覆性的變革。

引用:

  1. https://www.kaito.ai/

  2. https://www.youtube.com/watch?v=rGgGOccMEiY&amp ; t=21s

聯系郵箱:0xniumao@gmail.com