Chainbase 硬核解讀: 融資 1500 萬美金,最大的全鏈數據網絡,讓 Crypto 與 AI 互相成就
Chainbase 旨在將所有區塊鏈數據整合到統一的生態系統中,成為 AGI 時代最大的可信的、穩定的、透明的數據源。
撰文:深潮 TechFlow
眼下的加密市場,逐漸進入整理期。當敘事沉寂、存量專案們乏善可陳時,新的 Alpha 機會在哪裡?
向外看,AGI時代浪潮已至;向內求,AI 仍是貫穿全年的加密敘事,也是吸引注意力和流動性的香餑餑。
只不過,現在你需要在 AI 賽道中,更加細緻的去尋找 “結構性”機會:
圍繞 AI 的三個基本要素:算力、算法和數據,前兩者已經跑出瞭如 Render Network 、IO 和 Bittensor 等頭部專案,且類似專案扎堆已成紅海;而數據類專案,更多朝著 DePIN 發展。
真正將 Web3 原生鏈上數據有效利用的方向,仍是發掘 Alpha 的寶地。
而一級市場嗅覺靈敏的資金們,早已開始用腳投票:
最近重量級融資再現。數據賽道專案 Chainbase 宣佈完成 1500 萬美金 A 輪融資,Matrix Partners 領投,並得到某互聯網公司戰略投資、Hash Global、Folius Ventures、JSquare、DFG、MaskNetwork、Bodl Ventures、Bonfire Union Ventures 等知名機構共同參與。
資金的流向在一定程度上意味著對敘事的預判和項目的看好,那麼, Chainbase 為何受到資金青睞?
TLDR : 最大的全鏈數據網絡,一種開放的數據堆棧技術
這裡有一些太長不看版的關鍵亮點,助你快速瞭解 Chainbase。
-
更高維度的產品:談起鏈上數據,慣性印象是與聰明錢分析、看板構建、數據查詢…Chainbase是一個在更高維度的 Infra(基礎設施)產品,這些應用都能通過它實現,但 Infra 能做的遠不止這些。
-
最大的全鏈數據網絡:這個更高維度的座標軸,始於其最大的"全鏈數據網絡"—將整個廣闊、碎片化的加密世界任何鏈中的任何數據,甚至是鏈下數據進行匯集與加工,成為一座價值亟待開採的數據金礦;
-
紮實的專案背景/團隊/背書:Chainbase 吸納了15000+開發者和8000+專案,處理著 5000億次的全鏈數據調用,團隊成員來自頂尖科技公司數據相關專業領域,且除了上述參投資方外,產品架構上到了頂級合作方支持(Eigenlayer 提供經濟安全,Cosmos 提供共識安全)
-
自洽的數據網絡實現邏輯:和"先有鏈再有應用場景"的公鏈發展方式不同,Chainbase 一開始就瞄準技術開發者以及普通用戶,提供高質量數據;在生態和用例成熟後構建自己的數據網絡。
-
Crypto Natvie 的AI大語言模型:和業內絕大多數套殼gpt的專案不同,Chainbase 自研的 Theia AI 模型,利用原生的高質量onchain數據進行訓練,且可相容多模態交互,有成為 Web3 X AI 全景奠基石的潛力。
當所有的鏈上下數據都能夠被貢獻併發揮自己應有的價值,當所有的人都可以通過數據+AI找到適合自己的使用場景時;
Web3 開始有了自己的 On-Chain Data Infra。這個市場的想像力變得巨大,Alpha 的氣息呼之欲出。
正如預言機之於DeFi,數據之於 AI,當全鏈數據跳起"智慧之舞",加密舞臺是否會上演一出新的好戲?
拿好早鳥票,我們帶你進行一次“提前探班”:對 Chainbase 這個最大的全鏈數據網絡的產品機制、適用場景、AI能力和經濟模型,進行搶先解讀。
鏈上數據,尚未高效利用的"暗知識"
想要搞懂 Chainbase,理解其業務邏輯,首先需要明白數據的價值。
早在2017年,《經濟學人》的封面文章提到,“數據已經取代石油,成為新時代世界最有價值的資源”。而當時間來到24年,隨著AGI(通用人工智慧)趨勢的崛起,數據這個最有價值的資源,已然進一步被 AI 高效開採與利用:
OpenAI 從 45TB 的原始數據中提取570G數據來訓練 GPT3,海量,迅速,即時,且成體系,更不用說GPT4;數據質量和數量都在不斷擴張,為 AI 的上佳表現創造條件。
與之相比,加密世界中的鏈上數據,仍未得到高效的利用。
如今 Web3 裡的數據更像是在不同的角落裡躺著。大部分加密專案,所做的無非是讓躺著的數據站起來 — 比如通過傳統的資料庫模式,利用索引查詢鏈上數據;又或者是通過 Text to SQL 的方式,將傳訊需求變成一段 SQL 代碼並呈現查詢結果…
你用到的鏈上數據,既沒有被智慧的分析,也不能做到即時反饋,更無法遍歷加密世界所有鏈的所有角落,成體系的像 GPT 那樣給你輸出知識與智慧。
我們只能用鏈上數據客觀機械的回答"是什麼",但智能化的"怎麼做"仍沒有答案;換言之,鏈上數據看起來明牌可見,但實則仍是沉睡的"暗知識"。
不夠智慧,不夠主動,不夠有創造性,更不夠去中心化。
多數加密專案在利用數據時,社區的能動性卻沒有得到最大程度的發揮。
加密玩家們藏龍臥虎,本可以從自身投研需求出發自己打樣,告訴大家怎樣的場景應該怎樣利用數據,但目前看這種去中心化的"知識共建",仍不夠普遍。
此外,鏈上數據從整理到加工,從輸出到利用,整個流程中也很難有社區參與的空間,怎麼最大化調動加密生態中不同參與者的積極性,去構建一個更大的數據網絡,仍是一個有吸引力且應該被實現的議題。
因此,我們需要高效的利用鏈上數據,更需要以去中心化的方式去利用數據:
-
從 SQL查詢、索引式、非即時的利用方式”升維“,變得更加智能化;
-
從 OpenAI 那樣的集權集中, 變得更加透明、可信、開源與社區共建。
而這,也是 Chainbase 登臺表演的時刻。
萬鏈歸一,全鏈數據的登臺之路
從以上背景出發,你就更容易理解 Chainbase :
構建世界上最大的全鏈數據網絡,旨在將所有區塊鏈數據整合到統一的生態系統中,成為 AGI 時代最大的可信的、穩定的、透明的數據源。
一個更容易理解的描述是,任何鏈上的任何數據,都可以為任何人更加智能化的利用。
如果你一時半會無法理解"全鏈數據網絡",不妨先對全鏈數據拿起顯微鏡觀察。
首先,全鏈數據到底有多"全"?
每個鏈都有自己的架構和數據,Chainbase 更像一種萬鏈歸一,將 BTC、ETH等幾十條主流的L1/L2,包括 EVM 和非EVM鏈的所有數據,都被納入整合到統一的生態中。
其次,這個全鏈數據,裡面到底有什麼?
答案是,關於區塊鏈的一切。
我知道這個答案過於抽象,如果剖開細看,那麼你大概會看到這麼幾種類型的數據:
-
Raw數據:最初記錄在區塊鏈上的數據,如區塊、合約、合約、交易…
-
Decoded解碼數據:從原始數據中提取數據並轉換為人類可讀的格式,例如不同DeFi協定的交易情況…
-
Abstracted抽象數據:高級數據,提取關鍵資訊和指標,使其更適合業務分析和決策。如代幣、價格、銘文&符文等更容易理解或指定需要分析的地方。
這就有點像你想做菜(用數據做分析),那麼不同食材從純生(Raw)到半熟(Abstracted),都可以為你所用。
值得一提的是,Chainbase 數據網絡中的這些全鏈數據還做到了即時提供(刷新間隔小於3秒),意味著不僅食材生熟任君挑選,食材本身也保持新鮮。
而這也是目前大部分加密數據專案無法做到的數據保鮮度。
那麼,這麼多全鏈數據從何而來?
對鏈上數據來說,任意鏈的 NODE operator 或者 RPC provider,都可以接入Chianbase 網路,通過 Chainbase 產品架構中的公開數據網關(open data gateway)提供不同鏈的上述數據。
而這也構成了 Chainbase 的數據入口,即 Data Accessibility Layer。考慮到其實現需要一定程度的技術理解,我們會在後文的架構分析中詳細描述,在此僅作功能說明。
最後,這個全鏈數據有多大?
從 Chainbase 官網的公開數據來看,目前網路中已經存儲了 PB 級別的數據量,並且每天處理著 1.1億- 1.5 億次的全鏈數據調用,而累計調用總量已經超過了總共 5, 000 億次。
而這些數據調用的源頭,源自於已經合作的 15000 + 開發者和8000+ 的加密專案方。
在我們看不見的加密世界深處,一個龐大的全鏈數據網絡已然形成。
從數據體量看,最大的全鏈數據名副其實。但背後提供支持的全鏈"網路"概念體現在哪裡?
站在整體視角上,前文所述的 Data Accessibility Layer 首當其衝,吸納著全鏈中的一切數據,承擔著入口的職責;
其次,全鏈數據的處理並非 OpenAI 和雲廠商那樣的中心化處理,Chainbase 搭建了一個代幣激勵驅動、社區主導、多方共同參與各司其職的處理結構, 對數據進行加工;
最後,上文所述的鏈上下原始數據經過處理,為 Chainbase 的數據網絡可見,網路中的開發人員可以基於原始數據構建"手稿",用於定義、提取、轉換和處理鏈上數據,從全鏈數據中提取有價值的資訊進行分析。
由此觀之,全鏈數據從幕後到登臺,經歷了蒐集,處理,呈現,利用等多個環節;為數據的利用提供"道"層面的支持,而具體的"術",包括但不限於:
使錢包能夠從單一介面管理和查看多個區塊鏈上的資產,提高用戶的便利性;
安全領域:跟蹤攻擊,提供安全警報並進行深入的安全分析以保護區塊鏈網路;
社交領域:構建社交平臺,讓來自不同區塊鏈的用戶可以無縫互動和共享內容;
DeFi: 使 DeFi 平臺能夠支持跨不同區塊鏈的借貸,增加流動性和靈活性。
注意以上這些僅是示例,作為一個基礎設施產品,Chainbase 的好處在於— 這些應用都能通過它實現,但 Infra 能做的卻遠不止這些。
4層雙共識架構 ,井然有序的舞臺之基
全鏈數據能夠在臺前起舞,背後必然離不開臺後的支撐。
Chainbase 的4層雙共識架構數據網絡,實際上承擔了4根舞臺臺柱子的工作 — 每層都有自己的職能,來共同為全鏈數據的利用搭臺唱戲,同時保證一切幕後工作井然有序。
在講述全鏈網路時,前文已經粗淺的涉及到了這一架構,接下來讓我們以更加詳細的視角進行分析。
既然 Chainbase 的一切業務都在圍著數據打交道,那麼我們不妨以數據的進入、處理和輸出這個過程為切入點,自下而上看看這4層架構到底都在幹什麼:
-
數據獲取層:全鏈數據的入口,解決數據怎麼進入網路的問題。
-
共識層:數據處理時,當數據狀態發生改變,那麼去中心化網路需要以某種方式,對數據狀態的變化達成共識,這也是大部分加密專案熟悉的"共識老味道"。
-
執行層:既然數據處理業務能夠發生,那麼必然需要通過各種方式來保證數據處理被安全且高效的執行。
-
協處理層:你可以通俗理解成數據輸出的地方,其中涉及到數據如何輸出、輸出給誰用,用在什麼地方等問題。而其中的協處理,則意味著社區共同協作來生成高質量數據,應用於各種場景。
從以上邏輯出發,你很容易理解數據怎麼進來,怎麼加工,怎麼利用,Chainbase 的4層架構其實就在各司其職。
接下來,我們可以針對這4層做逐層拆解,一覽每一層的工作模式和存在價值。
-
數據獲取層:全鏈數據的Rollup,鏈下數據的安全集成
該層是Chainbase的數據入口。
對鏈上數據來說,任意鏈的 NODE operator 或者 RPC provider,都可以接入Chianbase 網路,通過 Chainbase 產品架構中的公開數據網關(open data gateway)提供不同鏈的上述數據。
對於鏈下數據來說,例如社媒用戶行為的數據等,同樣也可以通過ZK等可信方式,由公開數據網關進入數據獲取層,並以 Rollup 的方式接到 Chainbase 網路中來,在保證隱私的同時獲取數據。
本質上,這更像一個去中心化的數據湖,起到沉澱數據的作用。同時,ZKP保證傳上來的數據是對的但隱私是被保護的;而多節點共同參與數據存儲和驗證(SCP)的方式,則保證了數據的可靠性與組織方式的去中心化。
-
共識層:由Cosmos 提供的 CometBFT 共識機制,保證狀態同步
任何一個加密產品其實都面臨著一個經典問題:在完全公開且信任有限的環境下,怎麼對一件事情的狀態變化達成一致?
具體到Chainbase中,這件事情就變成了數據處理狀態的變化。
如果要對狀態變化達成共識,那麼必然少不了區塊鏈的存在和共識算法的使用。Chainbase 採用的是 Cosmos 的 CometBFT 共識算法,在此不做過多的技術科普;
我們只需知道這是一種改良的拜占庭容錯算法,至多能夠容忍網路中三分之一的節點出現故障或惡意行為,即使部分節點作惡,同樣也能夠達成共識。
這種寬容閾值兼具效率與彈性,與數據處理這種較大數據負載下高效達成共識的場景適配。
-
執行層:EigenLayer + 鏈上資料庫,保證性能的同時引入額外的經濟安全性
當 Chainbase 網路中有數據調用需求了,執行層就有了用武之地。
任何對數據的操作,其實都需要"場地",即資料庫。Chainbase 使用了自家的 Chainbase DB 鏈上資料庫,專門用於支撐數據和任務的並行處理,以面對可能的高併發調用需求,從而保證整個網路的性能和吞吐量。
但數據能夠被執行,並不意味著它被執行的足夠安全。
因此,Chainbase 的解決思路,是從 EigenLayer 那裡獲得經濟安全性。
利用 EigenLayer 繼承的特性,Chainbase 構建了自己的主動驗證服務(AVS);這種做法可以使得 Chainbase 獲得 ETH 質押者從以太坊繼承的強大經濟安全性,來保證自家數據處理服務的安全。
-
協處理層:社區共建,多個參與者各司其職,將數據價值最大化輸出
這一層離我們的直覺最近,能夠看見數據是如何被利用以發揮價值的。
在加密世界中,不同應用場景會產生大量多樣的數據,·如何從這些孤立而多樣的數據中提取價值是協處理層需要解決的問題。
Chainbase 這層設計的主要思路是,讓大量開發者進行協作,積累知識,從而產生集體智慧。
而這種協作,落到具體的功能上是:
-
知識貢獻:用戶可以將他們在數據處理和專業任務模型方面的專業知識貢獻給輔助運算器層。這種協作環境利用集體智慧來增強網路的功能。
-
知識資產化:輔助運算器層將知識的貢獻轉化為資產,管理這些資產的分配、流通和交易,確保貢獻者的知識和努力得到回報。
-
CBT代幣生態系統:網路激勵結構不可或缺的一部分,促進支付、結算、質押和治理,後文會進行詳述。
如果通俗來說,協處理層可以實現的效果是,比如我需要一份"分析鏈上釣魚騙局"的菜譜,開發者們則會針對性的提取這一需求需要哪些數據,組合打包成模板,供大家使用。
最後,Chainbase 網路也有普通用戶參與的空間。
一般的加密玩家們可能並不具備什麼數據分析知識,但他們仍然可以以自然語言的方式與Chainbase網路進行交互,獲得各種關於加密世界的洞見和情報;
直觀來看,這更像一種加密版的ChatGPT,但並不是套皮介面後直接用了GPT的內核;相反,Chainbase 在協處理這一層,面向普通用戶則給了一個更大的殺招:
Theia,用海量全鏈數據,訓練的一個加密原生的AI大語言模型。
Chainbase 在處理數據業務的同時,利用70億通用大語言模型參數+2億 crypto 參數訓練出了Theia。
注意,加密原生的意思是指,在GPT鞭長莫及的加密世界裡去塑造一個能夠即時感知的智慧體,理解加密世界時時刻刻正在發生什麼。
套皮 GPT 雖然也能用,但並不能理解原生的、加密的上下文語境,也不能從它那裡獲得即時、低延遲的加密原生內容。
當前大部分鏈上數據的AI使用方式,是把schema餵給AI之後幫助寫SQL 語句查鏈上數據,仍只停留在非智慧的查詢階段,從資料庫中撈數據的階段,本質上仍是索引模式的Plus版本。
而 Theia 的工作模式,本質上是智慧模式 — 基於已有的海量鏈上下數據,做更加高效的思考、分析與回答,具備主動性、創造性和即時性,與目前的鏈上數據產品不在一個維度。
於是,一個更適合加密人群體質的大語言模型出現了。
日後,資訊優勢可能不再是幣圈"科學家"的專利,Theia 將AI的智慧能力解鎖到了更大的範圍群體,普通人也可以通過AI模型來使用原本專業和硬核的全鏈數據網絡。
通過將加密原生的大語言模型Theia 鏈接到外部資源(RAG), 使生成式AI 輸出更準確的回答。
用戶僅需要與友好的問答式介面交互,即可得到更加智能化的回應,而這些回應基於從廣泛的鏈上和鏈下數據以及時空活動中學習加密模式,以及對加密模式的因果推理。
例如,當你只是隨意詢問“最近熱門的DeFi協定是啥?”的時候, 如何定義熱門,如何用數據佐證熱門,對這些熱門協定的排序和呈現…都由 Theia 替你完成,並給你一個最後的綜合結果。
而數據科學家也能利用 Theia 構建任務模型,授人以漁,例如:
-
安全任務模型–專面向安全領域,比如讓AI評估加密安全漏洞,即時威脅監控以及合規性審計
-
交易任務模型–如分析市場趨勢、策略優化和風險管理
-
意見任務模型–追蹤社媒情緒、熱點趨勢和事件影響力等等
在AI能力這件事上,授人以魚始終不如授人以漁。
從目前的公開資訊來看,Theia 能做市面上所有加密AI產品能做的事,底氣和實力來源於海量數據及模型調優;這更像授人以漁的做法,而不是面向具體場景給一條單獨的魚。
同時,通過協處理這層也能看到,全鏈數據們聯袂演出,讓加密原生模型 Theia 跳起了智慧之舞。加密世界獲取資訊、情報和見解的方式或將被顛覆和革新,AI也在幫助加密變得更好。
-
層中的雙共識:效率與安全並重,兼顧經濟權益
在瞭解了 Chainbase 的4層架構之後,再看其中的雙鏈,就變得非常好理解了。
由於引入了 Cosmos 和 EigenLayer,使得圍繞數據處理本身和處理狀態變化這兩件事,有了更多的保障。
EigenLayer 在執行層中起作用,AVS承擔執行任務,繼承以太坊的經濟安全性;Cosmos 在共識層起作用,優化的BFT算法對數據處理的狀態變化達成一致,且保證一定程度的容錯。
更為重要的是,雙共識的引入自然也帶來了經濟上的雙幣質押機制,緩解傳統POS網路的死亡螺旋問題:
一般情況下,當某個項目單幣的價值開始下降時,如果專案採用POS的設計,那麼整個網路的安全性也會降低,質押代表的TVL減小;同時基本面惡化又會進一步壓低代幣價格,造成惡性循環,使得專案安全不斷萎縮。
而在雙共識設計下,Chainbase 既有專案自己的CBT代幣用於質押,也有以太坊生態的各類LST代幣可以質押,增加網路經濟安全性的同時,盤活 LST 資產的價值,吸納更多專案外的流動性進入。
不過既然談到了專案代幣CBT,雖然官方暫未公佈具體的TGE時間和代幣經濟學,但整個代幣的效用和功能是清晰可見的,也可以為我們的投研提供參考。
一言以蔽之,CBT 其實是通過經濟激勵,保證網路參與者各司其職的關鍵。
-
Chainbase網路運營節點,確保數據處理任務的順利進行,獲得80%的數據查詢費用(用戶使用Chainbase網路利用數據,需支付費用)+ 運營商池100%的獎勵(由chainbase專案設立);
-
驗證者驗證交易、確保數據完整性並維護網路穩定性,獲得100%的區塊獎勵;
-
開發人員/數據科學家:編寫手稿確保數據集能夠被有效地處理和查詢,提供更好的數據處理邏輯,獲得15%數據查詢費用獎勵
-
委託者:將代幣質押給驗證者和運營商來分享獎勵,類似以太坊的委託質押協定中的收入
綜合來看,Chainbase 的這套4層雙共識架構,是整個數據網絡的核心,讓數據處理的整個過程順暢、高效的完成,也兼顧了經濟效益和安全性。
一種精妙、自洽且清晰的安排,為全鏈數據登臺演出的打下牢固的地基。尤其是協處理層孕育加密原生AI模型的舉措,也讓整個數據的利用上了一個新的臺階和廣度。
從數據到智慧提供,加密與 AI 互相成就
在研究完 Chainbase 的產品後,筆者覺得它正在進行一種角色轉換,即從純的數據提供者,轉變為支持AI的全鏈數據網絡。
這種角色的轉換,並不是單純換了個空泛的敘事,而是意味著它在如何利用加密世界的數據這件事上,邁出了更加堅定的一步。
從產品上你能明顯感覺到確實不僅僅在提供數據,更是為數據的智能化利用,為形成智慧創造更好的條件。
在知識管理領域,有一個經典的 DIKW 模型如下圖,用來表示知識獲取的層級與方式;而這也不禁讓我們對整個加密行業關於數據和資訊的利用,產生了更加深入的思考:
從這個模型出發,當前的多數加密專案,最多隻是在提供數據和資訊,遠未形成知識和智慧;
而主動性和創造性,才是鏈上數據利用的終局;AGI 時代 GPT4 已經在提供知識與智慧,加密世界的數據利用仍舊任重道遠。
從數據 — 資訊–知識–智慧,加密數據可以讓AI變得更好,反過來AI能力為加密業務提供更多智慧和洞見,提升加密業務的效率和體驗。
Crypto 和 AI,或許本就應當相互成就。
對 Chainbase 本身而言,筆者也有著更多的期許。
當前專案確實也已經有了足夠的數據量,Theia 模型也初見端倪,同時官推顯示測試網進度50%,正式產品可以期待在今年內發佈;
全鏈數據的威力,正在等待著進一步的釋放,Chainbase 或許會給加密世界帶來經濟學意義上的“帕累託改善”:
加密全局迎來效率提升,而不會以犧牲某些局部的利益為代價。
在一輪加密數據利用的新範式下,沒有人會是輸家。
歡迎加入深潮TechFlow官方社群
Telegram訂閱群:https://t.me/TechFlowDaily
Twitter官方賬號:https://x.com/TechFlowPost
Twitter英文账号:https://x.com/TechFlow_Intern