推理速度達英偉達 GPU 的 10 倍,剛獲 6.4 億美元融資的 Groq 是什麼來頭?
以快著稱的 AI 晶片獨角獸 Groq,官宣融資 6.4 億美元,最新估值也暴漲到 28 億美元。
撰文:元宇宙之心
8 月 5 日,美國人工智慧晶片初創公司 Groq 官宣獲得 6.4 億美元最新融資,公司估值也來到了 28 億美元。
此輪融資由華爾街資管巨頭貝萊德的 BlackRock Private Equity Partners 領投,思科的 Cisco Investments 和三星電子的 Samsung Catalyst Fund 也參與其中。Groq 背後的技術創新實力和財力支持可見一斑。
01.1 分鐘專案速覽
1.專案名稱:Groq
2.成立時間:2016 年
3.產品簡介:
Groq 推出的新型 AI 加速晶片 LPU,專為大語言模型量身定製,具有高速推理性能。其晶片性能表現比常規的 GPU 和 TPU 提升 10 到 100 倍,推理速度達到了 NVIDIA GPU 的 10 倍。
4.創始人團隊:
-
Jonathan Ross:創始人兼 CEO,谷歌 TPU 專案核心研發人員
-
Yann LeCun:圖靈獎得主、深度學習三巨頭之一,擔任技術顧問
5.融資情況:
-
2017 年,Groq 在成立初期獲得了種子輪融資 1030 萬美元;
-
2018 年,Groq 在 A 輪融資中籌集了 5230 萬美元,由 Social Capital 領投;
-
2020 年,Groq 在 B 輪融資中籌集了 1.5 億美元,由 Tiger Global Management 領投,參與者還包括 D1 Capital Partners 和 The Spruce House Partnership;
-
2021 年,Groq 在 C 輪融資中籌集了 3 億美元,由 Tiger Global Management 和 D1 Capital Partners 繼續支持;
-
Groq 在最新一輪融資中籌集了 6.4 億美元,由 BlackRock Inc.基金領投,思科、三星跟投。
02.創新驅動的 AI 處理器先鋒
Groq 的創立過程可以被視為創新和技術突破的一個典範。
Ross 在創辦 Groq 之前,曾在谷歌擔任工程師,負責推動深度學習和計算架構方面的研究。在谷歌工作期間,Ross 發現傳統計算架構在處理現代 AI 任務時存在顯著的性能瓶頸,特別是在深度學習和大規模數據分析方面。
傳統的 CPU 和 GPU 無法滿足這些任務對並行計算和低延遲的高要求。這種認知促使 Ross 離開谷歌,創辦一家專注於突破傳統計算限制的公司——Groq。
Groq 的創始團隊在公司創立初期集中精力於硬體設計和技術研發。團隊成員來自於高性能計算和半導體領域的頂尖人才,具備豐富的經驗和技術背景。早期的工作包括處理器架構的設計、原型的開發以及性能測試。
Groq 的技術理念圍繞著一種創新的處理器架構展開,旨在提供比現有處理器更高的計算性能和效率。公司的目標是設計一種能夠突破 CPU 和 GPU 限制的硬體平臺,以滿足 AI 和 HPC 領域對計算能力的不斷增長的需求。
隨著技術的成熟和市場需求的增加,Groq 開始擴展其業務範圍,進入了數據中心、雲計算和邊緣計算等領域。目前,該公司已與多個行業領先的技術合作夥伴建立了戰略合作關係,推動其產品在全球範圍內的應用。
03.重塑高性能計算
自創立以來,Groq 憑藉其突破性的技術和卓越的產品,迅速成為人工智慧(AI)和高性能計算(HPC)領域的先鋒。
Groq 的技術核心在於其創新的處理器架構。與傳統的 CPU 和 GPU 處理器不同,Groq 的設計理念著眼於提升計算能力和效率,特別是針對現代 AI 和數據密集型應用的需求。
-
高度並行化設計:Groq 的處理器架構採用了極高的並行化設計,集成了大量計算單元,能夠同時處理大量的數據。這種設計不僅提升了計算能力,還降低了數據處理的延遲。
-
簡化數據路徑:傳統處理器常常面臨數據傳輸瓶頸,Groq 的架構通過優化數據路徑和高速緩存設計,顯著減少了數據傳輸延遲。這樣一來,處理器能夠以更高的效率處理大規模數據集,滿足 AI 訓練和推理過程中的高性能要求。
-
靈活的配置選項:Groq 提供了多種配置選項,允許用戶根據具體應用需求調整計算資源。這種靈活性使得其處理器可以廣泛應用於不同的計算場景,從數據中心到邊緣計算環境。
Groq 的 AI 加速器是其產品陣容中的核心組成部分,專為加速深度學習模型的訓練和推理而設計。其優勢主要體現在以下三個方面:
-
高吞吐量和低延遲:AI 加速器通過提高處理能力和降低延遲,顯著加快了機器學習模型的訓練速度。這對於需要處理海量數據的應用,如圖像識別和自然語言處理,尤其重要。
-
優化算法支持:Groq 的加速器優化了各種機器學習算法,包括捲積神經網路(CNN)、迴圈神經網路(RNN)等。通過硬體層面的優化,加速器能夠高效執行這些複雜的計算任務,提高模型的訓練效率和推理性能。
-
擴展性和可配置性:加速器設計支持高擴展性,能夠應對不同規模的數據處理任務。用戶可以根據需要配置多個加速器,構建高性能計算集群,以滿足大規模 AI 應用的需求。
憑藉高度並行化的設計、優化的數據路徑、以及強大的 AI 加速能力,Groq 為數據中心、雲計算和邊緣計算等多個領域提供了卓越的技術支持。
隨著技術的不斷發展和產品的持續優化,Groq 正在為現代計算需求提供前所未有的解決方案,推動計算科技向更高水平邁進。
作為 AI 晶片領域黑馬的 Groq,其 LPU 晶片的高速推理能力毋庸置疑。但隨著公司估值的暴漲和市場的期待,Groq 也在面臨著一系列的挑戰與問題。
04.挑戰與機遇並存
首先便是 LPU 的容量問題,雖然在處理大語言模型時展現出了卓越的性能,但內存較小導致在實際部署時可能需要大量的硬體資源。
據分析,LPU 在運行 LLaMA 70B 等大模型時,Groq 的硬體需求和成本可能遠高於預期,這無疑增加了公司在大規模部署時的經濟壓力。
其次,LPU 的專用性雖然在特定任務上提供了優勢,但也限制了其在更廣泛 AI 任務中的應用。與 GPU 相比,LPU 的通用性不足可能影響其在多樣化 AI 場景中的競爭力。
作為初生產品與初創公司,Groq 在技術成熟度、市場認可度以及生態系統建設方面還有很長的路要走。它需要不斷優化產品,擴大研發團隊,並與行業夥伴建立合作關係,以加速技術的商業化進程。
展望未來,Groq 的發展機遇同樣巨大。隨著 AI 技術的不斷進步和應用場景的拓展,相關企業對高效能 AI 晶片的需求日益增長。Groq 若能有效解決成本和通用性問題,其 LPU 晶片有望在 AI 推理市場佔據重要地位。
Groq 公司計劃到 2025 年 3 月底前推出 10.8 萬個 LPU,這一宏偉目標若能實現,將進一步鞏固其在行業中的領導地位。Groq 如何在激烈的市場競爭中不斷突破自我,實現技術創新與商業成功的雙重飛躍,值得我們持續關注。
歡迎加入深潮TechFlow官方社群
Telegram訂閱群:https://t.me/TechFlowDaily
Twitter官方賬號:https://x.com/TechFlowPost
Twitter英文账号:https://x.com/TechFlow_Intern