誰會是下一個萬億晶片巨頭?



誰會是下一個萬億晶片巨頭?插图1

生成式AI當道,吃了第一口螃蟹的英偉達生而逢時,市值從去年的五千億美元搖身一變成為與亞馬遜、谷歌等齊肩的萬億巨頭。

賣著三十萬元一張的顯卡,數著其他科技巨頭收上來的鈔票,連續打破預期的業績印證了英偉達顯卡在數據中心AI訓練領域有多麼受歡迎。

然而,有超額利潤的地方總會招致競爭對手的沖擊,更何況是日新月異的科技賽道,AMD、英特爾,甚至準備自研晶片的科技巨頭躍躍欲試,英偉達的護城河,會由誰打破?

《福布斯》雜誌評論稱:“如果業界還有英偉達潛在的對手,那一定包括秀克姿豐和她掌管的AMD。”

如何戰勝晶片市場裡的大Boss?

這道題AMD是最有發言權的,公司曾將英特爾在數據中心和PC的份額從將近壟斷逼到剩下六成,靠的是集結了領先製程和架構、不斷追趕的CPU產品。

這一次,面對勢頭正勁的英偉達,AMD能否再度趕超?

下一個萬億晶片巨頭會是AMD嗎?


01


最初兩家企業在產品開發和市場選擇上形成錯位競爭,英偉達一直在圖像顯卡領域深耕,在高端晶片上處於領先地位。在向英偉達發起正面沖擊之前,AMD曾憑藉全新的Zen架構和臺積電7nm工藝顛覆了PC和數據中心的CPU霸主—英特爾。

目前,英偉達在GPU領域一枝獨秀,但AMD的產品架構要更豐富一些,在PC端同時佈局了X86 CPU和獨立GPU產品。相比傳統CPU,採用集成顯卡具備更強的圖像渲染能力,這為AMD日後快速進入AI加速晶片領域競爭奠定了基礎。

根據Statista,2023年第三季度PC端CPU市場中,AMD以35%的市佔率僅次於英特爾;而在獨立GPU,英偉達以超過七成的份額佔據領先優勢,同樣居次的AMD今年第二季度的出貨量佔全球的17%。

誰會是下一個萬億晶片巨頭?插图3

總的來看,在GPU顯卡領域,英偉達構建了領先算力和軟體生態的強大壁壘,用戶體驗更高,在高端旗艦市場更具優勢。

而AMD顯卡不只追求圖形渲染性能,更注重通用運算性能的提升,在入門級顯卡性價比更高,但在開發者環境中,AMD採用的OpenCL實際遠不如CUDA完善,軟體不相容的問題會影響AMD晶片的生態網路價值。

正因為AMD較早地完成了對兩種處理器晶片的佈局,在AI大模型加速普及,未來能夠塞進各種智慧型終端機硬體時,這種全面性給了AMD構建更加多元的AI產品矩陣的機會,包括融合 Ryzen AI 的 Ryzen 7040 系列 CPU、自適應數據中心平臺 Versal AI、 Alveo 加速器、第四代 EPYC Genoa 處理器,以及目前公佈即將上市的 Instinct MI300。

誰會是下一個萬億晶片巨頭?插图5

其中被認為最有希望挑戰英偉達地位,重現16年對英特爾的成功突圍,莫過於MI300。

AMD在CES 2023大會上推出了這款Instinct MI300加速器,是首款數據中心級的APU產品,AMD於2011年首創,簡單來說是將CPU與GPU封裝在一起,專門用於AI語言大模型訓練及推理,對標的就是英偉達的Grace Hopper(Grace CPU + Hopper H100 GPU)。

作為一款能與H100在AI訓練端匹敵的產品,從晶片架構、製程、算力、內存帶寬上比較,這款MI300在規格及性能上十分接近英偉達的GH系列,但軟體生態上的落後或暫時無法撼動英偉達在訓練端的客戶粘性。

誰會是下一個萬億晶片巨頭?插图7

首先看晶片架構,MI300是AMD首款結合了4 CPU與CNDA 3 GPU的產品,採用3D堆疊技術和Chipet設計,配備了9個基於5nm製程的晶片組,與英偉達 Grace Hopper的4nm製程(屬臺積電5nm體系)看齊。

MI300 晶體管數量達到1460億,多於英偉達H100的800億。MI300 配備了24個Zen 4 數據中心 CPU 核心和 128 GB HBM3 內存,並以8192位寬總線配置運行。

算力上,上代 MI250X的FP32算力達47.9 TFLOPS,雖已超越英偉達A100的 19.5TFLOPS,但其發佈時間在英偉達之後。AMD並未公佈MI300與H100的算力比較,我們只知道對比上一代的MI250X,MI300預計能提升8倍,能耗水準(TFLOPS/watt)將優化5倍,可以推斷此次性能提升有望接近Grace Hopper水準。

內存帶寬上,高容量及顯存帶寬是MI300的優勢,這兩項指標分別是英偉達H100的2.4倍及1.6倍,由於內存容量大幅提升,單顆MI300X晶片可以運行800億參數模型。

而近期英偉達發佈的H200作為對MI 300的回應,重點也在內存帶寬上進行了升級。H200擁有高達141GB的顯存,帶寬則從3.35TB/s增加到了4.8TB/s,內存容量上超過了MI 300的128GB,帶寬按照H100的1.6倍則稍微遜色於MI 300。

誰會是下一個萬億晶片巨頭?插图9

AI訓練推理中隨著模型參數提升帶來的海量數據計算和傳輸,對GPU-CPU之間的數據傳輸速度提出了更高要求。

Grace Hoopper通過NVLink-C2C和NVLink Switch實現CPU-GPU和GPU-GPU互連,雙方作為內存共享對等體可以直接訪問對方的對應內存空間,支持900GB/s,高達150TB的高帶寬內存訪問,有效解決GPU大規模並行運算中“單節點本地內存不足”的痛點,優勢要更突出一些。

誰會是下一個萬億晶片巨頭?插图11

AMD暫未公佈MI300的傳輸帶寬,但3D Chiplet架構使其內部CPU和GPU可共享同一內存空間,這樣CPU執行計算的時候不需要先將數據進行復制,減少了內存帶寬的佔用。MI300使用的新一代存儲晶片HBM3內存帶寬約為819GB/s,與英偉達 NVLink C2C 900GB/s 帶寬相近。

MI300在規格性能上或已十分接近英偉達領先算力的標準,但後者真正的殺手鐧,是經過長期耕耘,積累了先發優勢的CUDA生態圈,搭配晶片。其實參考微軟作業系統和Office生產工具的組合就能夠理解,一個不斷完善的軟體生態會提高用戶粘性,形成正向迴圈,進一步的迭代同時提高了轉換成本。英偉達全球CUDA開發者在2020年已經達到了200萬,2023年實現翻倍。

誰會是下一個萬億晶片巨頭?插图13

AMD的生態是ROCm,主要客戶是一些研究機構,相比CUDA已經能夠廣泛支持英偉達多條產品線,ROCm目前僅支持Instinct 系列GPU的部分SKUs,包括Radeon Pro W6800和 Radeon Pro V62。

CUDA從1.0版本開始即支持Linux和Windows,ROCm剛剛在今年4月宣佈登錄Windows,但僅支持Radeon Pro W6800,Radeon RX 6900 XT和 Radeon RX 6600,今年Q1公司宣佈ROCm系統融入PyTorch 2.0框架,TensorFlow和Caffe深度學習框架也已經加入到第五代ROCm中,目前ROCm已經能對應到CUDA的部分內容了。但由於起步較晚,ROCm更多用於HPC(高性能運算),覆蓋場景就沒有CUDA那麼全面了。

誰會是下一個萬億晶片巨頭?插图15

AMD的CEO秀克姿豐表示,計劃在擴產MI300系列晶片,相關樣品已經送達客戶進行測試,預計在2024年批量銷售。隨著ROCm平臺工具鏈逐漸完善,生態端的短板在其他廠商的積極回應下或許能加快補齊。配合定價上將延續往日的高性價比風格,打開市場的難度大大減輕。


02


截至目前,英偉達與AMD都發布了各自最新一期的財報及業績指引。

整體來看,兩家的財報都有不少令人驚喜的表現。

英偉達當季營收181.2億美元(同比+206%,環比+32%),大幅高於市場161億美元的一致預期,也遠超英偉達自身指引範圍156.8億到163.2億美元。這主要得益於數據中心業績的爆發增長,數據中心營收145.14億美元,同比增長279%、環比增長38%,佔總營收80%,遠超市場預期128.2億美元。

因為產品需求爆炸增長引發價格不斷飆升,英偉達當季毛利率同比大幅提升了20.4個百分點,環比提升3.9百分點,達到了74%。

淨利潤方面,英偉達的當季GAAP淨利潤92.4億美元,同比大幅增長1259%,環比大幅增長49%,當季Non-GAAP淨利潤100.2億美元,同比及環比分別增長了588.2%、48.7%,均大幅超出市場Non-GAAP淨利潤84億美元的一致預期。

相對的,AMD三季度實現營收58.00億美元,同比增長4.22%,環比增長8.23%,略微高於此前指引的57億美元。第三季度的淨利潤為2.99億美元,同比增長353%,環比增長了10倍,但主要是前期基數太低所致。這是連續7個季度的淨利潤同比下滑之後,首次實現季度淨利潤的同比正增長,所以另投資者感到振奮。

第三季度AMD的毛利率為47%,同提升5百分點,環比提升1百分點,雖然也是吃到了AI晶片需求大爆發的紅利,但顯著不如紅利的引領者英偉達。同時,這巨大的毛利率差距體現出的是在產品競爭力、議價能力的差距,儘管這幾年AMD的顯卡技術已經得到了很大的飛躍,但離英偉達還有很長的路要追趕。

實際上,英偉達的當季淨利潤是AMD30倍還多,兩者差距,可以說已不再同一個頻道上。

第三季度AMD數據中心營收15.98億美元,同比下滑1%,營收佔比28%;經營利潤3.06億美元,同比下滑40%,連續3個季度下滑。

不過,最讓市場關心的是它們的未來業績預期。

在業績指引方面:英偉達給出了一個不大樂觀的預期,預計FY24Q4營收約200億美元(±2%)、GAAP和Non-GAAP毛利率分別為74.5%、75.5%。主要原因是在於預計四季度遊戲業務將出現一定程度回落。尤其是在中國和其他受美國政府10月新出口限制影響的地區,銷售量將大幅下滑。

而AMD的業績指引相對讓投資著更加驚喜,預計四季度營收為61±3億美元,毛利率為51.5%(環比+4.5pcpt),CEO秀克姿豐在電話會上表示,多家超大規模雲計算公司已經承諾部署MI300,MI300將成為AMD史上最快營收過10億美元的產品,並預計將在明年的銷售收入達20億美元。

因為強勁的業績指引,AMD在發佈業績後,AMD股價週三收盤大漲9.7%,並在此後數日持續上漲。

誰會是下一個萬億晶片巨頭?插图17

有意思的是,從營收的地區結構看,兩家的客戶對象也較為重合。

以2022年算,英偉達有30.74%的營收來自美國本土,其次是中國臺灣佔比25.9%,中國內地(包括香港)的佔比為21.91%,也就是說,英偉達的營收來自中國地區的共有47.81%,接近一半的比重。

不過,最新一期數據看,由於AI顯卡需求大爆發疊加美國政府的監管政策限制對華出口,導致三季報來自美國本土的營收激增,同時根據業績指引,四季度英偉達對華高端顯卡出口會明顯下滑,這個地區營收結構會出現很大變化。

不過,英偉達似乎很快找到了一個替代的方案,據CFO透露,英偉達正在為中國開發新的算力系列晶片—HGXH20、L20PCle和L2PCle,都是由H100該款而來,能夠符合美國相關規定。

而AMD方面,來自美國本土營收佔比34.1%,來著中國地區(包括香港和臺灣)的營收共有32.1%,雖然佔比不及英偉達,但近幾年在中國的銷售收入增速明顯。

也就是說,英偉達的中國業務受限,或可能為AMD留下一個缺口,儘管AMD也受限於美國限制政策的影響,但多少算是一個潛在的可能在未來重新同臺競爭的機會。

目前,AMD為了儘快彌補與英偉達的差距,正在大範圍地快馬加鞭收購AI及數據相關的資產,試圖加快集齊AI拼圖,為後續的數據中心業務鋪路。

今年4月4日,AMD宣佈斥資19億美元收購DPU晶片廠商Pensando,以擴展其數據中心解決方案。

8月24日,AMD收購AI初創公司Mipsology,以加強人工智慧推理軟體能力。

10月11日,AMD宣收購人工智慧開源公司Nod.ai,以增加在AI市場的競爭力。

同時,在研發方面,近幾年AMD的研發費用率一直超過20%,並持續攀升。第三季度,AMD的研發投入15.07億美元,同比增長17.83%,研發費用率達到了25.9%,同比也提升了32.9%(對應英偉達的為最新一期財報研發投入20.4億美元,同比增長11.84%,研發費用率23.9%,同比提升12.58%)。


03 尾聲


人工智慧可以賦能智慧型終端機的願景正在實現,AI大模型為英偉達、AMD、英特爾等晶片廠商指明瞭下一個潛力市場,無論是數據中心還是PC、手機等終端,晶片升級需求和高價值量趨勢將驅使他們加快研發和產品推出節奏。

雖然整體上來看,AMD在很多個方面與英偉達都還是有很大的差距,但它已經充分展現出來了不可忽視的增長潛力。

可以說,未來在AI加速晶片領域,英偉達和AMD龍爭虎鬥的局面將一直延續。全文完)

聯系郵箱:0xniumao@gmail.com