大模型:多模態引領新篇章



通用大模型追求高泛化能力,可以高質量完成自然語言理解和生成任務。基於底層Transformer,模型形成三大主流技術路線,OpenAI的GPT模型採用解碼器路線,得到廣泛關注和認可。海外大模型技術保持高速推進,以視覺能力為核心的大模型多模態能力不斷展現,模型視覺理解和生成能力快速發展,有望帶來廣闊市場機遇,推動AI商業化進程加速和市場天花板打開。我們持續看好大模型千行百業的落地機遇,建議關注相關領域AI公司。

大模型概述:具備強大生成能力,訓練趨於標準化。

通用大模型追求高泛化能力,可以高質量完成自然語言理解和生成任務。大模型訓練流程趨於標準化,大致可分為通用能力培養和行業能力提升兩大階段,其中通用能力培養階段主要包括無監督預訓練、價值觀對齊等核心步驟,行業能力提升階段主要包括監督微調、行業數據預訓練、模型偏好對齊等步驟。當前海外通用大模型主要有OpenAI的GPT-4、谷歌的Gemini、Anthropic的Claude 2、Meta的Llama 2等。

大模型技術:形成三大技術路線,GPT路線得到認可。

Transformer引入自注意力機制,徹底解決了遠距離資訊丟失和並行計算效率的問題。基於底層Transformer,模型形成編碼器、解碼器、編碼器-解碼器三大主流技術路線,OpenAI的GPT模型採用解碼器路線,得到廣泛關注和認可,最新的GPT-4模型在環境科學、歷史、生物等加文本量的學科中取得前10%的成績,引領行業發展。但當前大模型和通用人工智慧在通用性、認知能力、工具能力、多模態協同等方面仍有較大差距,技術具備較大發展潛力。

多模態:視覺能力為核心,能力升級帶動應用落地。

多模態主要包括視覺和語音,其中視覺能力對模型感知能力和應用開發潛力提升具有重要價值,成為當前多模態大模型發展的核心方向。多模態能力打開模型學習空間,突破文本對模型訓練的限制,在高質量文本數據規模年化增速不及5%的情況下,保障模型規模高速增長。

語音能力方面,大模型可以利用STT+TTS+GPT模式快速實現語音對話,整體技術成熟度較高,門檻相對較低。

視覺能力方面,視覺理解領域主要形成模塊化和一體化兩大路線,其中模塊化設計靈活度更高並具備更高性價比,而一體化(原生)架構下模型多模態融合能力更突出。視覺生成領域,主要利用擴散模型實現圖片和視頻生成,底層技術來看,圖像和視頻生成技術具有一致性。大模型視覺理解和生成能力提升,有望重塑部分行業,帶動全新應用落地。

其他模態上,代碼大模型快速發展,國內外廠商加速佈局,國內廠商位於行業第一梯隊。

短期來看,海外高質量源生多模態大模型技術和商業化進程高速推進,國產多模態大模型有望加速追趕,推動行業保持高速發展。

行業落地:大模型賦能千行百業,應用市場蓬勃發展。

根據前瞻產業研究院數據,我國AI市場規模有望在中短期保持高速成長,2025年有望超過2000億。未來大模型有望以“訂閱+流量”和“專案+服務”等模式落地行業,我們看好大模型在千行百業的落地機遇。 

1)辦公:應用落地的核心場景,打造智慧辦公助理。考慮到AI+辦公應用場景紮實、效率提升明確、功能演進清晰、商業落地加速,辦公軟體成大模型應用落地的核心場景之一。

2)教育:全面引領教學變革,海外產品落地獲得認可。分別面對教師和學生,形成“教、管、學、考”四大場景。行業應用場景豐富,擁有成熟商業化道路,有望加速實現行業大模型落地。

3)企業管理:助力企業降本增效,國內龍頭產品逐步落地。大模型融入ERP實現降本增效,如:①企業經營管理,如企業財務分析、人才管理等,提升企業整體經營效率。②個人工作助手,包括智慧表單生成、代碼開發助手、一鍵OA生成等功能,輔助員工提升工作效率。

4)消費娛樂:新場景層出不窮,數位營銷與遊戲行業有望快速落地。5月Google Marketing Live上,谷歌展示了最新的廣告推送方案和Product Studio產品,驗證大模型在個性化推送和廣告素材生成上的潛力。遊戲領域,育碧、虛幻引擎、網易等國內外知名廠商均推出相關產品,加速探索模型應用。

風險因素:AI核心技術發展不及預期風險,企業數據安全風險,資訊安全風險,行業競爭加劇風險,地緣政治風險,監管政策風險。

投資策略:大模型技術不斷成熟,展現強大生成能力和通用性,模型規模提升和多模態能力增強帶動基礎設施需求。海外大模型技術保持高速推進,指引國產大模型發展方向,國內大模型行業發展有望逐步加速。未來大模型多模態能力不斷展現,有望帶來廣闊市場機遇,推動AI商業化進程加速和市場天花板打開。我們持續看好大模型千行百業的落地機遇,建議關注大模型在辦公、企業管理、教育、圖像視頻等領域的應用機會,建議持續關注相關領域的頭部AI公司。

注:本文來自中信證券研究部已於2023年12月15日發佈的《電腦行業“智慧網聯”系列報告36——大模型:多模態引領新篇章》,報告分析師:楊澤原 S1010517080002,丁奇雲 S1010519120003,馬慶劉 S1010522090001

聯系郵箱:0xniumao@gmail.com