AI進化論:端側AI格局生變,國產SoC迎高光時刻
DeepSeek橫空出世,激活端側AI新周期,有望快速推動AI應用的普及。其大模型开源模式和低成本特點降低了AI硬件的創業門檻,而優化後的蒸餾技術使得更多模型能夠部署在端側,在既定算力下推理性能提升降低了企業成本,增強用戶體驗。在AI的滾滾浪潮中,我們看好AI SoC芯片將充分受益於算法平權帶來的端側AI硬件爆發式增長、端側算力需求升級推動SoC的ASP增長,以及國產龍頭SoC公司實現模型破局——終端話語權增強——芯片格局突破的成長之路。
摘要
AI+汽車芯片:目前各大車企主要將DeepSeek接入智能座艙提升人車交互體驗,智駕深度融合在探索中。我們看好:1)DeepSeek推動智駕/智艙普及,硬件預埋帶來汽車芯片高速增長。2)DeepSeek提升車端端到端大模型性能,更多中低端車型可部署端側模型,利好國產性價比芯片。3)我們認爲車企後進入者有望借力DeepSeek實現算法追趕,數據優勢的重要性上升。
AI+消費電子芯片:AI手機/眼鏡/耳機/家電/玩具等紛紛接入DeepSeek,在端側,主流國產SoC芯片已經支持部署DeepSeek1.5B蒸餾模型。模型端側化趨勢下,端側算力提升成爲共識。我們認爲SoC芯片升級方面:1)下一代旗艦芯片AI算力呈現倍數增長,多伴隨制程演進;2)近存計算呼之欲出,創新架構有望解決低延時問題。我們看好國產SoC芯片憑借本地產業鏈優勢、細分行業先發優勢和垂直深度,在長尾市場競爭相對寬松格局下,充分享受AI硬件創新紅利,提升國產芯片份額。
風險
AI算力硬件技術迭代、AI應用落地進展不及預期,貿易摩擦影響供應鏈穩定性,海外大廠加劇競爭。
爲什么我們看好DeepSeek推動端側AI加速普及?
开源模式+推理成本降低
我們看到AI硬件創新過去的參與者主要有以下幾類:智能手機大廠,他們本身具備強勢的軟硬件研發團隊,能夠將相關技術經驗快速復用到其他領域,比如汽車、智能穿戴;互聯網大廠,他們掌握大模型技術,具備流量入口,近期也在硬件方面發力以圖鞏固自身生態;智能硬件創新企業,他們以某個創新智能硬件作爲切入點,具備年輕化的創業團隊和相關的技術背景;此外還有各種各樣的傳統硬件廠商,比如傳統家電廠商、傳統玩具廠商、傳統眼鏡廠商等,他們過去的經驗主要集中在非智能的部分,如傳統工業設計、生產流程和渠道管理等。
DeepSeek-R1的蒸餾模型是开源的,首先降低了AI應用的門檻,使得更多的廠商能夠參與其中。我們認爲優質大模型的开源,讓各類公司的研究人員和开發人員能免費在各類應用中使用和構建這些模型,开源策略不僅促進了技術的傳播和應用,也爲社區提供了進一步優化和改進模型的機會。我們預計後續能夠很快看到各類廠商發布基於R1模型的更多深度應用功能,端側AI呈現百花齊放態勢。
通過算法與硬件的協同創新,DeepSeek可以顯著降低AI應用成本。DeepSeek採用了潛在注意力機制MLA、低精度參數、動態資源分配、分布式計算等方法降低單任務對芯片算力的需求及推理能耗。具體到推理成本上,根據OpenAI官網,ChatGPT-o1的輸入、輸出成本分別爲$15.00/百萬tokens、$60.00/百萬tokens,而DeepSeek-R1的成本僅爲$0.55/百萬tokens、$2.19/百萬tokens。DeepSeek可以用低成本訓練出高效的模型,從而推動尖端AI技術走出實驗室,成爲普惠型生產力工具。
圖表1:“大模型平權”下的推理硬件需求邏輯
資料來源:DeepSeek V3技術報告,中金公司研究部
蒸餾技術提升端側推理性能
模型部署在雲側還是端側,是許多AI應用場景無法回避的話題。模型端側部署具備諸多優勢,如安全性高、低延時,以及適配硬件收費模式等。然而,過去端側部署大模型受算力、功耗等多種因素制約,往往需要接入或協同雲側大模型。蒸餾模型相較於原始模型更小、計算效率更高,更適合在資源受限的環境中部署,它彌合了高性能與高效率之間的差距,讓更多用戶能夠使用高級推理功能。蒸餾技術已問世多年,其核心原理是利用一個大型語言模型(“教師模型”)生成預測數據,並以此來訓練更小、更高效的“學生模型”,從而將大模型的知識快速遷移至小模型上。傳統的蒸餾方式包括:(1)硬標籤(Hard Labels):讓學生模型直接模仿教師模型的輸出結果;(2)軟標籤(Soft Labels):讓學生模型學習教師模型的輸出概率分布;(3)中間特徵蒸餾:讓學生模型學習教師模型的中間層特徵,提高對復雜任務的理解能力。根據DeepSeek官方發布的V3技術報告,DeepSeek的蒸餾過程不僅先通過教師模型(如DeepSeek-R1)生成高質量的推理數據樣本,還創新性地通過構建問答對的方式將“鏈式思考”(Chain of Thought, CoT)引入小模型(如Qwen、Llama系列)。這種方式不僅讓小模型學會答案,還使其模仿了推理過程。
在以往的蒸餾技術下,學生模型的表現與教師模型存在明顯差距。但DeepSeek通過上述蒸餾方式,使小模型不僅繼承了DeepSeek-R1的推理能力,在推理效率和資源佔用方面也展現出優勢。據官方公衆號,在开源DeepSeek- R1-Zero和DeepSeek-R1這兩個660B模型的同時,DeepSeek利用R1的輸出,蒸餾出6個小模型並开源給社區。其中,32B和70B模型在多項能力上可對標OpenAI o1-mini。DeepSeek-R1-Distill-Qwen-32B在AIME 2024基准測試中實現了72.6%的Pass@1,優於其他开源模型。DeepSeek-R1作爲开源模型,應用廠商能夠充分發揮自身積累的場景知識和優質數據優勢,打造出更適配下遊應用的小模型。我們認爲,此版本標志着AI應用朝着全面普及化和高性能推理應用的方向邁出了重要一步。
圖表2:蒸餾小模型超越 OpenAI o1-mini
資料來源:DeepSeek官網,中金公司研究部
分類來看,不同規格的模型有着不同的適用場景,我們總結來看其中1.5B / 7B / 8B:適用於本地部署,因其資源消耗較低,因此適合處理輕量級任務;14B / 32B:具備更強的推理能力,能夠應對更爲復雜的任務,例如代碼補全、長文本問答以及多模態任務等;70B / 671B:性能表現更接近GPT-4級別,可進行更爲復雜的推理和決策工作,主要面向大規模雲端推理場景 。
圖表3:蒸餾模型各版本大致應用
資料來源:DeepSeek官網,中金公司研究部
AI+汽車電子:算法平權有望推動艙駕升級,國產芯片迎來新機遇
座艙先行,智駕有望深度融合
自DeepSeek發布开源模型以來,國內車企在智能座艙和智能駕駛兩個方面展开了積極探索。2月6日,吉利汽車宣布將DeepSeek-R1與自研的星睿AI大模型深度融合。極氪旗下自研的Kr AI大模型、東風猛士917智能座艙、長城Coffee Agent大模型等也相繼接入DeepSeek-R1大模型,進一步增強了車端與雲端的AI能力。目前,這些應用場景主要集中在智能座艙領域,旨在提升座艙的人機交互體驗。我們認爲,智能駕駛領域也有望深度受益於DeepSeek,但進程相對較慢。這主要是因爲DeepSeek屬於大語言模型,而自動駕駛通常使用垂直大模型,如何實現兩者的有效轉變是車企需要深入思考的問題。
硬件預埋,國產汽車芯片开啓高速增長
我們認爲DeepSeek可能從以下方面影響汽車芯片投資機會:
1)DeepSeek推動智駕/智艙普及,硬件預埋促使汽車芯片進入高速增長階段。近年來,自動駕駛技術迭代迅速,從高精度地圖發展到端到端大模型,再到如今智能駕駛達到高速NOA、城市NOA的水平,L3及更高級別自動駕駛有望加速實現。如今AI的迭代速度遠超車企,汽車行業已進入軟件定義汽車的時代。硬件預埋不僅可以收集數據用於訓練大模型,還能通過OTA升級推送更優算法。因此,盡管算法仍需一定時間優化,但硬件高速增長已然來臨。
比亞迪於2月10日召开智能化战略發布會,正式發布高階智駕系統“天神之眼”。“天神之眼”分爲三個版本,其中天神之眼A、天神之眼B搭載於仰望、騰勢及比亞迪的中高端車型;天神之眼C隨首批21款車同步上市,涵蓋7萬級到20萬級車型,全面覆蓋不同消費層次的需求。“天神之眼”的技術亮點在於比亞迪獨創的璇璣架構,該架構整合車端與雲端AI,實現全棧自研全閉環端到端控制,將控制響應時延縮短至10ms。比亞迪還計劃在2025年讓至少60%的車型搭載高速NOA及以上的智駕系統,逐步推動高階智駕技術的普及,並在未來推出更高級別的DiPilot 1000/2000,支持L3級自動駕駛。我們認爲國產車企今年底前有望跟進升規升配,汽車芯片在未來3年有望保持高景氣。
2)提升車端端到端大模型性能,能讓更多中低端車型部署端側模型,利好國產平價芯片。大模型技術用於智駕面臨的挑战之一是线控底盤,底盤控制技術決定剎車、轉向、減速和回避等能力。由於行車速度快,對響應及時性要求高,部署在車端的端到端模型決定了智駕性能。一些發力車端的車企,如理想,採用“端到端 + VLM”雙系統。其中,VLM 模型參數規模爲2.2B,部署在一顆Orin X車端芯片上,用於指導另一顆Orin X上的端到端模型。不過,這種方案並非最終解決方案,它反映出單個芯片支持的端到端模型能力存在不足,而DeepSeek的模型優化思路可用於提升既定算力下的推理性能。另一些發力雲端的車企,秉持先在雲端探索更強能力,再在車端實現降維的理念。鑑於雲端本身具備良好的大模型能力,這類企業也可借鑑DeepSeek的蒸餾技術提升車載端到端模型性能。
DeepSeek 運用知識蒸餾技術,將復雜參數的大模型壓縮爲適合車端的輕量級小模型,在大幅降低車端算力需求的同時,保留了大部分性能。這使得智能駕駛對高算力硬件的依賴降低,有助於國產智駕SoC發揮自身優勢,對在中階算力有較多布局的國產芯片供應商是一大利好。武當C1200家族是黑芝麻智能專爲多域融合、艙駕一體應用場景打造的高性能計算平台,具備高算力、低功耗、高可靠等優勢。2月10日,比亞迪在智能化战略發布會上發布全民智駕战略,並推出天神之眼C高階智駕三目版。同時,地平线最新一代車載智能計算方案徵程®6系列正式全球首發落地。
圖表4:小鵬模型結構
資料來源:小鵬AI智駕技術分享會,中金公司研究部
圖表5:理想雙系統方案
資料來源:理想夏季智能駕駛發布會,中金公司研究部
3)數據的重要性日益凸顯,後進入者有望借助DeepSeek實現追趕,看好頭部車企產業鏈。當前,各家車企在算法能力上存在差異。DeepSeek大模型的开源正推動“算法平權”的發展,爲後進入者創造了趕超機會,有效縮短了彼此間的時間差距。在汽車芯片算力已相對較強的情況下,隨着算法平權趨勢的推進,我們認爲數據的重要性愈發突出。
圖表6:2024年中國車企零售銷量份額
資料來源:CPCA乘聯分會,中金公司研究部
圖表7:2024年全球汽車集團零售銷量份額
資料來源:中汽數研,乘聯數據,中金公司研究部
我們認爲國產大模型的突破,有望進一步提升國產車企的競爭力與話語權。出於本地化團隊支持和保障產業鏈安全等因素考量,車企對國產芯片的導入意愿始終較高。伴隨國產汽車品牌的崛起,我們認爲國產芯片的市場份額有望隨之提升。汽車芯片對穩定性和可靠性要求嚴苛,通常需要大規模上路應用的經驗來推動技術迭代升級,而這又將進一步促進國產汽車品牌的發展,二者有望形成良性循環。回顧歷史,不少國產芯片正是借助下遊國產品牌的突破實現業績增長並走向海外,最終在全球市場佔據龍頭地位,例如安防芯片和電視芯片。近日,億咖通科技宣布正式與大衆集團達成合作,爲大衆和斯柯達品牌的全球車型提供智能座艙解決方案。芯擎科技 “龍鷹一號”爲億咖通·安托拉®1000計算平台提供了高性能支持,首批車型將率先亮相巴西和印度兩大新興市場。我們認爲這論證了我們前文的觀點,展示出國產汽車芯片在全球競爭中的實力不斷增強。
AI+消費電子:智能硬件百花齊放,國產SoC大有可爲
智能硬件百花齊放,端側AI SoC迎東風
DeepSeek具備低成本、高性能的優勢,能夠全面賦能AI應用終端硬件設備。DeepSeek-R1原始模型的參數量多達671B,對硬件設施的要求頗高;而借助其先進的模型壓縮與蒸餾技術,第三方可以從DeepSeek-R1蒸餾出參數規模在1.5B-70B之間的六個版本小參數模型。盡管蒸餾過程會使模型性能有一定程度的損失,但卻能換來更大的部署靈活性,有效克服存儲空間有限、算力消耗大、推理延遲高這三大端側部署難題,從而更好地適配手機、PC、耳機、家電等應用終端的嵌入式芯片。例如,雲天勵飛的DeepEdge10芯片平台已成功適配DeepSeek-R1蒸餾模型(1.5B、7B版本);全志科技的A733芯片也已成功部署DeepSeek-R1:1.5B模型,在搭載該芯片的平板電腦上運行流暢。此外,DeepSeek運用多模態融合技術,整合視覺、語音、傳感器等多源數據,實現更爲自然的交互方式。同時,基於場景化AI模型,DeepSeek能夠爲不同終端設備提供定制化服務 。
智能手機:自2月以來,國內多家手機廠商陸續宣布接入國產开源大模型DeepSeek,爲用戶帶來AI問答、深度推理等功能。借助本地化語音識別模型,用戶能夠通過自定義喚醒詞激活手機AI助手。中興宣布努比亞Z70 Ultra率先實現全尺寸內嵌“滿血”DeepSeek-R1,這使得手機能夠進行系統級的交互整合,並且可以與努比亞AI耳機等智能穿戴設備實現充分互聯。另外,DeepSeek推出了自己的手機應用程序,用戶可在安卓和蘋果應用商店下載。該應用具備多項AI功能,涵蓋文件解析、分析、內容提取,利用圖像OCR功能讀取圖片中的文字,以及生成相應的思維過程輔助用戶理解邏輯等。
圖表8:多家手機品牌官宣接入DeepSeek大模型
資料來源:榮耀、OPPO、Vivo、中興官方微信公衆號,中金公司研究部
AI眼鏡:相較於其他佩戴設備,眼鏡能夠獲取的信息量最大,並且具備同場感,因此產業界看好有望成爲實現更綜合功能的硬件載體。目前,AI/AR眼鏡主要依賴雲平台調用大模型。例如,大朋VR的DPVR Glasses通過百度智能雲千帆大模型平台調用DeepSeek-R1/V3模型。不過,隨着知識蒸餾、量化剪枝技術的日益成熟,從雲到端的完整推理優化鏈條有望逐步完善。
► 多模態交互能力優化,提供更便捷的用戶體驗:DeepSeek融合視覺(攝像頭)、語音(麥克風)、運動(IMU)數據,實現意圖鏈動態推理。用戶可以通過語音指令和手勢操作完成復雜任務,如導航、信息查詢等。例如,Rokid推出的AR眼鏡Rokid AR Lite提供兩種交互模式:用戶可以通過主機操縱屏幕上的射线選擇應用或模式;也可以利用Station 2主機作爲觸控板進行操作。目前,Rokid AR Lite已能分屏使用DeepSeek網頁版,用戶戴上眼鏡後可以在三聯屏上操作DeepSeek查資料、編輯文檔,無需切換界面。
► 新增深度思考能力,應用場景進一步拓展:星際魅族推出的StarV Air2目前已接入DeepSeek大模型。該眼鏡除提升原有的實時對話翻譯、自動生成會議紀要等功能外,還增加了深度思考能力,能夠爲用戶帶來更具專業性與辯證思維的答案。
圖表9:星際魅族AR智能眼鏡接入DeepSeek大模型
資料來源:星際魅族官方微信公衆號,中金公司研究部
圖表10:Rokid AR Lite現已支持分屏使用DeepSeek
資料來源:Rokid官方微信公衆號,中金公司研究部
AI耳機:DeepSeek在耳機領域通過端側語音模型和多模態交互優化,重新定義了無屏交互體驗,實現從“語音助手”到“智能外腦”的轉變。
► 深度搜索與邏輯分析能力增強:WISHEE DeepSeek滿血版AI耳機搭載iVA智能管家,支持“深度思考”指令,能夠通過多模型協同工作生成高質量答案。當用戶提出復雜問題時,耳機將調用多模型協同框架,其中DeepSeek承擔推理任務,搜索模型負責檢索信息,生成模型對輸出內容進行優化,進而爲用戶提供多角度的解決方案。訊飛AI會議耳機iFLYBUDS Pro2在正式接入DeepSeek模型後,其內置的viaim AI在問答流暢度、精准度以及響應效率方面均有提升,爲用戶帶來了更加智能高效的使用體驗。
► 新增情感交互與健康監測功能:WISHEE AI耳機融合了傳感器技術與DeepSeek-R1模型,能夠通過聲紋分析捕捉用戶語氣、語速的變化,精准判斷用戶的情緒狀態,並主動適配交互模式,實現情緒感知與情感回應。
智能家電:DeepSeek通過提升智能交互的精准度與自然度,增強家電的自主學習和個性化服務能力,全面賦能家電行業,推動其朝着智能化、個性化、高效化方向轉型。
► 新增場景化智能服務:以海信爲例,接入DeepSeek後,用戶只需按下海信電視遙控器上的小聚AI鍵,或者直接語音喚醒DeepSeek,在對應的智能體對話頁面內,就能通過語音對話獲取信息,實現從傳統“按鍵操作”到自然流暢“語音對話”的跨越。此外,憑借DeepSeek強大的推理能力,海信AI電視還能基於家庭成員觀看記錄進行個性化內容推薦。
► 多模態數據輔助動態決策機制:美的T6空調通過私有化部署DeepSeek大模型,可實時感知溫度、溼度、風速等12項環境參數,並基於深度學習推理能力進行多維聯動調節。當檢測到室內外溫差驟增時,系統會自動平衡制冷強度與溼度補償,避免用戶體感不適。
► 自然交互體驗打破人機壁壘:借助DeepSeek大模型的語義理解能力,美的T6空調實現“模糊指令控制”。當用戶說“有點悶熱但別吹頭”時,空調能同步完成溫度調節、溼度優化、切換無風感模式三項操作,展現出類人類的語言理解能力。
圖表11:家電龍頭接入DeepSeek大模型
資料來源:海信、長虹、TCL、美的官方微信公衆號,中金公司研究部
AI玩具:相較其他AI硬件,AI玩具與教育用品具有載體形態多樣、感官優勢明顯等特點。DeepSeek通過賦予AI玩具自然流暢的語言交互與智能學習能力,爲孩子提供個性化陪伴和寓教於樂的體驗。
► 多模態感知與情感陪伴:上市企業湯姆貓推出AI陪伴玩具湯姆貓,並與西湖心辰合作訓練了情感陪伴垂直模型。該玩具增加了眼神交流等功能,借助高靈敏度麥克風和攝像頭等傳感器,利用DeepSeek模型判斷用戶情緒和需求。
► 打造個性化學習方案:教育硬件接入DeepSeek後,能夠實現從簡單的作業批改、題庫生成等工具屬性到“智能輔導”的跨越。例如,網易有道接入DeepSeek-R1大模型後,其AI全科學習助手“有道小P”結合DeepSeek-R1的超長思維鏈,進一步優化了個性化答疑功能,能提供更具深度、更准確的解題思路,有效提升理科答疑能力。學而思將DeepSeek與自主研發的九章大模型相結合,形成“雙引擎”模式。該模式在提升學生解題能力的同時,更有助於培養學生深度思考的習慣。
算力提升成爲共識,近存計算呼之欲出
► 算力提升倍數增長,先進制程逐漸成爲標配
我們看到在消費電子領域,AI SoC芯片的升級方向側重於AI算力的提升。過去,NPU模塊僅爲旗艦產品選配,如今已逐步成爲標配;且NPU算力每次迭代都呈現大幅的增長。目前,量產產品如RK3588具備6Tops的端側算力,可支持端側主流的0.5B-3B參數級別的模型部署。
圖表12:消費電子領域AI SoC旗艦產品情況
資料來源:各公司官網,Wind,中金公司研究部
► 低延時需求凸顯,近存計算呼之欲出
智能硬件的響應速度需不斷接近人的反應速度,過高的延時會直接影響用戶體驗,阻礙智能硬件的商業化普及。近兩年,穿戴類、工業類、智能家居類等端側應用對算力的需求日益增長。以典型邊緣計算落地場景——IP Camera爲例,由於需要實時進行AI計算並處理高清視頻碼流,對帶寬要求高。而LPDDR4雙通道32位的帶寬天然高於標壓DDR4。爲加快存儲芯片和算力芯片之間的數據傳輸,存算一體的概念在多年前就已被學界探索。近期,我們終於看到業內存儲廠商針對端側算力提出了近存計算的解決方案。
由於不同客戶的最終產品形態各異,在容量、速度以及與SoC的連接方式等方面均存在差異,因此類似CUBE這樣的產品並非標准件,而是採用半定制化設計。我們看好片內DRAM能夠在更大程度上發揮邊緣計算的性能,提升端側延時表現。
圖表13:華邦的CUBE封裝演進示意
資料來源:EE Times China,華邦官網,中金公司研究部
本地產業鏈優勢、長尾市場競爭寬松,看好國產細分龍頭充分受益
我們認爲,在大模型的推動下,端側AI應用呈現出百花齊放的局面。衆多長尾應用市場的競爭格局相對寬松,像高通這類海外大廠在面向細分賽道時,往往精力不夠集中,產品迭代速度較慢,服務質量也難以與國產芯片廠商相媲美。因此,我們看好國產SoC廠商有望憑借在各細分賽道的先發優勢和垂直深度贏得市場份額。
從產業鏈角度來看,上遊有日益成熟甚至在某些方面處於領先地位的國產多模態大模型;中遊有各類能夠滿足不同復雜度和功能需求的SoC芯片,以及強大的模組和組裝產業鏈;下遊則有長期緊密合作的終端品牌。我們看好大模型對終端品牌競爭力的提升作用,國產芯片有望從中充分受益。
風險分析
AI算力硬件技術迭代不及預期
SoC芯片是算力硬件的核心,其性能受制程工藝、架構設計及能效優化等關鍵技術影響。若國內技術迭代滯後,可能導致新品導入量產放緩,SoC芯片企業將面臨市場份額被侵蝕、競爭力下降的風險。
AI應用落地進展不及預期
AI技術的快速迭代對芯片性能和功能提出了更高要求,但SoC芯片研發周期長、投入大,且結果具有不確定性,假如端側AI硬件發展不及預期,有可能導致SoC芯片銷量不足以支撐研發成本而形成虧損。
貿易摩擦影響供應鏈穩定性
SoC芯片技術趨勢上通過迭代制程來升級算力和降低功耗,目前旗艦芯片主流制程在12nm/6nm,更先進制程的產品各家也都在研發當中。目前能夠提供12nm以下代工的晶圓廠主要在中國台灣和韓國,假如貿易摩擦加劇,SoC芯片代工可能存在不穩定性。
海外大廠加劇競爭
傳統大廠此前主要專注更大的市場比如手機、雲端算力場景,如果他們加大在中低端市場、低算力長尾市場的競爭、發起價格战,對國內SoC芯片市場將形成直接衝擊,國內企業可能面臨業績增長不利的風險。
本文摘自中金公司2025年3月7日已經發布的《AI進化論(4):端側AI格局生變,國產SoC迎高光時刻》
臧若晨 分析員 SAC 執證編號:S0080522070018 SFC CE Ref:BTM305
成喬升 分析員 SAC 執證編號:S0080521060004
彭虎 分析員 SAC 執證編號:S0080521020001 SFC CE Ref:BRE806
賈順鶴 分析員 SAC 執證編號:S0080522060002
標題:AI進化論:端側AI格局生變,國產SoC迎高光時刻
地址:https://www.iknowplus.com/post/200563.html