中金:AI行情驅動,Retimer芯片或迎來高速增長期
我們看到AIGC對算力需求的不斷拉動以及PCIe5.0的逐步滲透,服務器內部元器件的互聯速率及帶寬要求也逐步提升,而由此產生的信號衰減問題有待解決,Retimer作爲信號衰減的主要解決方案之一,可以通過較低的成本更好地保證信號傳輸質量。隨着AI服務器出貨量的提升以及內部GPU、SSD等外設地增加,我們預計Retimer市場規模有望迎來快速增長。
摘要
PCIe協議保證信號在CPU與終端之間高速通行,但信號衰減務須解決。PCIe協議是一種高速串行計算機擴展總线標准,爲主板與顯卡等外圍設備連接提供標准化的方案。近年來,高速數據傳輸協議已由PCIe 3.0(數據速率爲 8GT/S)發展至 PCIe 5.0(數據速率爲 32GT/S),數據傳輸速度翻倍的同時帶來了突出的信號衰減和參考時鐘時序重整問題,這些問題影響了超高速數據傳輸協議在下一代計算平台的應用範圍。
Retimer技術爲信號衰減主要解決方案之一。PCI-SIG對於信號傳輸損耗有嚴格規範:PCIe4.0損耗不得超過28dB,PCIe5.0損耗不得超過36dB。目前解決方案主要有三:1)PCB板材更換,但在部分場景面臨成本較高問題;2)Redriver芯片技術:Redriver芯片作爲信號中繼器,通過放大信號振幅、修正信號時序偏移來保證信號質量,成本較低,但提升信號質量效果不佳;3)Retimer芯片技術:Retimer芯片主要通過重新生成信號來保證傳輸質量,信號傳輸質量佳,可用於長距離高速傳輸。在解決散熱及功耗問題後,相較於前兩種方案,Retimer芯片在成本以及信號質量上可以取得平衡。
AI服務器相對於傳統服務器對Retimer需求量有較高提升。AI服務器收集、處理巨量數據集對總帶寬大小及傳輸速度、傳輸穩定性具有較高需求,大規模數據訓練帶來的分布式計算、存儲需求同樣需要快傳輸速度及高傳輸質量。此外,爲保證訓練模型質量,保障原始訓練數據的完整性、真實性,減少數據錯誤及損失同樣至關重要。因此AI服務器往往存在大量PCIe 5.0插槽接口需求,同時單插槽接口也將具有多條lane以提供更多、更快的數據傳輸,潛在Retimer芯片需求量大。據瀾起科技表示,目前一台配8塊GPU的主流AI服務器有8顆甚至16顆PCIe 5.0 Retimer芯片需求。
風險
AI服務器出貨量不及預期,PCIe 5.0滲透率不及預期。
Retimer芯片:信號損耗優選解決方案之一
PCIe協議:代際速度高增,致力於高速傳輸
PCIe協議採用串聯方式保證信號穩定在CPU與終端之間高速通行。PCIe協議是一種高速串行計算機擴展總线標准,爲主板與顯卡等外圍設備連接提供標准化的方案。其脫胎於PCI及PCI-X系產品,由PCI-SIG开放式行業聯盟研發、維護及制定標准。PCI-SIG聯盟形成於1991年,由Intel率先牽頭發起,至今已包含Intel、AMD、NVIDIA、Dell、HP等諸多知名企業,致力於提供更好的PCIe協議技術,並在軟硬件相關領域推廣統一標准。回顧PCI協議發展歷史,1992年PCI 1.0出現,憑借32bit位寬下128MB/s的傳輸速度取代ISA的市場地位;1998年PCI-X v1.0爲PCI總线技術的擴展版,在32bit位寬下提供達533MB/s的傳輸速度;2003年PCI-SIG發布PCIe 1.0技術,以串行架構取代過去的並聯架構,具有信號互擾少、傳輸速度快的優勢。
圖表1:PCIe協議發展歷程
資料來源:PCI-SIG官網,中金公司研究部
圖表2:PCIe協議工作原理
資料來源:TI官網,中金公司研究部
PCIe協議兼取並聯之長,吞吐效率受通道數量影響。受到PCI及PCI-X並聯通道啓發,PCIe協議利用並聯技術優勢,可提供不同通道數量傳輸需求。PCIe 1.0單通道提供約250MB/s單向傳輸速度,同時可提供x1、x4、x8、x16、x32不同通道數量規格。單個lane由兩對差分线組成,一對用於接收信號,一對用於發送信號,每對差分线由兩根並行、傳輸相反信號的導线構成,接收器檢測到兩信號差值,而噪聲與幹擾往往以相同方式影響线路,故而噪聲會相互抵消掉,信號傳輸具有更好質量。此外,差分設計還有利於降低信號的衰弱及失真、減少鄰近導线擾動,因而差分线可使用更高的時鐘脈衝頻率。相較PCI的並行數據信號技術而言,PCIe技術單通道使用更短的信號线即可達到更大的總线帶寬。PCIe串行總线技術同時兼有並行優勢,自2003年PCIe 1.0技術創始起,即可響應多條通道數量同時進行,PCIe card產品可根據需求自由設計不同尺寸的插槽與配置,多條通道成倍數提升傳輸速度,提升數據吞吐效率。
PCIe協議迭代頻率穩定,代際間傳輸速度翻倍增長,高速傳輸中存在信號損失問題。PCIe協議保持穩定迭代速度,自2003PCIe1.0出現至2010每3~4年迭代一次,2017至2021年每2年迭代一次,均向後兼容前代版本。受益於編碼方式從8b/10b轉變爲128b/130b,2017年推出的PCIe 4.0單通道傳輸速度提升至約2GB/s,PCIe 5.0、PCIe6.0單通道傳輸速度分別提升至4GB/s及8GB/s。PCIe協議作爲高速串行計算機擴展總线標准,是PCI-SIG聯盟制定與管理的行業規範,並不直接提供產品。PCIe技術迭代需求主要受相關行業需求影響,PCI-SIG聯盟涵蓋硬件廠商、系統集成商、軟件开發商及其他技術公司,相關行業對於帶寬速度要求的不斷增長推動PCIe的技術迭代。高速傳輸中信號損失高等問題難以避免,保障信號傳輸質量爲關鍵需求。
圖表3:PCI-SIG聯盟部分成員
資料來源:PCI-SIG官網,中金公司研究部
圖表4:PCIe 4.0傳輸中出現信號損失概率
資料來源:TI官網,中金公司研究部
Retimer芯片:兼具成本與信號傳輸質量的解決方案
Retimer芯片運作原理主要爲電氣補償+時鐘重採,主動參與PCIe以優化信號。數據補償方面,Retimer芯片採用CTLE技術,在接收端進行連續時間的线性化處理來補償信息傳輸中損耗,增強信號中的高頻分量,從而減少傳輸誤差,同步利用自適應性均衡和判決反饋均衡器或DFE來補償信號損失,在發射機上提供預/後加重以改善信號。數據採樣方面,Retimer芯片應用低通濾波器以減少高頻噪聲和抖動,之後利用幹淨的恢復時鐘重新對恢復後的數據進行採樣,有助於減少噪音。此外,Retimer芯片還具有主動參與PCIe協議的能力,其在LTSSM的監督下,在根復合體與終端之間進行通信,以優化其輸入及輸出信號的完整性。
圖表5:時鐘重採技術的應用效果
資料來源:TI官網,中金公司研究部
Retimer芯片布局及使用數量受PCIe協議拓撲結構影響。主板物理空間及PCIe協議跡线布局影響PCIe所採用拓撲結構,PCIe協議拓撲結構對於Retimer芯片排布有不同需求。直线拓撲中,Retimer應放置於導线中間點,以確保信號能有效覆蓋導线,若傳輸距離過長,或將應用多個Retimer芯片;樹形及分支拓撲中,Retimer芯片常須放置於分支點處,其數量需求取決於分支數量或整體信號情況;星形及擴展星形拓撲當中,Retimer芯片主要放置於中心節點;網狀拓撲結構當中,Retimer布置需根據節點間實際距離、連接路徑復雜性來綜合考量。
高傳輸速度同步導致高傳輸損耗,相較PCB、Redriver,Retimer技術在成本和信號質量間取得平衡。PCIe技術迭代快於商業化產品應用,PCIe 5.0技術於2019年即已出現,於2023年开始普及,PCIe 6.0技術2021年即已出現,至今尚未規模商業化,主要受制於成本與信號傳輸損耗難題。PCIe 4.0及之後,編碼方式改變帶來傳輸效率提高,而受主板布局影響的傳輸距離基本保持不變,同步帶來信號傳輸損耗的問題。PCI-SIG對於信號傳輸損耗有嚴格規範:PCIe4.0損耗不得超過28dB,PCIe5.0損耗不得超過36dB。目前解決方案主要有三:1)PCB板材更換:需要使用介電損耗與色散更低的PCB基板來控制信號損失,但PCB Rogers系板材約爲常用FR4板材成本3~10倍,需要考慮成本問題;2)Redriver芯片技術:Redriver芯片作爲信號中繼器,通過放大信號振幅、修正信號時序偏移來保證信號質量,成本較低,但提升信號質量效果不佳;3)Retimer芯片技術:Retimer芯片主要通過重新生成信號來保證傳輸質量,除對信號進行放大、整形處理外,其在構建的模擬域中採用電氣方式補償信號損失、優化信號波形來減少失真,後通過時鐘數據恢復技術,利用幹淨的恢復時鐘來採樣恢復後的數據。Retimer芯片本質在於重新生成數據,信號傳輸質量佳,可用於長距離高速傳輸,在散熱、功耗問題平衡後,具有一定優勢。
圖表6:Retimer工作原理
資料來源:TI官網,中金公司研究部
PCIe協議迭代提升帶寬傳輸速度,Retimer芯片需保持同步迭代更新。PCIe協議速度成倍提升,除編碼模式改變外,主要依賴於時鐘脈衝頻率提升而擴大帶寬。奈奎斯特定理指出,重新採集信號頻率須爲原信號最高頻率兩倍方能保證信號重採的完整、穩定。數據重新採樣爲Retimer芯片工作的關鍵一環,其採樣信號完整性及有效性嚴重影響整體信號傳輸質量。目前PCIe端代際總帶寬提升大,每代PCIe協議帶寬約爲成倍提升,Retimer芯片須提升其重採時鐘脈衝頻率上限來保證信號傳輸質量,時鐘脈衝頻率上限主要受制於芯片硬件設計及制成工藝,難以通過編碼調整,故需與PCIe同步迭代。
圖表7:PCIe 5.0 Retimer在AI服務器中的工作過程
資料來源:瀾起科技官網,中金公司研究部
Retimer需求受PCIe技術迭代牽引,有望受益於PCIe 5.0滲透率擴大。Retimer技術致力於解決傳輸損耗問題,自PCIe 4.0技術後有望成爲主要解決方案之一。我們認爲受材料成本及PCI-SIG對於傳輸損耗的嚴格限制影響,應用PCIe 4.0及之後技術的產品或將主要選取Retimer作爲信號損失的解決方案。目前PCIe 4.0產品得到廣泛應用,PCIe 5.0協議滲透率逐步提升。PCIe 4.0產品方面:GPU端,NVIDIA RTX 30系列產品、NVIDIA A100產品採用PCIe4.0技術;固態硬盤方面,PCIe 4.0 NVMe SSD相關產品出貨量逐漸增大,2023年達2740余萬個;主板方面,AMD X570、B550及Intel Z490、Z590均已支持PCIe 4.0技術;出貨量破5000萬台的遊戲主機PS5採用基於PCIe 4.0技術的定制SSD;採用PCIe 4.0技術的產品已全系鋪开。PCIe 5.0產品方面:GPU端,主要用於支持高端顯卡,如NVIDIA RTX 4080/4090及AMD Radeon RX 7900 XTX產品;服務器及CPU端,Intel Xeon系處理器宣稱支持高達 2TB容量、80個PCIe 5.0通道,阿裏雲磐久服務器M系列和倚天710芯片均已通過PCIe 5.0接口官方認證;固態硬盤方面,Crucial T700已應用PCIe 5.0技術,市佔率將在2024年進一步擴大;PCIe 5.0目前主要應用於服務器方面,以響應提升計算效率需求。PCIe 6.0產品方面:目前Amphenol MCIO线纜連接器、Amphenol ExtremePort™ Swift线纜連接器均已宣稱實現對PCIe 6.0的技術支持。
圖表8:支持PCIe 4.0及5.0的部分產品概覽
資料來源:各公司官網,中金公司研究部
PCIe 6.0技術有望逐步落地,Retimer芯片優勢進一步擴大。Synopsys與Intel搭載PCIe 6.0的測試芯片實現互操作,我們認爲PCIe 6.0技術自21年誕生以來有望加速落地。PCIe 6.0採用PAM-4的編碼技術,實現單位信號周期傳輸兩位數據,提供單通道約8GB/s的傳輸速度,未來有望廣泛應用於AI、消費電子等帶寬密集型行業。PCIe 6.0帶來的數據傳輸速度提升、傳輸量增加及PAM-4編碼技術的採用均會導致信號損耗的增加,我們認爲Retimer芯片有望受益。此外,據PCI-SIG,PCIe 7.0標准將於2025年發布。
圖表9:PCIe各代技術及通道所能提供的最大數據吞吐效率
資料來源:PCI-SIG官網,中金公司研究部
AI行情驅動,Retimer芯片或迎來高速增長期
AIGC產業鏈推進或加速PCIe 5.0滲透率提升
國內外AI產業鏈快速推進。算力方面,TrendForce表示,2023年,AI服務器出貨量約120萬台,同比增長38.4%,據Gartner表示,AI芯片全球市場規模超530億美元,預計2027年AI芯片市場規模將達1197億美元。模型訓練方面,入局企業衆多:海外OpenAI領跑,其發行的ChatGPT 4.0版本訓練參數已超萬億,Google推出PaLM 2 AI模型,支持20余種語言編碼,已於5400億參數完成訓練;國內百度領跑,2023年3月16日,百度推出“文心一言”,爲首個中文類ChatGPT大模型,阿裏巴巴推出“通義”大模型系列,M6大模型版本爲國內首個千億參數多模態大模型。實地應用方面,據Gartner表示,消費電子端2024年預測全球AI PC及生成式AI智能手機出貨量預計達2.95億台,AI PC出貨量佔PC總出貨量22%,生成式AI智能手機出貨量將佔到基礎和高級智能手機出貨量的22% ,預計2024年PC出貨量將增長3.5%,智能手機出貨量將增長 4.2%;大模型應用落地將構建AI生態,“文心一言”已支持多種AI工具插件接入,提供AI長文創作、AI繪畫、AI導圖等多維服務,搭載該大模型的長安汽車逸達已投入量產。
圖表10:AI大模型部署過程
資料來源:TI官網,中金公司研究部
AI服務器有更高的互聯帶寬需求, PCIe 5.0協議滲透率有望提升。AI服務器設計採用異構形式,結合多種處理器及加速器,相較通用服務器具有更強的數據處理能力及AI訓練能力,元件間數據傳輸量需求同步擴大。AI服務器Dell PowerEdge XE9680具有10個PCIeGen 5.0 x16規格插槽,連接8個SXM GPU,裝配有2個Intel Xeon處理器。NVIDIA DGX H100搭載8個NVIDIA H100張量核心GPU,採用雙路x86架構CPU,包含兩顆Intel Xeon 8480C CPU,每顆CPU具有56個核心,基礎頻率爲2.0GHz,同時集成PCIe Gen 5 x16通道接口,提供128GB/s的總帶寬,PCIe Gen 5能使H100與x86 CPU和SmartNIC進行連接。此外,存儲端產品迭代均現採用PCIe 5.0趨勢,英韌科技SSD產品Tacoma IG5669具有4通道PCIe 5.0接口,順序讀取速度可達14GB/s,同有科技發布NetStor®18000產品,爲國內首款基於PCIe 5.0的自主可控全閃分布式存儲產品,Memblaze所發布PBlaze7 7940系列企業級NVMe SSD同樣支持PCIe 5.0技術。AI服務器受算力需求牽引,對信號傳輸速度及數量要求均高於通用服務器,電子元件間帶寬需求上行帶來存儲、GPU等終端產品對支持PCIe 5.0協議增多,PCIe 5.0協議有望提高在服務器領域內的滲透率。
圖表11:AI服務器性能快速提升
資料來源:NVIDIA官網,中金公司研究部
圖表12:H100網絡模塊結構拆解
資料來源:NVIDIA官網,中金公司研究部
AIGC需求拉動,AI服務器有望持續增長。受益於AIGC需求帶動,模型算力需求上升,AI服務器供不應求,主要廠商紛紛擴產。AIGC滲透多行業趨勢明顯,服務於教育、娛樂、電商、運營等行業,各行業內主要企業入局者衆,模型算力需求水漲船高,下遊服務器行業供不應求。據TrendForce表示,2023年全球AI服務器約出貨120萬台,佔整體服務器總出貨量約9%,預計2024年AI服務器出貨總量將超過160萬台,佔整體服務器比例約12.1%,上漲比例超30%,預計2026年AI服務器出貨量約240萬台,佔整體服務器比例約15%。需求端行情帶動高增長產能,AI服務器處於持續放量階段。
圖表13:全球AI服務器出貨量預測
資料來源:Trendforce,中金公司研究部
圖表14:中國AI服務器出貨量走勢
資料來源:中商產業研究院,中金公司研究部
聯盟成員多入局AI,PCIe生態龍頭地位不減。PCI-SIG聯盟已涵蓋超800家企業,目前AI服務器主要供應商,Dell Technologies、IBM、Lenovo均爲PCI-SIG成員,主要芯片供應廠商NVIDIA及Intel也均系PCI-SIG重要成員。目前高速傳輸協議除PCIe之外,由NVIDIA开發的NVLink主要用於連接GPU與CPU、GPU與GPU,主要爲NVIDIA旗下產品提供服務。CXL作爲新興高速串行技術,致力於爲高性能計算機提供服務,支持CPU與其他以CXL形式與CPU相連的設備共享內存,相連設備可直接讀取CPU內存中數據;CXL同時支持一致性模型,該模型在CXL協議一致下可使對修改數據及時更新、追蹤,同時使更改對連接的所有設備可見,以此保障大規模數據傳輸的准確性與速度,CXL建立於PCIe的物理、電氣接口上,與PCIe具有良好的兼容互補性。目前來看,PCIe龍頭地位不減,將憑成熟生態及廣泛兼容性持續受益於AI行情上行。
Retimer芯片需求量有望邁入成長新台階
AI服務器相對於傳統服務器對Retimer需求量有較高提升。AI服務器對數據傳輸質量和帶寬都有所提高,隨着服務器端PCIe 5.0協議逐漸普及,Retimer芯片行業或將受益。據IDC預測,2025年全球整體數據量將達188ZB,國內數據量將達47.9ZB。ChatGPT訓練參數量爲萬億規模數據,主要大模型訓練參數量均超十億,且往往需重復訓練多次方能提升模型效果。收集、處理巨量數據集對總帶寬大小及傳輸速度、傳輸穩定性具有較高需求,大規模數據訓練帶來的分布式計算、存儲需求同樣需要快傳輸速度及高傳輸質量。此外,爲保證訓練模型質量,保障原始訓練數據的完整性、真實性,減少數據錯誤及損失同樣至關重要。AI服務器要求傳輸速度快,往往存在大量PCIe 5.0插槽接口需求,同時單插槽接口也將具有多條lane以提供更多、更快的數據傳輸,潛在Retimer芯片需求量大。
圖表15:全球數據規模變化趨勢
資料來源:IDC,中金公司研究部
圖表16:中國數據規模變化趨勢
資料來源:IDC,中金公司研究部
AI服務器整體出貨量提升,Retimer受益於乘數效應。PCIe協議提供多樣化的通道數量選擇,整體傳輸速度=單條lane傳輸速度*通道數量,Retimer芯片使用並非完全基於通道數量,而是由數據傳輸需求所決定。Retimer使用數量的驅動因子主要爲信號損失度+傳輸數據數量。從信號損失度來判斷,其主要受傳輸頻率及傳輸距離影響。隨PCIe協議迭代升級,時鐘脈衝頻率提升時同時導致信號傳輸損耗、丟失問題;而受主板物理空間及布局排布限制,更高時鐘脈衝頻率依舊沿用既有布局,導线長度幾乎不變,損耗問題難以被解決。從傳輸數據數量來判斷,PCIe升級帶來帶寬成倍增長,傳輸數據量同樣將成倍增長,出現更多Retimer芯片需求。據瀾起科技表示,目前一台配8塊GPU的主流AI服務器有8顆甚至16顆PCIe 5.0 Retimer芯片需求[1]。故我們判斷,AI服務器行情上行疊加PCIe協議更新,將擴大Retimer芯片使用數量。
圖表17:Retimer使用數量的影響因素
資料來源:TI官網,中金公司研究部
風險提示
AI服務器出貨量不及預期。我們認爲AI服務器行情上漲對於Retimer芯片具有牽引作用,單體服務器對Retimer芯片數量要求增多疊加服務器整體出貨量提高帶動Retimer需求。AI服務器出貨量受到多因推動,AI服務器出貨量不及預期可能對Retimer芯片需求有一定影響。
PCIe 5.0滲透率不及預期。PCIe 5.0協議滲透率提升爲Retimer芯片需求量提供增長動能。Retimer芯片爲PCIe 5.0傳輸損耗的優選解決方案之一,需求量與支持PCIe 5.0協議產品滲透率變化相關。若受技術、產出等因素影響,PCIe 5.0滲透率不及預期,或對Retimer芯片需求量有所影響。
本文摘自中金公司2024年4月9日已經發布的《智算未來系列五:Retimer,高速互聯新機遇》
唐宗其 分析員 SAC 執證編號:S0080521050014 SFC CE Ref:BRQ161
石曉彬 分析員 SAC 執證編號:S0080521030001
彭虎 分析員 SAC 執證編號:S0080521020001 SFC CE Ref:BRE806
標題:中金:AI行情驅動,Retimer芯片或迎來高速增長期
地址:https://www.iknowplus.com/post/97640.html