據Tomshardware引述TF International Securities 分析師Ming-Chi Kuo的報道,因爲市場對 Nvidia 尖端Blackwell雙芯片設計的需求正在超過 Nvidia 的低端單芯片設計所以這家市值萬億美元的 GPU 制造巨頭已經更新了其Blackwell 架構路线圖,優先考慮採用 CoWoS-L 封裝的雙芯片設計。

圖注:英偉達此前公布的路线圖

報道進一步指出,從今年第一季度开始,Nvidia 將專注於其 200 系列 Blackwell GPU。但值得注意的是,這僅包括 200 系列的多芯片版本,例如 GB200 NVL72 — 200 系列的單芯片版本,例如 B200A,已經停產。

同樣,Nvidia 顯然計劃優先考慮利用多芯片的B300系列型號,尤其是 GB300 NVL72。由於對多芯片變體的需求較高,僅使用單個芯片的 B300 GPU 變體在制造中將處於低優先級。Nvidia 的高優先級 Blackwell GPU 型號使用台積電更先進的 CoWoS-L 技術。已停產的 B200A 和單芯片 B300 GPU 都使用 CoWoS-S。

Ming-Chi Kuo表示,由於這些變化,某些供應商將受到“特別嚴重的打擊”。


英偉達路线圖,變了哪些?


按照此前的介紹,英偉達有採用雙芯片設計200 系列,該系列包括 GB200 NVL72 和 HGX B200 等系統產品,使用 CoWoS-L 制造。

Nvidia 表示,新款 B200 GPU 擁有 2080 億個晶體管,可提供高達 20 petaflops的 FP4 馬力。此外,它表示,將兩個 GPU 與單個 Grace CPU 相結合的 GB200 可以爲 LLM 推理工作負載提供 30 倍的性能,同時還可能顯著提高效率。據透露,與 H100 相比,它“將成本和能耗降低了 25 倍。

但Ming-Chi Kuo指出,200 系列不包括此前使用CoWoS-S工藝的單芯片版本B200A,因此它們不需要 CoWoS-S。

分析機構SemiAnalysis此曾表示,Nvidia 計劃推出一款名爲 B200A 的新型 Blackwell GPU,它將是已推遲發布的 B200 GPU 的低端替代品。他們在一份報告中表示,B200A 將包含高達 144GB 的 HBM3E 內存,並消耗高達 1000 瓦的功率,能滿足對低端和中端 AI 系統的需求。按照最初規劃,B200A GPU 將用於 MGX GB200A NVL36 等服務器,該服務器最多支持 36 個 GPU。這可能會吸引那些希望構建較小 AI 模型的超大規模客戶。

值得一提的是,B200A 將基於名爲 B102 的die,“該die也將用於中國版 Blackwell的B20”。

但現在,如Ming-Chi Kuo所說,英偉達的策略變了。他進一步指出,從 2025 年 1 季度开始,Nvidia 將重點轉向 200 系列,同時減少 H 系列的供應。這將進一步減少他們對 CoWoS-S 的需求。

在Ming-Chi Kuo的分析報告中,還對英偉達未來的B300進行了分析。他表示,該系列原來規劃了雙芯片(CoWoS-L)和單芯片(CoWoS-S)設計,包括 GB300 NVL72(雙芯片)和 HGX B300 NVL16(單芯片)等系統。

同樣是SemiAnalysis的消息顯示,Nvidia 的 B300 系列處理器採用了經過大幅調整的設計,仍將採用台積電的 4NP 制造工藝(針對 Nvidia 進行優化的 4nm 級節點,性能增強),但報告稱,它們的計算性能將比 B200 系列處理器高出 50%。性能提升的代價是高達 1,400W 的 TDP,僅比 GB200 高 200W。SemiAnalysis 稱,B300 將在 B200 上市大約半年後上市。

Nvidia B300 系列的第二項重大改進是使用 12-Hi HBM3E 內存堆棧,可提供 288 GB 內存和 8 TB/s 帶寬。增強的內存容量和更高的計算吞吐量將實現更快的訓練和推理,推理成本最多可降低三倍,因爲 B300 可以處理更大的批量大小並支持擴展的序列長度,同時解決用戶交互中的延遲問題。

除了更高的計算性能和更大的內存外,Nvidia 的第二代 Blackwell 機器還可能採用該公司的 800G ConnectX-8 NIC。該 NIC 的帶寬是當前 400G ConnectX-7 的兩倍,並且有 48 個 PCIe 通道,而其前代產品只有 32 個。這將爲新服務器提供顯着的橫向擴展帶寬改進,這對大型集群來說是一個勝利。

據介紹,B300 和 GB300 的另一個重大改進是,與 B200 和 GB200 相比,Nvidia 據稱將重新設計整個供應鏈。該公司將不再試圖銷售整個參考主板或整個服務器機箱。相反,Nvidia 將只銷售搭載 SXM Puck 模塊、Grace CPU 和 Axiado 主機管理控制器 (HMC) 的 B300。因此,將允許更多公司參與 Blackwell 供應鏈,這有望使基於 Blackwell 的機器更容易獲得。

借助 B300 和 GB300,Nvidia 將爲其超大規模和 OEM 合作夥伴提供更多設計Blackwell 機器的自由,這將影響它們的定價甚至性能。

不過,Ming-Chi Kuo指出,雖然基於 B300 的系統計劃於 2026 年大規模出貨,但 Nvidia 和 CSP 目前更青睞使用CoWoS-L封裝的GB300 NVL72 。雖然也使用單芯片、CoWoS-S封裝  B300 系統,但 GB300 NVL72 將優先考慮。

因此,對 CoWoS-L 的需求比對 CoWoS-S 的需求更爲迫切。

爲此,Ming-Chi Kuo指出,產品路线圖的這些轉變將在不同程度上影響 Nvidia 及其供應鏈合作夥伴的表現。某些供應商將受到特別嚴重的打擊,導致其股價近期出現大幅回調。不過,從 Nvidia 的角度來看,CoWoS-S 擴張的放緩/減少主要是由產品路线圖的變化而不是需求下滑所致。這一變化也與台積電將其 CoWoS-L 技術推廣爲主流解決方案的战略計劃相得益彰。


CoWoS-L和CoWoS-S,有何不同?


在上面的介紹中,我們看到了關於CoWoS-L和CoWoS-S的描述。這其實是英偉達CoWoS平台的兩個版本。

據介紹,CoWoS是Chip-on-wafer-on-substrate的簡寫。作爲一種先進的封裝技術,CoWoS具有封裝尺寸更大和 I/O 連接更多等優勢。它允許 2.5D 和 3D 組件堆疊,以實現同質和異構集成。以前的系統面臨內存限制,而當代數據中心則使用高帶寬內存 (HBM) 來增強內存容量和帶寬。CoWoS 技術允許在同一 IC 平台上異構集成邏輯 SoC 和 HBM。

傳統上,按照摩爾定律對晶體管進行規模化有助於滿足提高性能的需求。然而,事實證明,這對於高性能計算 (HPC)、人工智能甚至圖形處理單元 (GPU) 等現代應用而言是不夠的。CoWoS 允許在同一基板上堆疊芯片,從而減少同質或異構邏輯 SoC 之間以及 HBM 之間的互連延遲。

與此同時,硅中介層和有機中介層的使用大大增強了堆疊集成電路的熱管理能力。這直接提高了整個系統的可靠性和使用壽命,同時最大限度地降低了熱節流的風險。

此外,中介層中的電源/接地網絡使用 RDL,並結合深槽電容器 (DTC),不會損害高速應用和內存密集型應用的電源完整性。

正因爲CoWoS 技術有助於在同一中介層和基板上安裝多個邏輯 SoC 和 HBM。這與傳統封裝技術形成鮮明對比,傳統封裝技術過去需要將多個邏輯 SoC 安裝在印刷電路板 (PCB) 上,並在封裝中進行必要的連接。這導致封裝尺寸更大,並增加了材料成本和制造費用。CoWoS 封裝總體上更小,更具成本效益。

隨着AI的火熱,CoWoS需求大增,這就推動台積電大幅擴充CoWoS。據經濟日報在今年年初報道,台積電正積極提高 CoWoS 先進封裝產能,預估 2025 年產能接近翻倍,達到每月 7.5 萬片晶圓,而且因市場需求強勁,會在 2026 年繼續提高產能。

具體而言,如下圖所示,CoWoS有以下三個版本,當中就包括了CoWoS-L和CoWoS-S。

台積電介紹說,CoWoS -S(Chip on Wafer on Substrate with silicon interposer)平台爲超高性能計算應用(如人工智能 (AI) 和超級計算)提供一流的封裝技術。該晶圓級系統集成平台在大型硅中介層區域上提供高密度互連和深溝槽電容器,以容納各種功能性頂部芯片/芯片,包括邏輯芯片,其上堆疊有高帶寬內存 (HBM) 立方體。目前,高達 3.3X 光罩尺寸(或 ~2700mm²)的中介層已准備好投入生產。

CoWoS -R(Chip on Wafer on Substrate with silicon interposer with fan-out RDL interposer)是 CoWoS 先進封裝系列的成員之一,該系列利用再分布層 (RDL) 中介層作爲片上系統 (SoC) 和/或高帶寬內存 (HBM) 之間的互連,以實現異構集成。RDL 中介層由聚合物和銅线組成,相對靈活。這增強了 C4 接頭的完整性,並允許封裝擴展其尺寸以滿足非常復雜的功能需求。

CoWoS  -L 則是 CoWoS(晶圓上芯片)平台上的芯片最後封裝之一。它結合了 CoWoS -S 和 InFO(集成扇出)技術的優點,使用中介層和局部硅片互連 (LSI) 芯片實現芯片間互連,並使用 RDL 層實現電源和信號傳輸,從而提供最靈活的集成。

CoWoS  -L 的 主要特點包括:

1、LSI 芯片用於通過多層亞微米銅线實現高布线密度芯片間互連。LSI 芯片可以在每個產品中採用各種連接架構,例如片上系統 (SoC) 到 SoC、SoC 到芯片組、SoC 到高帶寬內存,並且可以在多種產品中重復使用。相應的金屬類型、層數和間距與 CoWoS  -S 的產品一致。

2、基於成型的中介層在正面、背面和傳輸信號和電源的 InFO 通孔 (TIV) 上具有較寬的 RDL 層間距,可在高速傳輸過程中降低高頻信號的損耗。

3、能夠在 SoC 芯片下方集成獨立嵌入式深溝槽電容器等附加元素,以改善電源管理。


寫在最後


日前,台媒就有消息指出,有大客戶砍掉台積電的CoWoS訂單,郭明淇的消息,讓這個新聞有了另一維度的解析。

郭明淇表示,雖然 CoWoS-S 擴張速度正在放緩,但 CoWoS-R 產能正在增加。他同時提到,對於台積電來說,從 B200 到 B300 的過渡涉及相同的 FEoL 流程。BEoL 變更可以通過 ECO 進行管理。

因此台積電將它們視爲相同的產品,產品過渡的時間對台積電來說並不重要。



標題:英偉達,更新路线圖!台積電中槍?

地址:https://www.iknowplus.com/post/184796.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。