英偉達眼裏的競爭對手
英偉達的股價又一次飆上了高點。
在英偉達發布2024財年第四季度財報後,這家驅動AI發展的公司攀上了一個新的高峰:股價一路升至近800美元,總市值近2萬美元,超越谷歌和亞馬遜,成爲美股的第三大上市公司。
而CEO黃仁勳的個人財富也隨之飆升,憑借着3.5%的英偉達股份,他的總資產來到了近700億美元,躋身全球富豪榜前二十。
如今,受到資本熱捧的英偉達儼然一副半導體一哥的形象,即使是排在它前面的微軟和蘋果,在人工智能的發展上也需要向它取取經,順便买點H100來訓練一下自己的大模型。
但是,坐擁AI市場的英偉達真的天下無敵了嗎?它的對手在哪裏?
在英偉達的最新財報中,它將自己的競爭對手一一列出,一共分爲了四大類,分別是設計分立和集成 GPU、定制芯片和其他加速計算解決方案的供應商和許可商、擁有內部團隊設計芯片的大型互聯網服務公司、嵌入到汽車、自動機器和遊戲設備中的 SoC 產品供應商、以及互連、交換和電纜解決方案供應商。
這其中既有大家熟悉的老面孔,也有近幾年隨着英偉達業務擴張而加進來的新面孔,大家不妨來看下其中的佼佼者,它們是如何讓2萬億美元的公司在AI上產生危機感的。
英偉達的老對手
英偉達從來就不缺少挑战者。
從上世紀末开始到如今,圖形處理器的作用愈來愈重要,而在該行業中的佼佼者、定義了GPU這一名稱的英偉達,自然少不了與其他廠商展开競爭,早期的3DFX,後來的ATi,都給英偉達帶來過不小的壓力。
而隨着圖形市場大浪淘沙,這部分廠商的數量迅速縮減,英偉達逐步確立了自己在GPU行業的地位,在2006年ATI被收購之後,還能對英偉達霸主地位造成威脅的,首先就是兩個大家熟悉的老朋友——AMD與英特爾。
單論在GPU方面的技術積累,成立時間較長、並購企業較多的AMD和英特爾,顯然是有自己一份底氣在的,事實上,這兩家也確實在英偉達顯卡大賣的時候,與它展开了一輪AI競賽,紛紛掏出了自己對標H100和A100的得意之作。
AMD早在2022年6月,就推出CPU+GPU架構的Instinct MI300,正式進軍AI訓練端。而在去年6月,又公布了MI300X與MI300A兩款AI加速器, 其中MI300X 採用了8 XCD,4個IO die,8個HBM3堆棧,高達256MB的AMD Infinity Cache和3.5D封裝的設計,支持 FP8 和稀疏性等新數學格式,是一款全部面向 AI 和 HPC 工作負載的設計,而它的晶體管也達到了1530 億顆,成爲了 AMD 迄今爲止制造的最大芯片。
AMD表示,MI300X 在人工智能推理工作負載中的性能比英偉達 H100高出1.6倍,在訓練工作中的性能與 H100相當,從而爲業界提供了亟需的高性能替代品,以取代英偉達的GPU。此外,這些加速器的 HBM3 內存容量也是英偉達 GPU 的兩倍多,達到驚人的 192 GB,使其 MI300X 平台能夠支持每個系統兩倍多的 LLM,並能運行比 H100 HGX 更大的模型。
而在去年12月的“Advancing AI”活動中,AMD爲旗艦 AI GPU 加速器 MI300X專程开了一場發布會,同時推出了配套的ROCm 6.0开放軟件平台,其指出與上一代軟硬件組合相比,使用MI300X和ROCm 6跑Llama 2 70B文本生成,AI推理速度提高了約8倍。
英特爾在AI上的步伐也從未停止過,它瞄准生成式AI市場的主要產品就是Gaudi。爲了進軍深度學習市場,早在2016年8月,英特爾就花費4億美元收購了Nervana Systems,被英特爾收購後,Habana一共發布了2款AI芯片,分別是Gaudi 和Gaudi 2。Gaudi平台從一开始就爲數據中心的深度學習訓練和推理工作負載而構建的AI加速器。其中Gaudi 2於2022年推出,相比第一代,Gaudi 2在性能和內存方面的提升,使其成爲市場上能夠橫向擴展AI訓練的一大解決方案。
英特爾還特意爲受限中國市場推出了專爲訓練大語言模型而構建的最新Gaudi 2新產品——HL-225B夾層卡。HL-225B處理器符合美國工業與安全局發布的有關出口規定,Gaudi2夾層卡符合OCP OAM 1.1規範。這樣一來,客戶便可從符合規範的多種產品中做出選擇,靈活地進行系統設計。
值得一提的是,英特爾在去年年底還首次展示了用於深度學習和大規模生成人工智能模型的Gaudi3 系列 AI 加速器,預計將於2024年上市。據爆料,英特爾 Gaudi 3 將採用 5nm 工藝,帶寬是前代 Gaudi 2(7nm 工藝)的 1.5 倍,BF16 功率是其 4 倍,網絡算力是其 2 倍。
2023年底,生成式人工智能的世界裏上演了一場芯片版的《黃金三鏢客》,身披綠色、紅色和藍色披風的牛仔,屏住呼吸,把手放在了自己的槍套上,只待最後幾秒的來臨,宣布自己的人工智能解決方案。
隨着老對手的不斷追趕,即使是這兩年順風順水的英偉達,也感受到了一點壓力,華爾街日報最近的一篇文章揭露了部分廠商對英偉達的指控,他們稱英偉達傾向於推遲向考慮採用競爭對手人工智能處理器的客戶交付GPU,這種情況讓英偉達客戶噤若寒蟬,有些客戶甚至隱瞞和否認與競爭對手的互動。
英偉達的新對手
英偉達擔憂的,也不只是兩位老對手。
近日,英偉達在向美國證券交易委員會提交的文件中,首次將華爲認定爲人工智能芯片等多個類別的最大競爭對手,英偉達提到的其他競爭對手包括英特爾、AMD、博通和高通,此外還列出了許多重要的雲計算公司,例如亞馬遜和微軟。
英偉達在文件中表示,華爲在供應人工智能芯片方面存在競爭,例如圖形處理單元(GPU)、中央處理單元(CPU)和網絡芯片,其認爲,華爲還是一家雲服務公司,能夠設計自己的硬件和軟件以改進人工智能計算。
值得一提的是,華爲在去年8月正式發布了“昇騰910”AI芯片及“MindSpore”全場景AI計算框架。華爲公司輪值董事長徐直軍在接受媒體採訪時提到,昇騰不以獨立芯片面向市場,而是以融合入板卡服務器以及雲服務的方式推出,AI芯片作爲獨立業務面向市場的情況不會發生也不會實現。
除了華爲這樣的中國廠商外,博通和高通也成爲了英偉達所顧慮的對手之一。
博通一直被許多人所忽略,但它也在人工智能領域發掘到了自己的金礦。根據2020年摩根大通分析師哈蘭·蘇爾的報告,谷歌TPU v1至v4這幾代均是由博通共同設計的,當時它已經开始生產採用7nm 工藝的TPU v4,並开始與谷歌合作設計採用5nm工藝的TPU v5
蘇爾表示,博通的專用集成電路(ASIC)業務2020全年收入爲 7.5 億美元,高於 2016 年的 5000 萬美元,除了芯片設計之外,博通還爲谷歌提供了關鍵的知識產權,並負責了制造、測試和封裝新芯片等步驟,以供應谷歌的新數據中心,博通還與其他客戶如Facebook、微軟和AT&T等公司合作設計ASIC芯片。
就收入而言,博通是全球第二大人工智能芯片公司,僅次於英偉達,其ASIC的銷售額達數十億美元,背後正是谷歌加大 TPU 部署的結果,光是一家谷歌的TPU就讓博通的ASIC收入翻了兩番還多,倘若其他廠商向博通拋來橄欖枝,那么此消彼長,英偉達AI顯卡的訂單就會減少,這也是它被列入英偉達名單的原因。
至於“雙通”的另一位,也就是高通,大家可能以爲它與英偉達的競爭體現在車載芯片市場中,但除了8195和8295這樣的智能座艙芯片外,高通還從另一個領域向英偉達發起了進攻。
去年11月,高通發布了Cloud AI 100 Ultra,其屬於雲 AI 推理加速卡,專爲生成式 AI 和大型語言模型而設計。據高通介紹, Cloud AI 100 Ultra 是一個可編程的 AI 加速器,可以支持最新的 AI 技術和數據格式,其利用高通 AI 堆棧,可以使客戶能夠“在任何地方訓練並在Cloud AI 100 Ultra 上進行推理”,從而支持模型的移植和優化。
事實上,高通早在2020年就推出了Cloud AI 100推理加速卡,2023 年 9 月,MLCommons發布了 MLPerf Inference 3.1 基准測試結果,其中高通展示了其 Cloud AI 100 推理加速器的顯着進步。結果顯示, Cloud AI 100 的性能、能效和延遲顯着提升,尤其是自然語言處理 (NLP) 和計算機視覺網絡,其在基准測試超越了之前的記錄。在多個類別中,Cloud AI 100 在峰值離线性能、能效和延遲減少方面都取得了進步。
高通新推出的Cloud AI 100 Ultra在原來的基礎上進一步加強,明確針對生成式 AI 和大型語言模型的需求,而且高通也着重提到了運營成本這回事,其表示,在雲和企業用例中,與競爭對手相比,高通 Cloud AI 100 Ultra 在生成式 AI(包括 LLMs、NLP 和計算機視覺工作負載)方面每 TCO 美元提供兩到五倍的性能。
當然,高通與其他廠商不同的是,它能夠將 Cloud AI 100 產品所代表的高性能、高能效推理與能夠滿足邊緣市場更廣泛需求的 IP 產品組合相結合,這在當前的技術提供商中很少見,也是它相較於英偉達的獨特優勢。
上面的三位還都是提供產品和解決方案的,更讓英偉達感到頭疼的,還是微軟與亞馬遜這樣的雲計算客戶,身爲客戶,他們爲英偉達帶來滾滾不斷的現金財富,但背地裏,它們卻暗自針對英偉達,避免它一家獨大的情況,這種既是金主又是對手的身份,讓英偉達左右爲難。
微軟在2023年11月的Microsoft Ignite大會上,推出了兩款定制設計的芯片和集成系統:針對人工智能 (AI) 任務和生成式 AI 進行優化的 Microsoft Azure Maia AI 加速器,以及 Microsoft Azure Cobalt CPU——一款基於 Arm的處理器,專爲在 Microsoft 雲上運行通用計算工作負載而設計。
微軟方面表示,這些芯片是微軟提供基礎設施系統的最後一塊拼圖,其中包括從芯片選擇、軟件和服務器到機架和冷卻系統的一切,這些系統經過自上而下的設計,可以根據內部和客戶工作負載進行優化。
亞馬遜從2013年推出首顆Nitro1芯片至今,AWS是最先涉足自研芯片的雲端廠商,已擁有網路芯片、伺服器芯片、人工智慧機器學習自研芯片3條產品线。AWS自研AI芯片版圖包括推理芯片Inferentia和訓練芯片Trainium。2023年初,專爲人工智慧打造的Inferentia 2(Inf2)發布,將計算性能提高了三倍,加速器總內存提高了四分之一,可通過芯片間的直接超高速連接支持分布式推理,最多可支持1750億個參數,這使其成爲大規模模型推理的有力競爭者。
除了英偉達明確提到的這兩位外,Meta、谷歌和特斯拉等巨頭似乎也成了英偉達的威脅。
Meta直到2022年,還主要使用CPU和專爲加速AI算法而設計的訂制芯片組合來運行其AI工作負載,但CPU的效率往往不如GPU。後來Meta取消了於2022年大規模推出訂制芯片的計劃,轉而訂購了價值數十億美元的英偉達GPU。爲扭轉局面,Meta已經在开發內部芯片,並於5月19日公布了AI訓練與推理芯片項目。據介紹,該芯片的功耗僅爲25瓦,佔英偉達等市場領先供應商芯片功耗的一小部分,並使用了RISC-V(第五代精簡指令處理器)开源架構。
谷歌自研芯片TPU早在2016年就公諸於世,可以爲深度學習模型執行大規模矩陣運算,例如用於自然語言處理、計算機視覺和推薦系統的模型。與微軟和亞馬遜相比,谷歌最突出的優勢,就是從系統級的角度設計TPU,單個芯片固然重要,但在現實世界中如何在系統中組合使用則更爲重要。雖然英偉達也從系統角度思考問題,但他們的系統規模比谷歌更小,範圍也更窄。而且谷歌還在 TPU 之間使用了定制的網絡堆棧 ICI。與昂貴的以太網和 InfiniBand 部署相比,這種鏈路延遲低、性能高,類似於英偉達的 NVLink。
而特斯拉,則是從自己自動駕駛的需求出發,推出了兩種自研芯片,分別爲全自動駕駛(FSD)和Dojo D1芯片。FSD芯片用於特斯拉汽車上的自動駕駛系統;Dojo D1芯片則用於特斯拉超級計算機Dojo片,它是一種通用的CPU,目的是爲了加速特斯拉自動駕駛系統的訓練和改進。
甚至於英偉達的最大客戶之一,Open AI也盤算起了自研的可能性,據報道,OpenAI 首席執行官山姆·阿爾特曼 (Sam Altman) 正在籌集資金建設半導體生產設施,生產用於人工智能應用的處理器 。他相信人工智能技術將在未來幾年變得足夠普遍以支持他們自己的半導體供應鏈。報道稱,這家合資企業未來可能將與、和三星代工等公司競爭。
據悉,OpenAI擬籌建的合資企業與總部位於阿布扎比的 G42 和軟銀集團等潛在投資者進行了討論,旨在解決當前和預期的人工智能相關芯片供應短缺問題,討論中提到,可能會籌集 80 億至 100 億美元購买一家成熟的代工廠或建立一個全新的晶圓廠來滿足 OpenAI 及其潛在合作夥伴的需求。
與老對手相比,英偉達對這些新對手的忌憚更多,因爲它們發動的競爭,不在它所熟悉的市場之上,需要考慮顧忌的因素更多,短時間內也沒有合適的應對方法。
英偉達,向何處去
我們對比了英偉達2014至2023這10年財報中所提到的競爭對手,裏面的變動在一定程度上體現了英偉達業務重心的遷移變化,例如當英偉達收購英國基帶芯片廠商Icera,有志於做手機SoC時,就曾在2014年,把高通、博通、聯發科、海思、展訊等廠商列爲對手,但在2015年時放棄手機市場時,就徹底撇除了這部分廠商。
同樣的事情發生在2020年,英偉達首次把擁有內部團隊設計芯片的大型互聯網服務公司作爲競爭對手,這也是英偉達進軍服務器領域後,發現谷歌TPU所帶來的風險與壓力,隨着人工智能風潮的席卷,愈來愈多的企業把自研作爲備選,英偉達也順勢將阿裏巴巴和百度這樣的中國公司加入其中。
比較有意思的是,ARM這樣的圖形技術許可方,曾一度成爲英偉達的競爭對手,但在英偉達打算收購後,就把它刪去了,即使是後續收購失敗,英偉達也將它作爲合作夥伴而非對手這或許意味着英偉達放棄了授權圖形技術的想法,更側重於提供整套解決方案的路线。
如今,對於英偉達來說,AI無疑是重中之重,但只是迭代自己的AI顯卡還不夠,既然自己的對手能夠花大量時間成本去开發去自研,那么近一年賺得盆滿鉢滿,手握充裕現金流的英偉達,也可以撒錢。
根據PitchBook的數據,英偉達自2018年以來參與的五筆最大的風險投資交易都發生在2023年,在過去的幾個月裏,黃仁勳开始瘋狂押寶初創AI企業:Inflection AI、Runway、Cohere……大量企業拿到了珍貴的H100和A100顯卡,成爲了英偉達AI帝國的一員。
對於英偉達來說,想要不被切斷財路,最根本的辦法,就是多建幾條財路,把自己的AI顯卡視作撒出去的種子,押寶各種有可能性的未來,從而喫到最多的AI紅利。
英偉達和競爭對手的這場大戲,不妨在2024年繼續看下去。
標題:英偉達眼裏的競爭對手
地址:https://www.iknowplus.com/post/89987.html