AMD年終大秀:“終極武器”Instinct MI300X來勢洶洶,瞄准英偉達AI王座
瘋狂一夜,AMD和先後上新。
當地時間周三,AMD舉行“Advancing AI”發布會,除了如期發布諸如Instinct MI300X、MI300A、銳龍8040系列處理器等外,大量AI產業的龍頭公司也來到現場,爲“英偉達挑战者”站台助威。
這些芯片可用於支持人工智能、HPC高性能計算,幫助其在供應支撐人工智能熱潮的半導體競爭中與英偉達展开競爭。AMD MI300 推出後,微軟、Meta就在首批客戶之列。
AMD最強AI芯片全披露
在英偉達佔據絕對地位的AI芯片領域中,AMD是爲數不多具備可訓練和部署AI的高端GPU公司之一,業界將其定位爲生成式AI和大規模AI系統的可靠替代者。AMD與英偉達展开競爭的战略之一,就包括功能強大的MI300系列加速芯片。當前,AMD 正在通過更強大的 GPU、以及創新的CPU+GPU平台直接挑战英偉達H100的主導地位。
Lisa Su在开場演講中談到,包括GPU、FPGA等在內的數據中心加速芯片,未來四年每年將以50%以上的速度增長,從2023年的300億市場規模,到2027年將超過1500億。她表示,從業多年,這種創新速度比她以往見到的任何技術都快。
接下來就是介紹硬件的部分了。
最新發布的MI300目前包括兩大系列,MI300X系列是一款大型GPU,擁有領先的生成式AI所需的內存帶寬、大語言模型所需的訓練和推理性能;MI300A系列集成CPU+GPU,基於最新的CDNA 3架構和Zen 4 CPU,可以爲HPC和AI工作負載提供突破性能。毫無疑問,MI300不僅僅是新一代AI加速芯片,也是AMD對下一代高性能計算的愿景。
介紹稱,Instinct MI300X是一款可以改變遊戲規則的設計,這款數據中心APU混合了總共13個芯片,其中許多是3D堆疊而成,創建了一個帶有24個Zen 4 CPU內核、融合了CDNA 3圖形引擎和8個HBM3堆棧的芯片。總的來說,這款芯片有1460億個晶體管,是AMD投入生產的最大芯片。
AMD表示,與H100 HGX相比,Instinct MI300X加速器在運行大語言模型推理時的吞吐量和時延表現要明顯高出一截,在各項AI和HPC項目中也明顯要高出一頭。
而AMD的Instinct MI300A是世界上第一個數據中心APU,這意味着它在同一個封裝中結合了CPU和GPU,並將與英偉達的Grace Hopper Superchips直接競爭,後者將CPU和GPU放在單獨的芯片封裝中,協同工作。MI300A已經在El Capitan超級計算機中取得了顯著的優勢,AMD正在將這種芯片交付給其合作夥伴。
值得一提的是,除了硬件規格的提升,AMD也在周三宣布了最新版本的ROCm 6开源軟件平台。公司介紹稱,ROCm 6在提升AI加速性能方面取得了顯著進步,特別是在MI300系列加速器上運行Llama 2文本生成任務時,其AI加速性能比前一代硬件和軟件提高了大約8倍。
Lisa Su首談AI三大战略
前不久,AMD在公布2023年Q3財報時,預計到 2024 年數據中心 GPU 收入將超過20 億美元,實現大幅增長。當時,這種加速的收入預測主要取決於以AI爲中心的解決方案,能夠滿足跨行業的各種AI工作負載的能力,這也是最新推出的MI300獲得業界高度關注的一個原因。
AMD的加速芯片之旅,始於第一代基於CDNA計算架構的MI100,通過一些HPC的應用和部署,爲MI200取得更廣泛的商業成功鋪平了道路。MI200量產出貨已有幾年,在大型HPC和前沿AI部署應用方面收獲頗豐,並且是超級計算機500強榜單的第一名。
Lisa Su在大會上首次談到了AMD的三大AI战略:
首先,AMD始終提供通用的、高性能的、節能的GPU、CPU和用於AI訓練和推理的計算方案;
其次,將繼續擴展开放、成熟和對开發人員友好的軟件平台,使得領先的AI框架、庫和模型都完全支持AMD硬件;
第三,AMD將與合作夥伴擴大聯合創新,包括雲提供商、OEM、軟件开發人員等等,實現更進一步的AI加速創新。
微軟、OpenAI等宣布將用AMD芯片替代英偉達芯片
據悉微軟、甲骨文、Meta以及OpenAI都已經表示,他們將使用AMD最新的AI芯片Instinct MI300X取代英偉達圖形處理器,盡管後者對於創建和部署OpenAI的ChatGPT等人工智能程序至關重要。
如果AMD最新的高端芯片在明年初开始出貨時,足以滿足構建和服務人工智能模型的科技公司和雲服務提供商的需求,它可能會降低开發人工智能模型的成本,並對英偉達不斷飆升的人工智能芯片銷售增長構成競爭壓力。
AMD表示,MI300X基於一種新的架構,這種架構通常會帶來顯著的性能提升。它最顯著的特點是擁有192GB的尖端高性能HBM3內存,傳輸數據速度更快,可以適應更大的人工智能模型。
AMD面臨的主要問題是,一直以英偉達芯片爲基礎的公司是否會投入時間和金錢來增加另一家GPU供應商。
AMD周三告訴投資者和合作夥伴,該公司已經改進了名爲ROCm的軟件套件,以與英偉達的行業標准CUDA軟件競爭,從而解決了一個關鍵缺陷。這個缺陷一直是人工智能开發者目前更喜歡英偉達芯片的主要原因之一。
標題:AMD年終大秀:“終極武器”Instinct MI300X來勢洶洶,瞄准英偉達AI王座
地址:https://www.iknowplus.com/post/59070.html