Apple 今天發布了 M4,這是一款爲全新iPad Pro提供非凡性能的最新芯片。M4 採用第二代 3 納米技術構建,是一款片上系統 (SoC),它提高了 Apple 芯片行業領先的能效,並實現了 iPad Pro 令人難以置信的輕薄設計。它還配備了全新的顯示引擎,可驅動 iPad Pro 上突破性的 Ultra Retina XDR 顯示屏實現令人驚嘆的精度、色彩和亮度。

新芯片的CPU擁有多達10個核心,而新的10核GPU則建立在M3引入的下一代GPU架構之上,並首次爲iPad帶來動態緩存、硬件加速光线追蹤和硬件加速網格着色功能時間。M4 擁有 Apple 有史以來最快的神經引擎,每秒能夠執行高達 38 萬億次操作,這比當今任何 AI PC 的神經處理單元都快。結合更快的內存帶寬、CPU 中的下一代機器學習 (ML) 加速器以及高性能 GPU,M4 使新款 iPad Pro 成爲一款極其強大的人工智能設備。

蘋果硬件技術高級副總裁 Johny Srouji 表示:“搭載 M4 的新款 iPad Pro 是一個很好的例子,展示了如何構建一流的定制芯片來實現突破性產品。” “M4 的高能效性能及其全新顯示引擎,使 iPad Pro 的輕薄設計和改變遊戲規則的顯示成爲可能,而 CPU、GPU、神經引擎和內存系統的根本改進使 M4 非常適合了解利用人工智能的最新應用程序。總而言之,這款新芯片使 iPad Pro 成爲同類設備中功能最強大的設備。”


台積電第二代3nm工藝


M4 由 280 億個晶體管組成,採用第二代 3 納米技術構建,進一步提高了 Apple 芯片的功效。M4 還採用採用开創性技術設計的全新顯示引擎,實現 Ultra Retina XDR 顯示屏令人驚嘆的精度、色彩准確度和亮度均勻性,這是一種通過結合兩個 OLED 面板的光线創建的最先進的顯示屏。

從這個描述我們可以高度確定。蘋果對“第二代 3nm 工藝”的描述與台積電的第二代 3nm 工藝 N3E完全吻合。他們的 3nm 工藝節點的增強版與 M3 系列芯片使用的 N3B 工藝相比有點遜色;N3E 的密度不如 N3B,但根據台積電的說法,它提供了稍微更好的性能和功耗特性。差異非常接近,以至於架構發揮着更大的作用,但在能源效率的競賽中,蘋果將佔據他們能獲得的任何優勢。

多年來,蘋果作爲台積電新工藝節點發布合作夥伴的地位已經確立,而且蘋果似乎是第一家推出 N3E 工藝芯片的公司。然而,它們不會是最後一個,因爲幾乎所有台積電的高性能客戶預計都將在明年採用 N3E。因此,像往常一樣,蘋果在芯片制造方面的直接優勢只是暫時的。

蘋果公司早期的領導者地位也可能解釋了爲什么我們現在看到的是 iPad 上的 M4(蘋果公司的一款銷量相對較低的設備)而不是 MacBook 系列。到了某個時候,台積電的N3E產能將會迎頭趕上,然後再追上一些。我不會冒險猜測蘋果公司當時對該系列產品的計劃,因爲我真的看不到蘋果公司這么快就停止生產 M3 芯片,但這也讓他們陷入了一個尷尬的境地,不得不在M4存在。

尚未公布新芯片的芯片尺寸(或發布的芯片照片),但晶體管總數爲 280 億個,僅比 M3 的晶體管數量稍多,這表明蘋果並沒有投入過多的新硬件。


M4 CPU 架構:四個性能核,六個效率核心


從 CPU 方面开始,我們面臨着蘋果 M4 CPU 核心設計的一個謎。蘋果公司守口如瓶,而且缺乏與 M3 的性能比較,這意味着我們沒有獲得太多有關 CPU 設計比較的信息。因此,M4 是否代表了蘋果 CPU 設計的分水嶺——新的 Monsoon/A11——還是類似於 A17 中的 Everest CPU 內核的小更新,還有待觀察。當然,我們希望後者,但如果沒有更多細節,我們將根據我們所知道的情況進行工作。

Apple 關於 SoC 的簡短主題演講指出,性能和效率核心都實現了改進的分支預測,對於性能核心,還實現了更廣泛的解碼和執行引擎。然而,這些與蘋果爲 M3 所做的廣泛聲明相同,因此這本身並不代表新的 CPU 架構。

據蘋果介紹,M4 擁有全新的多達 10 核的 CPU,其中最多包含四個性能核心,現在包含六個效率核心。下一代內核具有改進的分支預測功能,爲性能內核提供更廣泛的解碼和執行引擎,爲效率內核提供更深層次的執行引擎。這兩種類型的核心還具有增強的下一代機器學習加速器。

與前代 iPad Pro 中強大的 M2 相比,M4 的 CPU 性能提高了 1.5 倍。1無論是在 Logic Pro 中處理復雜的管弦樂文件,還是在 LumaFusion 中向 4K 視頻添加高要求的效果,M4 都能提高整個專業工作流程的性能。

然而,Apple M4 CPU 聲稱的獨特之處在於這兩種 CPU 核心類型都是“下一代機器學習加速器”。這與蘋果更廣泛地關注 M4 中的 ML/AI 性能密切相關,盡管該公司並未詳細說明這些加速器的具體用途。由於 NPU 負責完成所有繁重工作,CPU 內核上 AI 增強的目的不再是總吞吐量/性能,而是更多地處理混合在更通用工作負載中的輕型推理工作負載,而無需花費時間和資源來處理專用NPU。

一個有根據的猜測是,蘋果已經更新了他們記錄很少的 AMX 矩陣單元,這些單元從一开始就是 M 系列 SoC 的一部分。然而,最近的 AMX 版本已經支持常見的 ML 數字格式,如 FP16、BF16 和 INT8,因此,如果 Apple 在此進行更改,那么這並不是添加(更多)常見格式之類的簡單明了的事情。同時,如果是 AMX,看到蘋果提及它會有點令人驚訝,因爲他們對這些設備非常保密。

另一個合理的選擇是,Apple 對其 CPU 內的 SIMD 單元進行了一些更改,以添加常見的 ML 數字格式,因爲开發人員可以更直接地訪問這些單元。但與此同時,Apple 一直在推動开發人員從一开始就使用更高級別的框架(這就是訪問 AMX 的方式),因此這實際上可能會發生任何一種情況。

無論如何,無論支撐 M4 的 CPU 核心是什么,有一點是確定的:它們的數量更多。完整的 M4 配置包括 4 個性能核心和 6 個效率核心,比 M3 多 2 個效率核心。精簡版 iPad 型號獲得 3P+6E 配置,而更高級別的配置則獲得完整的 4P+6E 體驗,因此對性能的影響可能是顯而易見的。

在其他條件相同的情況下,與 M3 的 4P+4E 配置相比,添加兩個效率核心不會大幅提高 CPU 性能。但蘋果的效率核心也不應該被低估,因爲即使蘋果的效率核心由於使用了亂序執行而也相對強大。特別是當固定工作負載可以保留在效率核心上而不是提升到性能核心上時,能源效率提升的空間很大。

除此之外,Apple 尚未發布新 SoC/CPU 內核的任何詳細性能圖表,因此幾乎沒有什么硬數據可討論。但該公司聲稱 M4 的 CPU 性能比 M2 快 50%。這大概是針對可以利用 M4 的 CPU 核心數量優勢的多线程工作負載。另外,蘋果在主題演講中還聲稱他們可以以一半的功耗提供 M2 性能,結合工藝節點改進、架構改進和 CPU 核心數量增加,這似乎是一個合理的主張。

然而,與往常一樣,我們必須看看獨立基准的結果如何。


M4 GPU 架構:光线追蹤和動態緩存


M4 的全新 10 核 GPU 建立在 M3 系列芯片的下一代圖形架構之上。它具有動態緩存功能,這是 Apple 的一項創新,可以在硬件中實時動態分配本地內存,從而顯着提高 GPU 的平均利用率。這顯着提高了最苛刻的專業應用程序和遊戲的性能。

與 M4 上的 CPU 情況相比,GPU 情況要簡單得多。最近剛剛在 M3 中引入了新的 GPU 架構(Apple 不像 CPU 那樣頻繁迭代這種核心類型),Apple 幾乎已經確認 M4 中的 GPU 與 M3 中的架構相同。

擁有 10 個 GPU 核心,高級配置與 M3 上的配置相同。這是否意味着各種塊和緩存與 M3 真正相同還有待觀察,但蘋果並沒有對 M4 的 GPU 性能做出任何聲明,無論以何種方式都可以解釋爲它優於 M3 的 GPU。事實上,iPad 較小的外形尺寸和更有限的冷卻能力意味着 GPU 在任何持續的工作負載下都會受到熱量限制,特別是與 M3 在 14-14 等主動冷卻設備中的表現相比。英寸 MacBook Pro。

無論如何,這意味着 M4 配備了 M3 GPU 引入的所有主要新架構功能:光线追蹤、網格着色和動態緩存。蘋果也強調,硬件加速光线追蹤也首次登陸 iPad,在遊戲和其他圖形豐富的體驗中實現更真實的陰影和反射。硬件加速網格着色也內置於 GPU 中,可提供更強大的幾何處理能力和效率,從而在遊戲和圖形密集型應用程序中實現視覺上更加復雜的場景。M4 使 Octane 等應用程序中的專業渲染性能得到了巨大提升,現在比 M2 快四倍。

這裏,我們不強調光纖追蹤,但網格着色是一種重要的下一代幾何處理方法。與此同時,動態緩存是 Apple 對其在 M 系列芯片上改進的內存分配技術的術語,該技術可以避免從 Apple 統一的內存池中向 GPU 過度分配內存。

通過對 CPU 和 GPU 的這些改進,M4 保持了 Apple 芯片業界領先的每瓦性能。M4 只需一半的功耗即可提供與 M2 相同的性能。與輕薄筆記本電腦中最新的 PC 芯片相比,M4 只需四分之一的功耗即可提供相同的性能。

除了 GPU 渲染之外,M4 還獲得了 M3 更新的媒體引擎塊,該塊來自 M2,對於 iPad 使用來說是一個相對重要的事情。最值得注意的是,M3/M4 的媒體引擎模塊增加了對 AV1 視頻解碼(下一代开放視頻編解碼器)的支持。雖然 Apple 非常樂意爲 HEVC/H.265 支付版稅以確保其在其生態系統中可用,但免版稅的 AV1 編解碼器預計將在未來幾年中發揮重要作用和使用,而 iPad Pro可以更好地使用最新的編解碼器(或者至少不必在軟件中低效地解碼 AV1)。

然而,M4 在顯示方面的創新之處在於新的顯示引擎。該模塊負責合成圖像並驅動設備上連接的顯示器,Apple 從未給予該模塊特別多的關注,但當他們對其進行更新時,它通常會立即帶來一些功能改進。

這裏的關鍵變化似乎是啓用蘋果新的夾層“串聯”OLED 面板配置,該配置在 iPad Pro 中首次亮相。iPad 的 Ultra Retina XDR 顯示屏將兩塊 OLED 面板直接疊置在一起,以便顯示屏能夠累計達到蘋果 1600 尼特的亮度目標,而單塊 OLED 面板顯然無法做到這一點。這反過來又需要一個知道如何操縱面板的顯示控制器,不僅要驅動一組鏡像顯示器,還要考慮由於一個面板位於另一個面板之下而導致的性能損失。

雖然與 iPad Pro 沒有直接關系,但看看蘋果是否利用這個機會增加 M4 可以驅動的顯示器總數將會很有趣,因爲普通的 M 系列 SoC 通常僅限於 2 個顯示器,這對於MacBook 用戶的驚愕。事實上,M4 可以驅動串聯 OLED 面板和外部 6K 顯示器,這一點是有希望的,但當 M4 登陸 Mac 時,我們將看到這如何轉化爲 Mac 生態系統。


M4 NPU 架構:新的東西,更快的東西


可以說,蘋果 M4 SoC 的最大焦點是該公司的 NPU,也稱爲神經引擎。自 M1 以來,該公司一直在推出 16 核設計(在此之前的 A 系列芯片上也採用了較小的設計),每一代都提供了適度的性能提升。但蘋果表示,隨着 M4 一代的出現,他們的性能有了更大的飛躍。

M4 NPU 仍採用 16 核設計,額定速度爲 38 TOPS,僅是 M3 中 18 TOPS 神經引擎的兩倍多。巧合的是,僅比 A17 中的神經引擎高幾個 TOPS。因此,作爲基准聲明,蘋果宣稱 M4 NPU 比 M3 中的 NPU 強大得多,更不用說爲以前的 iPad 提供動力的 M2,甚至更早,比 A11 的 NPU 快 60 倍。

不幸的是,問題(再一次)出現在細節中,因爲 Apple 沒有列出所有重要的精度信息 - 無論該數字是基於 INT16、INT8 還是 INT4 精度。作爲目前 ML 推理的法律精度,INT8 是最有可能的選擇,特別是因爲這是蘋果去年 A17 的報價。但自由地混合精度,甚至只是不披露它們,至少可以說是令人頭痛的。這使得同類規格的比較變得困難。

無論如何,即使大部分性能改進來自 INT8 支持而不是 INT16/FP16 支持,M4 NPU 也有望爲 AI 性能帶來顯著的性能改進,類似於 A17 已經發生的情況。由於蘋果是第一批推出帶有我們現在所稱的 NPU 的消費級 SoC 的芯片供應商之一,因此該公司並不害怕在這個問題上大肆宣揚,尤其是與市場上正在發生的事情進行比較。電腦領域。特別是由於蘋果提供的是一個完整的硬件/軟件生態系統,該公司的優勢在於能夠使用自己的 NPU 來塑造他們的軟件,而不是等待爲其發明殺手級應用程序。

按照蘋果的描述,M4 擁有速度極快的神經引擎,這是芯片中專門用於加速 AI 工作負載的 IP 模塊。這是 Apple 有史以來最強大的神經引擎,每秒能夠執行驚人的 38 萬億次操作,比 A11 Bionic 中的第一個神經引擎快了驚人的 60 倍。神經引擎與 CPU 中的下一代機器學習加速器、高性能 GPU 和更高帶寬的統一內存一起,使 M4 成爲一款極其強大的 AI 芯片。借助 iPadOS 中的 AI 功能(例如用於實時音頻字幕的 Live Captions 以及識別視頻和照片中的對象的 Visual Look Up),新款 iPad Pro 允許用戶在設備上快速完成令人驚嘆的 AI 任務。

配備 M4 的 iPad Pro 只需輕按一下即可輕松將 Final Cut Pro 中的 4K 視頻中的主題與其背景分離,並且只需聆聽某人彈鋼琴即可在 StaffPad 中自動實時創建樂譜。推理工作負載可以高效、私密地完成,同時最大限度地減少對應用內存、應用響應能力和電池壽命的影響。M4 中的神經引擎是 Apple 迄今爲止功能最強大的神經引擎,比當今任何 AI PC 中的任何神經處理單元都更強大。


M4內存:採用更快的LPDDR5X


最後但同樣重要的一點是,M4 SoC 的內存功能也得到了顯着改進。鑑於蘋果爲 M4 報價的內存帶寬數據(120GB/秒),所有跡象都表明他們最終在其新 SoC 中採用了 LPDDR5X。

LPDDR5X 是 LPDDR5 標准的中期更新,可提供比 LPDDR5 更高的內存時鐘速度,最高可達 6400 MT/秒。雖然 LPDDR5X 目前的速度高達 8533 MT/秒(並且還會有更快的速度),但根據 Apple M4 的 120GB/秒的數據,這使得內存時鐘速度約爲 LPDDR5X-7700。

由於 M4 將首先應用於 iPad,目前我們還不清楚它的最大內存容量。M3 可以容納高達 24GB 的內存,雖然蘋果在這方面不太可能退步,但也沒有跡象表明他們是否能夠將內存增加到 32GB。與此同時,iPad Pro 都將配備 8GB 或 16GB RAM,具體取決於具體型號。



標題:蘋果推出M4芯片,平平無奇?

地址:https://www.iknowplus.com/post/105650.html

鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播信息之目的,不構成任何投資建議,如有侵權行為,請第一時間聯絡我們修改或刪除,多謝。