ARM發布Cortex-A77 CPU、Mali-G77 GPU，大幅提升AR性能

科技 05-28

查看引用和消息源請點擊：映維網

Cortex-A77 CPU和Mali-G77 GPU

（映維網 2019年05月27日）ARM今天在台北電腦展正式發布了全新的旗艦產品：Cortex-A77 CPU和Mali-G77 GPU，以及更節能，功能更強大的機器學習處理器。

1. Mali-G77

Mali-G77基於全新的 Valhall 架構。與Mali-G76相比，Mali-G77的性能密度提升了30%，能效增加了30%，機器學習性能則達到60% 。對於Mali-G77的性能提升，ARM特別提到了針對移動設備的增強現實性能。

ARM指出：「越來越多的消費者正在尋找全新的移動設備體驗，尤其是AR。AR正越來越多地被用於移動設備，允許用戶改變周遭的環境，以及物理世界和虛擬世界之間的交互。Mali-G77的高端圖形支持可以增強移動設備實現AR功能的能力，並將改變移動遊戲和其他移動用戶體驗。」

值得一提的是，Mail-G77 GPU同時可與全新的Mali-D77顯示處理器協同工作。

1.1 Valhall

Valhall架構是Mali-G77和未來Mali GPU的基礎。Valhall具備以下的新穎功能：

一種新的超標量引擎，可實現能效和性能密度的又一次飛躍

帶有新指令集的簡化標量ISA，更易於編譯

新的動態調度指令

重寫的數據結構可更好地與現代API保持一致，如Vulkan。

儘管新架構存在眾多不同的進步和新功能，但兩個關鍵是執行引擎和紋理映射器。

Mali-G77的執行引擎通過共享對更多通道的控制來提高性能密度。Mali-G76的執行單元線程數為8條，每個著色器核心共有24個FMA通道。但Mali-G77已增加至16條執行單元線程數，32個通道，以及每個著色器核心一個引擎。與Mali-G76相比，這意味著同一區域的計算量增加了33％。

Mali-G77的遊戲性能提升與四重紋理映射器有關，後者提供了四個紋素/周期。這比Mali-G76高2倍，比Mali-G72高4倍。四重紋理映射器為高保真與休閒遊戲帶來了全面的優化。另外，由於ARM增加了Mali-G77的計算能力，這使Mali-G77能夠提供比以往更高的每平方毫米性能。

為了匹配全新的16執行單元線程數的執行引擎，以及四重紋理映射器，Mali-G77已經經過了全面的優化，這包括重新設計LSC和屬性管道（重點關注性能密度和能效）。

ARM指出，藉助新架構，Mali-G77隻需Mali-G72性能的50％即可完成相同的工作。Valhall架構和Mali-G77提高了所有工作負載的能效，使各種內容的性能提高了1.3倍。這為優質產品提供了更長的續航能力，尤其是增強現實。

2. Cortex-A77

Cortex-A77儘管只能算是A76的小改版，但IPC性能提升了20%。A77依然採用7nm工藝生產，與上代一樣是3GHz峰值頻率，這意味著20％的性能提升可以完全歸功於架構的變化。

另外，Cortex-A77的機器學習性能已較兩年前提升了35倍。

ARM指出，提高的性能意味著Cortex-A77非常適合高級用例和高級體驗，如AR和ML。Cortex-A77的高性能可幫助設備實現更高的計算能力。這家公司解釋說，移動設備上的ML用例和AR用例正變得越來越複雜，所以擁有能夠支持這種不斷增長的計算需求的CPU至關重要。

他們表示：「更高的性能同時意味著設備對基於AR的新應用和虛擬體驗的響應能力更強。這包括越來越多地通過AR技術來增強用戶整體遊戲體驗的移動遊戲應用。

另外，Cortex-A77將支持5G兼容設備。

3. 機器學習處理器

ARM同時發布了基於全新架構的機器學習處理器。他們指出，新處理器的優化設計可支持新功能，增強用戶體驗，並為包括移動，虛擬現實和增強現實等各種細分市場提供創新應用。與CPU，GPU和DSP相比，它可以通過高效的卷積，稀疏度和壓縮性能提供巨大的效率提升。

全新機器學習處理器的關鍵功能包括：

4 TOP/s，效率5 TOP/W，可為移動設備提供出色的性能，

可編程層引擎。

採用各種壓縮技術，能夠最大限度地減少系統內存帶寬。

高度優化先進的幾何實現。

支持安全操作模式以保護DNN IP和數據。

高響應性可減少延遲，從而改善用戶體驗。

支持TrustZone系統安全性。

另外，ARM指出全新的機器學習處理器可帶來以下增益：

在邊緣啟用ML處理，節省功耗，減少數據消耗並增強用戶隱私。

靈活的設計支持各種流行的神經網路，包括CNN和RNN。

與其他NPU相比，Winograd將普通濾波器的速度提高了225％，從而能夠在更小的面積實現更高的性能。

通過各種壓縮技術將系統內存帶寬最小化1.5倍-3倍。

通過ACE-Lite主埠和可選的SMMU集成實現緊密的系統集成，並且可以輕鬆支持多個用戶。

與ARM NN兼容，後者是CPU，GPU和NPU的推理引擎，它彌合了現有NN框架與底層IP之間的差距。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 映維VR 的精彩文章: