當前位置:
首頁 > 科技 > ARM發布Cortex-A77 CPU、Mali-G77 GPU,大幅提升AR性能

ARM發布Cortex-A77 CPU、Mali-G77 GPU,大幅提升AR性能

查看引用和消息源請點擊:映維網

Cortex-A77 CPU和Mali-G77 GPU

映維網 2019年05月27日)ARM今天在台北電腦展正式發布了全新的旗艦產品:Cortex-A77 CPU和Mali-G77 GPU,以及更節能,功能更強大的機器學習處理器。

1. Mali-G77

Mali-G77基於全新的 Valhall 架構。與Mali-G76相比,Mali-G77的性能密度提升了30%,能效增加了30%,機器學習性能則達到60% 。對於Mali-G77的性能提升,ARM特別提到了針對移動設備的增強現實性能。

ARM指出:「越來越多的消費者正在尋找全新的移動設備體驗,尤其是AR。AR正越來越多地被用於移動設備,允許用戶改變周遭的環境,以及物理世界和虛擬世界之間的交互。Mali-G77的高端圖形支持可以增強移動設備實現AR功能的能力,並將改變移動遊戲和其他移動用戶體驗。」

值得一提的是,Mail-G77 GPU同時可與全新的Mali-D77顯示處理器協同工作。

1.1 Valhall

Valhall架構是Mali-G77和未來Mali GPU的基礎。Valhall具備以下的新穎功能:

一種新的超標量引擎,可實現能效和性能密度的又一次飛躍

帶有新指令集的簡化標量ISA,更易於編譯

新的動態調度指令

重寫的數據結構可更好地與現代API保持一致,如Vulkan。

儘管新架構存在眾多不同的進步和新功能,但兩個關鍵是執行引擎和紋理映射器。

Mali-G77的執行引擎通過共享對更多通道的控制來提高性能密度。Mali-G76的執行單元線程數為8條,每個著色器核心共有24個FMA通道。但Mali-G77已增加至16條執行單元線程數,32個通道,以及每個著色器核心一個引擎。與Mali-G76相比,這意味著同一區域的計算量增加了33%。

Mali-G77的遊戲性能提升與四重紋理映射器有關,後者提供了四個紋素/周期。這比Mali-G76高2倍,比Mali-G72高4倍。四重紋理映射器為高保真與休閒遊戲帶來了全面的優化。另外,由於ARM增加了Mali-G77的計算能力,這使Mali-G77能夠提供比以往更高的每平方毫米性能。

為了匹配全新的16執行單元線程數的執行引擎,以及四重紋理映射器,Mali-G77已經經過了全面的優化,這包括重新設計LSC和屬性管道(重點關注性能密度和能效)。

ARM指出,藉助新架構,Mali-G77隻需Mali-G72性能的50%即可完成相同的工作。Valhall架構和Mali-G77提高了所有工作負載的能效,使各種內容的性能提高了1.3倍。這為優質產品提供了更長的續航能力,尤其是增強現實。

2. Cortex-A77

Cortex-A77儘管只能算是A76的小改版,但IPC性能提升了20%。A77依然採用7nm工藝生產,與上代一樣是3GHz峰值頻率,這意味著20%的性能提升可以完全歸功於架構的變化。

另外,Cortex-A77的機器學習性能已較兩年前提升了35倍。

ARM指出,提高的性能意味著Cortex-A77非常適合高級用例和高級體驗,如AR和ML。Cortex-A77的高性能可幫助設備實現更高的計算能力。這家公司解釋說,移動設備上的ML用例和AR用例正變得越來越複雜,所以擁有能夠支持這種不斷增長的計算需求的CPU至關重要。

他們表示:「更高的性能同時意味著設備對基於AR的新應用和虛擬體驗的響應能力更強。這包括越來越多地通過AR技術來增強用戶整體遊戲體驗的移動遊戲應用。

另外,Cortex-A77將支持5G兼容設備。

3. 機器學習處理器

ARM同時發布了基於全新架構的機器學習處理器。他們指出,新處理器的優化設計可支持新功能,增強用戶體驗,並為包括移動,虛擬現實和增強現實等各種細分市場提供創新應用。與CPU,GPU和DSP相比,它可以通過高效的卷積,稀疏度和壓縮性能提供巨大的效率提升。

全新機器學習處理器的關鍵功能包括:

4 TOP/s,效率5 TOP/W,可為移動設備提供出色的性能,

可編程層引擎。

採用各種壓縮技術,能夠最大限度地減少系統內存帶寬。

高度優化先進的幾何實現。

支持安全操作模式以保護DNN IP和數據。

高響應性可減少延遲,從而改善用戶體驗。

支持TrustZone系統安全性。

另外,ARM指出全新的機器學習處理器可帶來以下增益:

在邊緣啟用ML處理,節省功耗,減少數據消耗並增強用戶隱私。

靈活的設計支持各種流行的神經網路,包括CNN和RNN。

與其他NPU相比,Winograd將普通濾波器的速度提高了225%,從而能夠在更小的面積實現更高的性能。

通過各種壓縮技術將系統內存帶寬最小化1.5倍-3倍。

通過ACE-Lite主埠和可選的SMMU集成實現緊密的系統集成,並且可以輕鬆支持多個用戶。

與ARM NN兼容,後者是CPU,GPU和NPU的推理引擎,它彌合了現有NN框架與底層IP之間的差距。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 映維VR 的精彩文章:

比薩大學研究:HoloLens不適合醫療手術輔助,操作誤差過大
波導AR顯示技術DigiLens完成5000萬美元C輪融資

TAG:映維VR |