當前位置:
首頁 > 科技 > Arm的新CPU和GPU核能否衝擊英特爾老巢?

Arm的新CPU和GPU核能否衝擊英特爾老巢?

全文字數:1721閱讀時間:5分鐘

Arm IP產品線再添生力軍,在CPU和GPU層面均實現躍升,除著力渲染可將智能手機實現PC性能之外,染指筆記本電腦市場的野心愈加明晰,但這回能如願嗎?

文|艾檬

校對|一求

圖源|網路

集微網消息,在連續創造驚人的數字之後,Arm的目光更為長遠。據最新數據顯示,截止2017年底基於Arm的晶元出貨量已達1200億片,約佔整體市場四成份額。Arm資深市場營銷總監Ian Smythe表示,到目前為止基於Arm的晶元出貨量應已突破1300億,未來將邁向2000億。2035年預計將有一萬億的互聯設備,而5G、AI、安全、全計算等技術將大行其道,以為用戶提供更自由更互連的浸入式體驗。基於此Arm IP產品線再添生力軍,在CPU和GPU層面均實現躍升,除著力渲染可將智能手機實現PC性能之外,染指筆記本電腦市場的野心愈加明晰。

Cortex-A76的野心

去年Arm發布的Cortex-A75針對AI和ML能力進行了特別優化,同時引入了TrustZone技術(晶元級安全技術)和DynamIQ big.LITTLE拓撲特性。而今年Arm宣布最新旗艦CPU——Cortex-A76,相比上一代在性能上實現了35%的提升,同時降低了40%的功耗,並在機器學習能力上提升了4倍。

「實現上述進步的原因在於,Cortex-A76雖採用和前一代相同的v8.2指令集,但內建的微處理器架構則是從頭開始研發,實現了諸多重大改進,包括解耦合分支預測與指令預取、解碼寬度更大、更高的整數與向量與浮點運算單元等。同時,Cortex-A76是針對7nm工藝定製的全新架構,在搭配7nm工藝時主頻可達到3.0GHz。」Ian Smythe強調。

這一性能相當於PC端英特爾旗下的酷睿i5-7300,如果SoC廠商緩存設計得更好,其性能甚至可以媲美i7。聯想到此前新一代高通驍龍1000版Windows 10Arm筆記本,表明Arm正著力染指PC市場,但能否借Cortex-A76挑戰英特爾/AMD在PC領域的權威還待合作夥伴的力道以及生態的配合。同時Cortex-A76還意欲為智能手機帶來筆記本級別的性能,過發揮比前一代產品高達4倍的機器學習性能,解決雲端持續互動衍生出的延遲以及安全方面的問題。Cortex-A76可謂「身兼重任」。

此外,Arm還提供獨特的POP技術。Ian Smythe提及,基於台積電16FFC的Cortex-A76 POP IP,可提供目前最佳性能;而對於那些尋求頂尖製程並鎖定高端應用的客戶,使用台積電7FF製程的Cortex-A76和Cortex-A55 POP IP將於2018年第四季度上市。Arm POP IP可加速產品的實現,縮短上市時間,並充分利用DynamIQ big.LITTLE的靈活性。

GPU和VPU的跨越

GPU可說是Arm未來要發展AI計算生態的主要角色,從第一代BiFrost架構開始,就已經針對AI計算所需要的各種場景,包含機器學習中的訓練以及推理加速等進行優化。時間節點到了2018年中,Mali-G76新晉成為Arm最新旗艦GPU。

「Mali-G76仍採用Bifrost架構,總核配置上限從32核降為20核,每個核心仍然是3個執行單元,但執行單元的線程數增加到8條,也就是每核心24條線程。加上配備texture mapper以及緩存器的優化等,再度提升了30%的性能密度以及30%的能源效率。在7nm工藝的加持下,其性能可提升1.5-2倍。」Ian Smythe介紹說,「而且新GPU通過支持int8 dot實現了強大的機器學習功能,表現足足是Mali-G72的2.7倍。」

除在GPU領域精進之外,面向未來的8K視覺體驗,Arm推出了最新的高端視頻處理器(VPU)Mali-V76來佔領先機。

Ian Smythe介紹,8K60規格串流需要4K60格式的視頻4倍的帶寬,為此Arm通過加入額外的AXI匯流排,使處理量增加一倍。此外還將行緩衝區從4096個像素增加到8192個,從而帶來額外的效能提升,使得Mali-V76不僅支持8k60解碼和8k30編碼,性能亦幾乎是上一代產品的兩倍。

即使是當前的高端設備,4K仍未成為標準配備,那麼為何市場已開始提前鎖定8K?Ian Smythe認為,產業局勢瞬息萬變,Arm必須針對未來設備的需求提前準備。在未來的高端電視以及更高解析度的AR/VR頭顯領域,Mali-V76將發揮更大作用。而對於一個8K視頻流的替代方案而言,可選擇支持4個60fps的4K視頻流。

AI仍「借力使力」

雖然在AI布局上,Arm看似慢了半拍。但事實上,Arm早在2016年就已經把觸手伸進多個AI應用領域同時發展,包含號稱針對機器學習優化的Bifrost GPU 架構,以及針對高端伺服器晶元的SVE延伸指令集。隨著相關方案陸續成熟,採用者也逐漸增加,Arm在今年2月推出Project Trillium,結合開發環境、演算法與各大主流機器學習框架,布局從終端到雲端所有AI應用開發生態。

而此次推出的無論是CPU還是GPU,在AI性能上均實現了大幅提升,表明Arm的AI布局亦在穩妥推進。

至於沒有推出單獨的AI加速器原因,Ian Smythe特意指出,目前AI還處於初級階段,雖然某些廠商選擇配備單獨的AI加速器,但仍有一些合作夥伴配備GPU來對AI方案進行調適,以其靈活性來進行定製化設計,並可獲得Arm生態體系的廣泛支持。

在近兩年的AI熱潮中,各家新創產業紛紛推出自有的AI加速器,群雄並起。但Arm仍如此「氣定神閑」沒有染指AI加速器內核,或許有更深的考量。但是,無論是對演算法的承載,對計算的優化,對AI生態的構建,Arm的時間或許沒有想像那麼從容。

END


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 半導體投資聯盟 的精彩文章:

挖礦晶元退潮,供應鏈廠商榮景難續

TAG:半導體投資聯盟 |