ARM 架構演進對未來計算意味著什麼？

科技 08-17

ARM 在未來計算設備中將散發什麼樣的魔力？

作者 | Sridhar G Kumar

譯者 | 姜松浩，責編 | 屠敏

出品 | CSDN（ID：CSDNnews）

以下為譯文：

最近，伴隨著具有強大計算能力的設備的出現，我們經常可以聽到的一個常見的名字——ARM。這些具有強大計算能力的設備的「大腦」（處理器）就基於ARM架構，在我們真正討論它為未來計算設備帶來的好處之前，讓我們看看它到底是什麼，以及它與其他替代形式的計算處理器有何不同今天使用。

ARM處理器

ARM，以前稱為高級RISC機器，它是一個用於計算機處理器的RISC（精簡指令集計算）架構系列，它適用於各種環境。Arm Holdings（全球領先的半導體知識產權提供商）開發該架構並將其授權給其他公司，如Apple，Qualcomm等，他們設計自己的產品來實現其中一種架構 - 包括片上系統（SoC）和模塊化系統（SoM）。它還集成了內存、介面、無線電等。ARM還設計了實現該指令集的內核，並將這些設計許可授權給許多將這些內核設計融入自己產品的公司。然後將這些產品與其他組件一起併入設備中，以形成我們作為消費者購買的最終用戶設備。

具有RISC架構的ARM處理器通常比具有複雜指令集計算（CISC）架構的處理器（例如來自大多數個人計算機中的Intel，AMD等製造商的x86處理器）需要更少的晶體管，這提高了成本、功耗和散熱。這些特性適用於輕便、便攜、電池供電的設備，包括智能手機和平板電腦，以及其他嵌入式系統。即使對於消耗大量電力的超級計算機，ARM也可以成為一種可行的節能解決方案。

RISC與CISC

RISC和CISC在當今世界的計算設備中廣泛使用。為了真正了解哪些更適合我們的計算需求，需要更深入地了解它們中的每一個。一般而言，RISC被許多人視為對CISC的改進。這是因為CISC是最初的ISA（一種指令集架構），因為RISC是在20世紀80年代初出現的重新設計的ISA。

沒有最好的架構，因為不同的架構在某些情況下可以表現得很好，但在其他情況下卻不太理想。基於RISC的機器每個時鐘周期執行一條指令。CISC機器可以具有特殊指令以及執行多個周期的指令。這意味著在CISC體系結構上執行的相同指令可能需要在RISC機器上執行多條指令。RISC架構需要比CISC更多的工作RAM（內存）來保存，因為它需要載入每條指令、對其執行操作、然後載入下一條指令。

CISC架構可以執行一個更複雜的指令，它可以直接在內存上同時執行相同的操作。因此，RISC架構需要更多RAM，但每個時鐘周期總是執行一條指令以進行可預測的處理，這對於流水線操作非常有用。RISC和CISC之間的主要區別之一是RISC強調每個指令的周期效率，而CISC強調每個程序的指令效率。快速處理器取決於執行每個時鐘周期所需的時間、執行指令所需的周期數以及每個程序中的指令數。RISC強調更大的程序代碼量（由於較小的指令集，因此連續完成的多個步驟可能等同於CISC中的一個步驟）。藉助以下公式，通常用於表達計算機性能的性能方程，可以更好地可視化：

績效計算方程

CISC方法試圖通過犧牲每個指令的周期數的方式，來最小化每個程序的指令數量。而RISC則正好相反，以每個程序的指令數量為代價減少每條指令的周期。

RISC ISA強調的是軟體而不是硬體。RISC指令集要求用更少的指令編寫更有效的軟體（例如編譯器或代碼）。CISC ISA在硬體中使用更多晶體管來實現更多指令，甚至更複雜的指令。

RISC需要更多的RAM，而CISC則強調較小的代碼大小，並且使用的RAM總量比RISC少。如今，許多微處理器都具有類似RISC和CISC的屬性，例如類似CISC的ISA，它將指令看作是一串RISC類指令。

ARM的優點及其實現

簡而言之，基於RISC的ARM架構不需要攜帶CISC處理器所包含的大量「包裹」來執行複雜的指令。雖然像英特爾這樣的公司已經在其處理器的設計上投入了大量資金，所以今天它們包括先進的超標量指令流水線，所有這些邏輯意味著晶元上的晶體管更多，更多的晶體管也就意味著更多的能源使用。高端英特爾晶元的性能非常出色，但高端處理器的最大TDP（熱設計功耗）為130W（瓦）。基於ARM的最高性能移動晶元的功耗不到4W，通常要低得多。

這種低功耗是ARM如此特殊的原因，它不會嘗試創建130W的處理器，甚至不能創建60W或20W。該公司只對設計低功耗處理器感興趣。多年來，ARM通過改進微架構設計提高了處理器的性能，但目標功率預算能夠基本保持不變。一般而言，你可以按如下方式分解ARM SoC（片上系統，包括CPU，GPU和MMU等）的TDP，如下所示：多核CPU群集的最大預算為2瓦，GPU大約2瓦特，MMU和其餘的SoC大約為0.5瓦。如果CPU是多核設計，那麼每個核大約會使用600到750毫瓦。

這些都是非常通用的數字，因為ARM生成的每個設計都有不同的特徵。ARM的第一款Cortex-A處理器是Cortex-A8。它僅適用於單核配置，但它仍然是一種流行的設計，可以在少數設備中找到。接下來是Cortex-A9處理器，它帶來了速度提升以及雙核和四核配置的能力。接下來是Cortex-A5核心，它實際上比Cortex-A8和A9慢（每個核心），但功耗更低，製造成本更低。它專為入門級智能手機等低端多核應用而設計。

在性能表現的另一端，Cortex-A15處理器，它是ARM最快的32位設計。它幾乎是Cortex-A9處理器的兩倍，但所有超出的性能優勢也意味著它使用了更多的功率。在實現2Ghz及更高時鐘頻率的競爭中，ARM的許多合作夥伴將Cortex-A15核心設計推向了極限。因此，Cortex-A15處理器確實可以稱得上電池殺手的稱號。儘管，這可能有點不公平。然而，為了彌補Cortex-A15處理器更高的功耗預算，ARM發布了Cortex-A7內核和big.LITTLE架構。

Cortex-A7處理器比Cortex-A9處理器慢，但比Cortex-A5處理器更快。然而，它的功率預算類似於其低端兄弟Cortex-A5。Cortex-A7內核與big.LITTLE配置中的Cortex-A15結合使用時，SoC可以在執行簡單任務時使用低功耗Cortex-A7內核，並在重負載的時候切換到Cortex-A15內核。這種設計結果，可以節省電池同時提供最佳性能。可以在下圖中看到此配置的簡單說明。

big.LITTLE架構

ARM還具有64位處理器設計。Cortex-A53是ARM的64位節能設計。它不會有破紀錄的性能，但它是ARM有史以來最高效的應用處理器。它也是世界上最小的64位處理器。它的更大的兄弟，Cortex-A57，是一個不同的野獸。它是ARM最先進的設計，具有ARM所有Cortex處理器中最高的單線程性能。ARM的合作夥伴很可能會發布基於A53、A57的晶元，並將兩者結合使用。

處理器兩種不同的模式，32位模式和64位模式，ARM有一種可以將計算從32位遷移到64位的處理方法。處理器可以在運行時在這兩種模式之間切換，必要時運行32位代碼或64位代碼。這意味著解碼並開始執行64位代碼的晶元與32位晶元分開（儘管存在重用部分，這樣可以節省面積）。這意味著64位邏輯是隔離的、乾淨的且相對簡單的。64位邏輯不需要嘗試理解32位代碼並找出在每種情況下執行它的最佳方法。這將需要更複雜的指令解碼器。這些領域的複雜性通常意味著需要更多的能源。

ARM 64位處理器的一個非常重要的方面是它們不會比32位處理器使用更多功率。ARM已經成功地從32位升級到64位，但仍在其自定的能源預算範圍之內。在某些情況下，新系列的64位處理器實際上比上一代32位ARM處理器更節能。這主要是由於內部數據寬度（從32位到64位）的增加以及ARMv8架構中額外的內部寄存器的增加。64位內核可以更快地執行某些任務，這意味著它可以更快地關閉電源，從而節省電池壽命。

big.LITTLE架構最強大的使用模型是異構多處理（HMP），它允許同時使用所有物理核心。在這種情況下，具有高優先順序或計算強度的線程可以被分配給「big」核，而具有較低優先順序或較低計算強度的線程（例如後台任務）可以由「LITTLE」核執行。此型號已在三星Exynos中實施，從Exynos 5 Octa系列開始，Apple移動應用處理器從Apple A11開始使用此型號。

這也是軟體發揮作用的地方。big.LITTLE處理技術依賴於操作系統對它是異構處理器的理解。這意味著操作系統需要了解一些核心比其他核心慢。到目前為止，處理器設計通常還沒有出現這種情況。如果操作系統想要執行一個任務，那麼它將把它分發給任何核心，因為它們都具有相同的性能級別。big.little使用特定的內核調度程序，它了解big.little處理器配置的異類性質，並決定每個進程/線程的執行位置。在將來，這個調度器可以進一步優化，以考慮到諸如核心的當前運行溫度或工作電壓等因素。

傳統計算中的ARM

儘管ARM在移動設備中具有壓倒性的優勢，但大多數筆記本電腦和計算機，即對我們的工作流程至關重要的設備都使用基於CISC的處理器。但是最近我們看到了這種趨勢的變化以及更多的基於ARM的PC處理器湧入。2017年底，高通和微軟宣布推出首款採用基於ARM處理器的Windows 10設備。惠普、華碩和聯想都推出了採用高通Snapdragon 835處理器的筆記本電腦。ARM上的Windows 10重新啟動了微軟此前試圖將移動處理器與完整筆記本電腦體驗結合的嘗試。與迄今為止存在的基於Intel的x86計算機相比，它有望提供更好的電源效率、可靠的性能和始終在線的連接。對於這些ARM設備，Qualcomm擁有長達25小時的電池續航時間，以及與英特爾計算機相媲美的即時開機和性能。它還表示，內置的LTE連接將提供比其他可用的配備LTE的Windows 10計算機更快的速度。此外，微軟在過去幾年中不斷改進對ARM晶元的Windows支持，其即將推出的與架構無關的Lite操作系統更證明了微軟對市場上更多的ARM驅動的筆記本電腦的重視程度。

據報道，最近英特爾官員和開發人員告訴Axios，Apple正準備明年推出基於ARM的Macbook。來自於彭博社的一篇報道稱，蘋果計劃在2021年將iOS和macOS應用程序結合起來。有傳言稱蘋果未來幾年將把MacBook筆記本電腦轉換為自己的ARM處理器。但是，以前ARM晶元沒有足夠的性能來更加完善運行的桌面應用程序。彭博社的這份報告重申，運行在ARM上的Mac可能會在2020年到貨。Axios的報告似乎證實了這一說法，並引用了「開發者和英特爾官員」的觀點。然而，除了這些報道，隨著2015年iPad Pro的發布，Apple表明其ARM晶元現在可以處理「PC級」應用程序。自2015年以來，Apple的晶元變得越來越強大，與英特爾的CPU產品相比，每代產品的性能都要強大得多。蘋果傳統上更傾向於對其設備的核心組件進行更多控制，如果有能力的話，那麼蘋果最終希望MacBook能夠使用支持iOS設備的相同（或升級）晶元。

最後一個難題是將x86 macOS程序轉換到ARM指令集架構。從去年開始，我們就聽說Apple正在開發一個名為「Marzipan」的項目，該項目允許開發人員對其應用程序進行一次編碼，並使其在iOS設備和macOS計算機上都能正常工作。幾天前，Apple宣布在其年度開發者大會上發布第一版必備軟體套件。首先，Apple將允許開發人員僅將iPad應用程序移植到Mac，因為iPad應用程序在功能和用戶體驗方面更接近macOS應用程序。最早的時候，開發人員必須提交兩個不同版本的應用程序，這些應用程序為每個平台優化了用戶界面，但底層代碼卻保持不變。

到2020年，Apple的Marzipan軟體套件也有望允許開發人員將他們的iPhone應用程序移植到Mac上。Apple工程師發現將專為小屏幕設計的應用程序移植到桌面上具有挑戰性，這就是為什麼需要更長時間才能實現這種轉換。到2021年，第三方應用程序開發人員將能夠創建一個可在iOS設備和macOS計算機上運行的「單個二進位文件」。據推測，它們在每個外形尺寸上仍然具有不同的用戶界面，但它們要麼更加流暢的適應屏幕尺寸，要麼開發人員必須在每個二進位文件中包含不同的用戶界面。

ARM及其合作夥伴也為伺服器市場發布了重要聲明，他們打算以更強大的Neoverse N1和該晶元的其他變體為目標。最大的公共雲服務提供商亞馬遜甚至已經開始設計自己的ARM CPU，很快也可能會升級到基於N1的處理器。即使谷歌在Chrome OS上一直缺乏支持ARM，儘管操作系統從第一天開始就與該架構無關，但似乎谷歌也正在努力將Snapdragon平台引入一些Chromebook，這反過來又可以在Chromebook上實現原生Android應用程序的更好功能和可用性。但是，最初只支持Snapdragon 845，因為該公司希望將更便宜的Chromebook推向市場。另一個問題似乎是高通寧願將Snapdragon 8cx放入價格在500美元以上的Chromebook中，這可能意味著原始設備製造商將能夠為8cx支付更高的價格。這也可能導致市場上出現高端Chromebook。

總之，隨著ARM架構和半導體行業對於改進的7nm光刻工藝以及投資於ARM設備開發的領先製造商等的進步，我們可以期待一系列新的令人興奮的產品進入市場。有了這個發展方向的預期，我們作為消費者，我們可以期望未來的計算設備能夠為我們提供卓越的性能和高效率，並讓我們將更多的時間投入到我們最擅長的領域：創造力和創新。

原文：https://medium.com/@sridhargkumar11/advances-in-arm-what-it-could-mean-to-the-future-of-computing-2e76417bbfe7

本文為CSDN翻譯，轉載請註明來源出處。

【END】

熱文推薦

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 CSDN 的精彩文章:

※面向對象編程之興衰
※程序員如何利用 Python 解決女朋友不看天氣的壞習慣？

TAG:CSDN |