第四波計算浪潮到來：人工智慧需要怎樣的硬體？

最新 09-05

來源：本文由電姬翻譯自nextplatform，作者Nick Tausanovitch，謝謝。

美國投資公司Jefferies 最近一份報告稱第四波計算浪潮已經開始，而且正受到物聯網和並行處理方案的發展的推動。自 20 世紀 60 年代以來，計算領域的結構性轉變一直都是由這一領域的主要力量導致的。

在每次轉變中，都會湧現出新的解決方案提供商，並成為主要供應商。在這第四波計算浪潮中，最新的力量是英偉達及其用於高性能計算（HPC）和人工智慧（AI）的並行處理平台，即 GPU 和 CUDA 編程平台。英偉達業務中數據中心部分的增長（從 2016 財年的 3.39 億美元增長到 2017 財年的 8.3 億美元）是這樣的結構性轉變的一個證明。人工智慧和自動駕駛汽車的技術和產品需求是英偉達增長的關鍵推動力，而且這在廣義上都和物聯網有關。但是，物聯網還有其它一些同樣關鍵的安全和網路要求，不容忽視。

人工智慧和並行處理的增長

讓我們先深入了解一下現在正在人工智慧領域發生的結構性轉變。機器學習訓練、推理演算法和相關的技術是人工智慧的基礎，而這些演算法已經存在了幾十年了。而為英偉達等公司創造了巨量機會的轉折點是：

有了跨多個行業的大量有用的訓練數據集；

晶元設計和工藝尺寸的進展讓與機器學習相關的並行處理的成本和功耗特性達到了可以接受的程度。

隨著各種不同行業中許多不同類型的設備都越來越多地與互聯網相連（換句話說就是 IoT 現象），生成的有用數據的量以及機器學習使用這些數據來改善這些行業中用戶體驗的能力都將受到廣泛的影響。作為 x86 CPU 的協處理器，GPU 可以為機器學習帶來大量所需的並行處理。GPU 原本是為遊戲和圖形處理應用設計的。配合 CUDA 等多線程編程環境，人們發現 GPU 是最有效執行機器學習演算法的最優選擇。

第四波計算浪潮是由並行處理和 IoT 驅動的

GPU 中的多線程處理讓我們可以並行地執行類似的任務，而這對最有效地執行機器學習演算法而言是至關重要的。這種處理方式非常不同於 x86 和 ARM 等通用型 CPU——這些處理器是為常見軟體應用所需的單線程處理優化的，比如網頁伺服器和資料庫處理。機器學習演算法也需要處理大量訓練數據，所以現代 GPU 也提供了高速高效的內存存取。

帶有基於 GPU 的多線程處理的英偉達可編程圖形適配器，可以加速圖形和人工智慧計算處理（來自英偉達 2017 年度投資者日的演講）

儘管通用型 CPU 也可以被用於處理機器學習演算法，但卻無法提供必需的大規模計算性能。再加上隨著硅晶元工藝幾何尺寸的演進（也被稱為摩爾定律），單位晶體管的成本也在上漲，而 GPU 等為機器學習優化過的協處理器晶元就成了一種必需品。

安全性和 5G 將驅動第四波浪潮

至於物聯網和第四波計算浪潮，在使用協處理器的並行處理的重要性上，人工智慧和網路安全之間存在很大的相似之處。

我們生活方方面面對普遍安全的需求只會被物聯網進一步放大。如果我們看看近來的分散式拒絕服務（DDoS）攻擊以及當今的設備（筆記本電腦和平板作為攻擊點）可以如何被人侵入從而發動這樣的攻擊，你就可以想見當使用 IoT 作為攻擊點發動攻擊時，攻擊效果將指數式地猛增。預防 DDoS 攻擊的機制將不得不超越以往的範圍，並一直延伸到數據中心伺服器領域，以便解決轉移 DDoS 所需的規模和速度需求。隨著數據中心中數據流量的增長，這種需求還會進一步放大。

這一範式中的另一個關鍵轉變是對流量可見性的需求，以便在網路流量上執行遠程測量或屏蔽流氓訪問流量。我們現在就需要這種東西，而且隨著 5G 網路（帶寬將增長 10 多倍）向新的行業敞開大門以在電信服務提供商網路上提供創新服務，這種需求還會加劇。比如，各種類型的 IoT 感測器和自動駕駛汽車將會在智能手機等移動設備生成的數據之上增加更多數據。為了確保不同類型的流量得到不同水平的保護，將網路分成「片」的能力將變得至關重要。這將需要高速的流量分類和可見性。

Gartner 預測到 2019 年時所有網路流量中的 80% 都將被加密。用於加密這些網路流量的關鍵相關技術是安全套接層（Secure Sockets Layer/SSL）和安全傳輸層（Transport Layer Security /TLS）。當使用這些技術加密流量時，我們就不可能獲得所需的流量可見性。NSS Labs 的一項研究稱在防火牆設備上解密 SSL 流量（以便實現流量的可見性）會讓吞吐量損失 74%，每秒鐘的交易量會減少 87.8%。當密鑰更長時，SSL 解密引擎所需的工作負載中對複雜流量的處理也將增長。這將對延遲性能和服務水平產生顯著的影響。最佳的解決方案是不要在數據中心網路的設備中實現這樣的功能（因為流量在這裡聚合，它的瓶頸會有很大影響），而是將 SSL 加密引擎工作負載分布到所有伺服器上。

使用SmartNIC擴展安全應用

為了讓數據中心伺服器中的網路安全應用實現規模化、高性能和高效率，SmartNIC 平台使用了一種優化過的協處理器 NFP，即網路流處理器（Network Flow Processor）。和 GPU 類似，NFP 是多線程的——單塊晶元上有多達 960 個線程。類似於 GPU 上基於 CUDA 的多線程編程，SmartNIC 中的 NFP 晶元支持使用 C 或更高級的與供應商無關的編程方法（比如 P4 和 eBPF）進行多線程編程。和 GPU 類型，NFP 也可以並行執行多個任務。和 GPU 只能並行執行相似的任務不同，NFP 還能並行執行多個不同的任務——這是網路安全所需要的功能。

帶有基於 NFP 的多線程處理的可編程 SmartNIC，可以加速網路數據包和安全性處理

使用多線程內存存取引擎，NFP 可以在大量內存上實現高速且低延遲的存取，從而可實現對大量複雜流量的並行處理。最後，在人工智慧領域，Caffe 等深度學習框架可以使用在 GPU 上運行的代碼庫加速。類似地，在網路安全領域，分散式虛擬交換、路由、防火牆、DOS、負載平衡以及其它安全和可見性框架都可以使用運行在 NFP 上的代碼庫加速。

數據中心使用協同處理層和多線程編程環境實現的可重配置結構

總而言之，對安全性和可見性的需求將愈發普遍，而且 DDoS 保護和 SSL 或 TLS 解密等技術也需要使用 COTS 和數據中心伺服器以分散式的方式實現。在這種範式中，為了確保網路性能相關的服務的水平以及伺服器的效率，使用協處理器的並行處理是至關重要的。和人工智慧使用 GPU 等優化過的協處理器類似，為網路安全優化的協處理器將會成為實現物聯網世界的第四波計算浪潮的一大主要力量。

為了實現可重配置的結構，我們相信未來的數據中心伺服器將具有兩個協同處理平面——一個用於機器學習和人工智慧，另一個用於網路連接和安全。這些協同處理平面將使用協同處理晶元中針對應用優化的功能（這些功能是為實現最佳性價比指標的伺服器而設計的），從而為創新的多線程編程環境提供支持。

作者簡介

Nick Tausanovitch 是 Netronome 解決方案架構副總裁，負責該公司 SmartNIC 產品的雲數據中心應用。Tausanovitch 希望幫助電信和雲服務提供商實現軟體定義網路（SDN）和網路功能虛擬化（NFV）的願景，同時實現它們的基礎設施的效率的最大化。在加入 Netronome 之前，他負責過博通公司的高端網路處理器產品線，也擔任過 IDT 的電子設計總監（在這裡開發過網路搜索引擎）和 Nortel 的系統架構師（在這裡開發過交換機、路由器和網路處理器）。

今天是《半導體行業觀察》為您分享的第1385期內容，歡迎關注。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 公眾號 的精彩文章:

※這些地方你會去嗎？
※Snapchat如何獲得年輕人青睞
※反搶C羅，穿襠梅西，當足球遇到狗，世界第一運動的魅力已經跨越物種！
※小心肝早上起來不做這件事會導致肝「中毒」！
※這些老兵和軍犬離別的情景令人淚目

TAG:公眾號 |