當前位置:
首頁 > 科技 > 英特爾依然是那個英特爾,且看英特爾的城防體系

英特爾依然是那個英特爾,且看英特爾的城防體系

【PConline雜談】數字時代所帶來的變化是深刻的。在這一概念的驅使下,我們不僅發明了新的應用形態,更在這種新的應用及業務需求下規划了整個企業IT架構。在這種新的IT架構中,傳統的計算、存儲、網路等資源已經不再是用戶關注的重點,取而代之的則是包括AI、大數據、雲計算、IoT等在內的各種能力。

在這一IT行業的整體變革中,無數新公司極速崛起。因此,短短几年內,我們在IT的幾乎所有領域都能看到新概念的崛起和流行。

凡有新人笑,便有舊人哭。

新進崛起的IT公司一方面在開拓新的市場和需求,另一方面,他們也在積極的革各大老牌IT企業的命。應用軟體、資料庫、中間件、管理軟體、基礎架構等各個領域的傳統廠牌都在這場轟轟烈烈的變革中受到了或多或少的衝擊。

正如星星之火可以燎原,發生在應用層面的變革絕不會止於應用層面,而是會向著更上游的半導體領域蔓延。那麼這場在應用領域引發無數「血雨腥風」的變革在上游半導體領域是否也會掀起同樣的波瀾?半導體行業的傳統大佬能否靠自己的力量順應並駕馭變革?

沒錯,我們這裡要談的就是英特爾。

變革的黎明,英特爾面臨眾多挑戰

作為行業中當之無愧的領導者,多年以來,英特爾憑藉自身強大的產品和技術能力引領了整個行業的輝煌。但在新時代,英特爾卻面臨著諸多層面的挑戰:

挑戰1:AMD?

以不錯的架構性能為前提,推出了EPYC系列處理器;在相同價位下提供更大的內存通道數和更多的核心數量,成功抬升了自身產品在數據中心市場中的佔有率。。

挑戰2:ARM?

優勢在於其可以提供更好的集成度、可擴展性及能效表現。目前,一些冷存儲、原生Android服務或Serverless計算已經開始嘗試使用ARM處理器。

挑戰3:NVIDIA?

以GPGPU為代表的多元化算力正在AI大熱的加持下迅速崛起。而作為這一領域中的代表,NVIDIA也正迅速擴大自己在數據中心市場中的地位並通過收購及合作拓展自己領土。

此外,包括Gen-Z和RISC-V在內的新架構、新指令集也都開始以自身的優勢挑戰英特爾所主導的傳統計算機架構。如此看來,英特爾的前路的確布滿荊棘。但已經平定四方穩坐龍頭位置十幾年的英特爾,真的就如此後知後覺、沒有防備嗎?

這裡,我們先不說利劍,只談城牆。

英特爾的城防

雖然近幾年在製程工藝領域進展緩慢的英特爾會被消費市場的用戶時常以「擠牙膏」來調侃,但實際上,英特爾並沒有真的閑下來。對於取得優勢之後的英特爾來說,除了在新領域不斷嘗試之外,當然也會投入巨量精力在已經取得優勢的領域中持續鞏固優勢,這才是符合商業邏輯的行為。

經過十幾年間不懈的努力,英特爾已經成功構建起了一圈由六大技術支柱共同組成的堅實城防。

1、 製程與封裝

對於製程與封裝技術的追求目前仍舊是整個半導體行業永久不變的核心目標。

就目前的產品線而言,英特爾的14nm工藝雖不能算是行業中最領先的存在;這是不爭的事實。但論對現有工藝的掌握程度而言,英特爾仍舊是行業中的翹楚。

以英特爾最新推出的第二代至強可擴展處理器而言,其中頂級的至強鉑金9282處理器已經能夠在單一處理器上實現56個物理核心和3.8GB的Turbo頻率,整體TDP達到400W。處理器由兩個Die組成,每個單獨的Die約為694平方毫米。能夠在商用產品中實現這樣的頻率、這樣的核心面積、這樣的功耗密度,足以說明英特爾對14nm工藝及相關封裝技術的熟練程度。即便是量產工藝領先半步的三星和台積電也無法在7nm技術條件下生產出這樣的產品。

這樣恐怖的工藝成熟度意味著使用英特爾至強鉑金9282處理器的系統(目前僅有原廠系統)可以在雙路情況下提供112個物理內核,實現同等機架空間內2倍的計算密度。

而在5月底,使用10nm工藝的Ice Lake處理器也終於千呼萬喚始出來,最終產品將於2019年底最先在筆記本平檯面市。屆時,英特爾將至少追平行業頂尖製程工藝水平,甚至還將在晶體管密度和成品性能等方面再次領先行業。當然,按照以往經驗,新工藝下的數據中心產品則將會在消費級產品面市的一年後上市。

對於英特爾來說,重回行業巔峰需要時間,但這一目標已經被列上日程。

這裡還要順便再提一句。最新推出的英特爾 Agilex FPGA已經採用了10nm工藝,並實現了3D封裝。通過將多個不同功能、不同IP、不同製程的Die進行堆疊之後統一封裝,Agilex能夠在片上實現更完整的功能、更好的集成性和更小的體積。這與在手機領域常見的「先封裝再堆疊」原理相同,但效率不可同日而語。

2、 XPU架構

針對不同的應用負載,算力的多元化在當前技術條件下已經成為公認的趨勢。

雖然競爭對手都會用自己的GPU、ASIC、MIPS等處理器或晶元在某一應用領域對標英特爾的通用處理器,並宣稱自身具備xx倍的優勢;但坦率的講,把針對某一計算類型或某些特定演算法而製造的處理器(晶元)在單一應用場景中與通用處理器來對標性能,這種做法本身是欠妥的。

面對算力多元化的趨勢,英特爾有自己的解決方案——XPU體系。

CISC指令架構雖然強調在單一處理器內針對多種計算類型進行特別優化以獲得更好的應用編程及運行效果,但作為一款通用處理器,其核心目標依然是為所有計算類型提供支持,而非限定在某一特定計算類型。

掌握了這一思路,我們便不難理解英特爾的XPU架構。

在CPU領域中,第二代至強可擴展處理器內部集成了VNNI深度學習加速指令集,能夠針對TensorFlow、Caffe、mxnet等目前主流的深度學習框架提供加速。配合專門的OpenVINO工具包,開發人員可以對程序、演算法和模型進行深度優化,進而在對應的處理器上獲得更高性能。相對於上一代至強鉑金8100系列處理器,加入VNNI指令集的鉑金8200系列處理器能夠在Caffe Resnet-50測試中取得接近2.5倍的性能,而更強大的鉑金9200系列則能夠實現5.2倍的性能。

這種級別的性能提升在基於AI演算法的推理應用有著相當重要的意義,能夠讓用戶在不使用額外協處理器或計算卡的情況下就獲得可觀的推理性能提升,讓AI應用的部署門檻更低、系統構型更簡單。

在實際應用中,VNNI指令集讓京東雲在文本檢測應用中獲得了2.4倍的性能,讓騰訊雲在視頻分析應用中實現了3.26倍的性能,讓微軟在圖像識別應用中獲得了3.4倍的性能,讓阿里巴巴在8種不同工作負載中實現了2-4倍不等的性能。同時,百度自研的PaddlePaddle框架也能在VNNI指令集的加持下獲得2至3倍的推理應用性能。

最右側的一列都是負載優化型至強

當然,除了在指令集方面的進化之外,針對不同的應用類型,英特爾也在至強產品框架內推出了更多負載優化型產品。例如面向NFV領域的後綴為N的系列產品,面向大規模雲化基礎架構的V後綴系列處理器,面向搜索應用的S後綴系列、面向物聯網應用的T後綴系列以及採用Speed Select技術的、後綴為Y的三合一系列處理器(適配多種Profile,在BIOS中切換以實現對相應負載的優化)。此外,英特爾還專門推出了一款面向網路應用及網路邊緣解決方案至強D-1600處理器,基於這款處理器,英特爾還推出了專門應用在CDN等領域的數據加密和壓縮加速卡——QAT。

而除了這些CPU領域中的應用場景細分產品之外,英特爾還有應用在海量數據吞吐設備中的FPGA、面向能效敏感型應用的ATOM系列、專業的神經網路加速晶元NERVANA、面向AI編程用戶和學生群體的Movidius神經網路計算加速棒(U盤設計、無風扇)等等一系列面向不同負載類型和應用場景的產品。

這些產品加在一起共同構成了英特爾的XPU體系。

這些產品雖然無法做到所有計算領域和場景的全覆蓋,但其中的每一款產品都包含了有的放矢的針對性設計,是可以滿足不同類型用戶需求的。

3、 內存和存儲

除了以處理器為中心之外,馮諾依曼計算機架構的最大特點就要算是多級存儲了。

根據性能的不同,計算機內部的存儲部件大致可以分為三層:性能最好的CPU內置緩存、性能第二的系統內存以及性能最差但容量更高的磁記錄存儲。

在通常的認知下,存儲分層顆粒度越小,性能過度越平滑,計算機系統的整體運行效率也就越高。因此,以現在的眼光來審視傳統計算機架構內部的三級存儲劃分,我們很容易發現其中的不合理之處:內存與磁介質存儲之間性能差距過大。快閃記憶體介質的出現能夠通過在兩者之間增加一個熱數據層的方式在一定程度上解決這一問題。

之所以要用「一定程度上」這個詞,是因為即便是在帶寬更高、延遲更小的NVMe協議之下,目前的SSD產品也普遍只能達到3xxx MB/s和ms級響應的性能水平,這與DDR4內存到CPU緩存之間動輒10萬MB/s的帶寬和以ns為單位的延遲之間仍然有巨大的性能差距。

如果再加一層,對於操作系統和應用的挑戰太大,很難在短時間內普及。因此,英特爾給出的解決方案便是傲騰數據中心級持久性內存。

簡單來講,傲騰內存所採用的3D Xpoint介質是一種在延遲響應、傳輸速率、使用壽命等方面遠超過目前的NAND快閃記憶體的產品;而相對於DRAM顆粒,3D Xpoint介質則擁有非易失性和容量方面的優勢。將它與DRAM在DIMM上混合使用能夠在不對現有計算機體系造成太大挑戰的情況下實現計算機性能的大幅提升(現階段,性能提升的幅度與使用場景密切相關)。

第二代至強可擴展處理器已經全面加入了對傲騰數據中心級持久內存的支持。目前,傲騰持久內存有兩種應用模式,一種是APP Direct Mode,另一種是Memory Mode。

在APP Direct Mode中,DRAM與傲騰持久內存同時作為系統內存出現在操作系統與應用面前,應用需要針對兩種內存的性能特點有區別的使用兩種介質;DRAM負責承擔IO性能,而傲騰持久內存則憑藉容量和非易失性的特點提供容量和可靠性。當然,這需要應用在內存操作機制上做出調整並進行針對性的調優。

目前,支持這一模式的主要應用便是SAP的HANA內存資料庫和開源的Redis內存資料庫。在SAP HANA應用中,傲騰持久內存與DRAM的聯合應用創造了9.1B的IO性能世界紀錄,而在Redis中,傲騰持久內存的使用也能帶來最多8倍的性能提升。

在Memory Mode中,傲騰持久內存則成為系統主內存,而DRAM則從系統界面「消失」,只以傲騰內存的高速緩存形式工作。Memory Mode模式下,操作系統和應用均無需進行定製化開發,兩種介質的具體操作完全由驅動等來實現。

可以說,APP Direct Mode能夠提供更好的性能,但需要應用做出改變;而Memory Mode則能夠提供更大的系統內存容量,雖然性能提升因人而異但勝在無需操作系統和應用進行改變。兩者各有利弊,用戶和軟體開發商可以自由選擇。

另一方面,3D Xpoint所具備的非易失性也可使其以傲騰SSD的形式化身為SSD介質之上的另一個存儲層。

當然,英特爾本身也生產多種型號的SSD產品,除提供多種容量之外,PCI-E、SAS、U.2等介面形態也是一應俱全。另外,英特爾還獨創了全新的「尺子型」PCI-E x4 SSD,能夠實現1U空間內576TB容量,1000萬IOPS。

4、 互聯

雲化基礎設施的不斷普及,正在讓集群內部和集群之間的連接效率變得比以往更加重要。同時,隨著網路複雜程度的提升和用戶對網路管理需求的升級,網路設備不僅要提供更高的帶寬及更低的延遲,還要提供更多的操作模式以提升網路的可靠性、可管理性和傳輸效率。

在這方面,英特爾的產品線包含兩大序列,一是500、700、800系列乙太網卡,二是Omni-Path高速網路解決方案。

以2019年最新發布的800系列乙太網卡為例,除了能夠提供100Gb的帶寬之外,網卡還支持英特爾應用程序隊列(ADQ)技術、增強型動態設備個性化(DDP)技術以及RDMA。

ADQ能夠允許用戶根據不同應用的關鍵程度定義數據包收發的優先順序順序,從而實現面嚮應用及數據的網路可管理性。DDP則允許應用程序或系統針對不同的數據封包增加額外、可自定義的表頭,進而讓不同的封包使用不同的傳輸協議,在最大程度上優化網路傳輸的效率,降低延遲。而RDMA則允許無需CPU額外干預的遠程內存直接讀寫,能夠大幅提升大集群、高負載應用中的系統互聯效率。

三種技術結合,帶給800系列乙太網卡的便是更低的延遲和更大的吞吐量。在Radis這樣支持這些技術的先進內存資料庫應用環境中,800系列網卡能夠帶來最高45%的延遲降低和30%的吞吐量提升。

而英特爾推出的Omni-Path高速互聯網路則是包括光纖介面適配器和交換機在內的完整解決方案。Omni-Path目前提供58Gb和100Gb兩種規格的產品,除了支持RDMA之外,Omni-Path還採用了更輕量化、更簡單的消息傳遞庫並且不必在連接建立時於系統和進程中保留連接地址信息,因此Omni-Path是一種用於與Infiniband爭鋒的高性能、低延遲網路架構,面向HPC、AI等應用場景。

5、 軟體

硬體設計越來越複雜,指令集和功能越來越多,這對於編程及應用的效率是一大挑戰。另一方面,編程語言的花樣翻新也同樣需要硬體產品在設計上就給予充分的考慮和支持。

對於英特爾這樣的企業來說,作為產品眾多的行業領導者,光是針對不同操作系統和安全威脅更新設備驅動及固件就會產生極其龐大的工作量。同時,這些軟體產品還要根據新應用的特點和硬體本身架構進行定向支持及優化。這就是為什麼英特爾作為一家半導體/硬體公司卻擁有超過15000人軟體工程師團隊的原因。

6、 安全

與軟體一樣,從硬體、固件和驅動層面保證系統安全是一項非常重要、同時也非常繁重的工作。新安全威脅和漏洞的不斷出現,應用和系統的複雜程度不斷提升都讓這項工作變得十分困難。而當某些漏洞或bug出現在硬體層面時,Intel還需要規劃新的步進來從硬體層面進行修正。當然,本著開放的態度,對於所有已知的bug,英特爾都會在官網公布相關信息以及預計修復的時間和形式,以便讓合作夥伴和最終用戶都能夠做到心裡有數、有備無患。

在我的BGM里打敗我?這是個小概率事件

圍繞處理器及其背後的x86架構,英特爾已經構建了一套涉及計算、存儲、網路連接、軟體驅動固件、優化和硬體設計製造標準在內的龐大體系,並在這套體系的發展和運維過程中積累了海量的經驗、資源及生態合作夥伴。

英特爾將這套城防體系稱為「以數據為中心」的產品架構。的確,在數字時代,數據將成為用戶業務發展的新燃料,而IT架構則是使用這種燃料的發動機。對這一趨勢的理解與把握,英特爾的眼光無疑是準確的。而當一個巨人找准了正確的方向並全速開拔,其動能和勢能都是不可小覷的。

從整個產品生態圖景來看,英特爾目前所面臨的問題是六大支柱其一的工藝製程相對於業界最頂尖水平處於略微落後的情況。顯然,這一情況會在一定程度上動搖英特爾在行業中的領導地位,但這種動搖卻是輕微且可控的。隨著新製程的宣發,英特爾在這一領域中的「落後」進程會很快被補齊。屆時,喧囂會趨於平靜;英特爾仍將是那個我們熟悉的英特爾。

當然,半導體工藝作為整個英特爾大廈的根基,被代工廠商超越這件事本身是一個相當明確的信號。他表明英特爾相對於整個行業的領先優勢正在被拉近,一個不小心就會在某一領域失去冠軍寶座。不過我們仍舊需要清醒的意識到,目前行業中還沒有能在所有維度中挑戰或超越英特爾的人;而這個人在短時間內也不會出現。

我的觀點是:想在英特爾主導的現有計算機體系架構內,實現對英特爾的超越,這件事發生的概率是很低的。而真正能夠威脅英特爾的恰恰是那些今天看似弱小的體系外力量。因為他們所構建的是一個全新體系、一個全新生態。當然,至於兩種體系、兩種生態之間的對抗,何時發生以及以何種形態發生,我們還需要觀察很久。

---------------------------------------------------------

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 驅動網 的精彩文章:

小米有品無線手持掃地機爆品回歸 到手119元還送無紡布
曠視斬獲6冠,彰顯深度學習演算法引擎優勢

TAG:驅動網 |