當前位置:
首頁 > 科技 > 阿里雲蔣江偉:一個含光頂10個GPU,我們要為世界提供70%的算力

阿里雲蔣江偉:一個含光頂10個GPU,我們要為世界提供70%的算力

新智元推薦

編輯:元子

【新智元導讀】6月9日,2020阿里雲峰會在雲端召開,阿里巴巴合伙人、阿里雲智能基礎產品事業部高級研究員蔣江偉出席峰會並做了題為《新基建,新算力:阿里雲基礎設施算力全新升級》的重磅發布。

(以下內容為演講實錄)

? ? ? ? ? ? ? ? ? ? ? ?

大家好,我是阿里雲小邪,今天我在阿里雲飛天園區的雲計算博物館。在我身後是一個阿里巴巴歷史上標誌性的技術:2013年5月,阿里巴巴最後一台小型機在支付寶下線。這標誌著阿里雲從2009年以來自研的飛天操作系統,到2013年完成了IOE整體的替換過程,代表著面向互聯網、面向雲計算的新技術不斷在阿里巴巴演進。今天,我也在雲計算博物館給大家帶來最新的阿里雲技術和產品的發布。

今天,大家都在討論國家的新基建。我認為,創新是驅動國家高速發展的真正源動力,而阿里雲是推動創新的新基建、新底座。

在過去一段時間的疫情期間,我們發現,在教育、直播相關的領域,流量出現了暴漲。很多的業務受到了巨大的挑戰。同時,不少在線業務都得到了爆髮式增長的機會。一方面,流量爆發增長;另一方面,缺少足夠的計算資源。

利用雲計算,可以規避這樣的問題:通過自助服務的方式,可以獲得足夠的計算資源,供應鏈的問題可以有效得到解決。以釘釘為例,我們實現了分鐘級一千個集群的快速交付。另外,在疫情期間,我們也幫助了很多科研機構來開展針對新冠藥物的篩選工作。

阿里雲對於國計民生的一些工作進行了支持。像國家電網,通過阿里雲接入了5.4億個智能終端,覆蓋用戶4.5億戶。

對業務的支撐和高速發展,最核心的基礎是算力。過去幾年以來,阿里雲持續不斷地在對算力進行創新、演進和突破。我們致力於為世界提供70%的算力。

今天,我宣布第七代ECS高主頻實例發布。

大家可以回顧過去十年,阿里雲從第一代到第六代的計算實例。我們從Xen的架構,到KVM的架構,最後到自研的神龍架構。我們第七代實例的技術核心就是基於第三代神龍架構進行研發的。

現在來看一下第七代計算實例的一些性能指標:

從計算性能來看,第七代ECS高主頻實例提升了160%的性能;從計算實例的規格來看,最高能達到192核的CPU;存儲延時下降了70%,性能提升兩倍,存儲的延時進入微秒時代;我們提供了2400萬PPS的網路轉發能力,全面升級到100G的物理網路;容器網卡密度提升6倍,傳輸效率提升5倍。

有人可能覺得用不上這麼高的性能,其實不然。以我的經驗來看,大量的在線業務,尤其是緩存這類的場景,都需要超過百萬的吞吐能力。極高的網路轉發能力可以幫助這樣的產品、系統提高吞吐能力。

計算型實例最關鍵的指標,就是更高的穩定性。我們發布了世界上最高級別的彈性SLA,同時我們也通過硬體的方式實現了QoS策略,可以滿足不同業務場景的差異化需求。像EDA設計、在線遊戲、基因分析、遠程教育、在線購物等等各種互聯網、大數據的場景,阿里雲都提供了強有力的支撐。以遊戲場景為例,這一次計算性能的升級可以大幅提升同一個房間的在線用戶數以及遊戲體驗。

接下來我宣布,含光800雲伺服器大規模商用。

大家應該還記得我們在去年雲棲大會發布的含光800晶元。到今天,我們對含光800雲伺服器已經實現了大規模商用。在AI推理場景,一個含光800晶元的算力相當於10個主流GPU。同時它也兼容多種主流框架,包括TensorFlow、MXNet、Caffe、ONNX,提供了更豐富的場景,適配性也更強。

接下來的重磅發布,是雲原生裸金屬ACK方案。

雲上的客戶,尤其是阿里雲的客戶,都有一個共識,就是容器和物理伺服器是最佳搭檔。

傳統的物理伺服器有很多缺陷。第一,運維複雜度很高;第二,缺乏彈性。而基於神龍架構的裸金屬伺服器提供了非常好的彈性能力,同時具備了虛擬機運維的靈活性,所以生來就是最佳載體。

雲原生裸金屬的容器具備極致的彈性、高效的調度能力、全面的安全。所以相比自建容器,雲原生ACK的QPS提升了30%,計算成本下降50%,安全容器的性能也提升了30%。

像外賣的場景,一般在晚餐、午餐出現業務峰值,需要在這個時間點快速交付計算資源。ACK是最好的選擇。

下面我們來看兩個ACK的demo演示。

第一個,我們來看一下ACK的高效調度。

接下來,我們來看第二個Demo,ACK高效調度含光晶元的資源,把多個業務同時調度到一個晶元上,極高地提高了資源利用率。

前面我們重磅推出了三個產品。第一個是ECS第七代高主頻實例,這是一個里程碑式的發布,代表著整個行業里最先進的計算實例,最高的性能,最有競爭力的計算能力;第二個,我們發布了含光800雲伺服器的大規模商用;第三個,我們發布了雲原生容器加新一代裸金屬伺服器ACK,通過容器和神龍的完美組合,實現了極高的調度能力。

以上我們提到的核心技術進步,都來自於阿里雲飛天的十年自研。我們有神龍計算平台、盤古存儲平台、洛神網路平台。整個飛天操作系統的沉澱和提升,都源於這三個底層平台的持續演進與積累,也驅動著客戶業務的不斷進步。

阿里雲致力於保障客戶業務的連續性,激發客戶業務的持續創新。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

華人教授史弋宇團隊與Kneron合作應用神經網路與硬體協同搜索框架,並獲Facebook研究大獎
YOLOv5來了!基於PyTorch,體積比YOLOv4小巧90%,速度卻超2倍