當前位置:
首頁 > 科技 > Nick McKeown:可編程轉發平面將在此駐足

Nick McKeown:可編程轉發平面將在此駐足

2018年11月14日-16日,「GNTC全球網路技術大會」在南京火熱開幕。作為全球規模最大的網路技術盛會之一,本屆GNTC將聚焦更多熱門技術領域,吸引更多國際組織、產業權威專家,通過1次測試活動、1場頒獎典禮、2場全體大會、7場專題峰會及數十場Workshop,為現場觀眾奉上一場精彩絕倫的網路技術盛宴。

Nick McKeown:可編程轉發平面將在此駐足

打開今日頭條,查看更多精彩圖片

美國國家工程院院士、斯坦福大學教授 Nick McKeown

在大會中,來自美國國家工程院院士、斯坦福大學教授Nick McKeown分享了「可編程轉發平面將在此駐足」的主題演講。其中講到,「我們可以看到在網路當中5G網路趨勢,這些都會影響到我們網路的發展,我相信隨著軟體發展包括對軟體一個編程和持有相信我們可以做到以前做不到的事情,比如說可以快速部署一個網路協議,可以精準監控轉發層。」

以下是Nick McKeown現場演講實錄:

Nick McKeown:我們有一個說法就是很多時候技術也有一定障礙,有的時候技術可能在我們這個連接之間會有一些連接中斷,我們現在是時候要進入5G時代了。

大家早上好,我非常高興來到這裡,我是第一次來到南京,對我來講非常高興來到這裡,今天來發言。今天開始的時候會請大家回答我一個問題,大家可能有一點時差可能有點困了,如果大家去寫這個軟體的話,作為你工作部分請大家舉手,如果你是使用變成請舉手,這裡面包括我們的條碼的一個編輯還有其他一些內容,可以想像一下大家有一個新的崗位,這個時候新崗位是一個非常激動人心的領域,我們將會對一個設備進行編成,我們要選擇兩個設備,一個設備是一個固定式的,這個時候無法對編成進行調控,這個時候是可編成的,我們希望選用哪一個呢?同樣速度同樣計算能力而且成本是一樣的,你會選擇哪一個去使用,非常明顯當然大家會選擇,知道自己一個解決方案會改變,創新就是要義所在,我一定會選擇可編程的一個設備,我說這個之前的話會跟大家說一下我們如何走到今天這一步。現在我們都會能夠想當然認為,有很多人他們都可以編成他們自己網路的行為,基本上每個數據中心在全世界各地,他們都是基於軟體的,這些軟體當然是由我們這樣一個數據中心的來創造的。大家可能對中國情況比較熟悉,在美國以及現在在歐洲也會有這樣一個趨勢。

網路的一個擁有者會控制這個網路的控制層,以前這個數據的控制層來講是由我們一個業主方來控制的,控制整個網路,這是無法避免一個結果,我們必然要這樣做,因為涉及到控制和成本的問題,很多人都會記得在我們電腦行業早期的時候是一個什麼,當時會有非常大的IBM公司做控制器,有專利硬體,專利控制系統,專利這樣一個軟體,後來這個微處理器出來了,就很大一個變化,因為微處理器需要一個開放的界面,這樣人們能夠進行編成,能夠設計不同一個操作系統,有不同操作系統有不同界面,就可以生產多方面的應用。我們網路行業在不斷發展,我們有路由器,專有硬體,專有運營系統,一個結耦或者說一個拆散正在出現,很多像高通還有(英文)以及其他的公司他們會出現商業化所謂的晶元,像我們的這個SDK還有像(英文)還有開放的界面,他們可以實現多個控制層,我們可以看到有新的這樣一些應用,新的特徵可以出現,這些都是交換晶元,他們可以運用大的網路這是在過去十年當中大家對這點非常熟悉,我們控制層也會越來越多,一下子回憶過去20年細節就很難了。

大家覺得對(英文)如果不出生的話我們仍然會有一個(英文)的東西,一方面我們推動有(英文)的系統,大家覺得通過開元方式建設自己的系統,包括(英文)伺服器,這個時候能夠讓我們進行結耦,我們之前這樣一個交換晶元,同時一個成本,我們數據中心一個成本的要義也是驅動因素之一。最後一點我們商業化推廣的半導體的交換晶元,如果每個這個行業進展我們無法構建交換機的晶元。

從服務層我們可以看到,這是我們過去伺服器的樣子,有一個CPU有很多應用垂直整合,有(英文)出來,會進行結合,我們可以看到CPU加上(英文)運行系統以及整個運行都是垂直的整合,現在都是由白整,現在是有X8U加(英文)這是一個現在的架構。他們為什麼要這樣做呢?原因很明確,就大家不要忘掉就是成本一個降低。數據中心如果我們在構建大的數據中心,在全世界各地很有可能大概有50萬左右一個伺服器,對於這樣一個伺服器的對於我們這個交換機基本上是20比1,在我們數據中心這個量有25000個交換機,如果每個交換機我們是一萬美金的話,大概交換機這一項就有25000美金費用。2000美金做一個交換機,總的交換成本就會變成5000萬。有些公司可能已經有很多軟體開發人員可以在自己基礎設施之上架構自己的軟體,這就是每個數據中心在做的事情。他們不僅僅為了省錢,也希望運用控制的問題,軟體怎麼控制,集中我們的這樣控制層更容易來做一些,對公司來講自己也會做一些控制器交換機,這些想法跟他們有不同的想法,他們需要買更多的盒子,這個時候必須簡化,儘可能做到該集中的集中,該分開的分開,他們有一個差異化的網路,阿里巴巴的網路以及騰訊、亞馬遜的網路不一樣的,他們都會構建自己的軟體,主要也會是通過這種方式他們控制他的一個流量,流量一個工程,提高一個使用率。原來低於50%,現在接近百分之百的利用率。

所有設備都是朝著這個方向去發展,我們之前也可以看到,對於這個解耦如何在我們整個網路行業當中將會不斷的出現。實際上我們可以看到在網路當中5G網路趨勢,這些都會影響到我們網路的發展,我相信隨著軟體發展包括對軟體一個編程和持有我們相信我們可以做到以前做不到的事情比如說我可以快速部署一個網路協議,我可以精準監控轉發層,我可以能夠嘗試新的想法,我現在自己有軟體了,可以把我們的網路定製符合我們的需求,可以擁有一個知識很全,這樣我不需要跟其他企業進行分享,這些聽上去都非常好,所有這些我們之前所提到一些東西都還不是真正的事實,為什麼呢?如果我能夠快速去部署一下新的協議,如果希望精準監控我的轉發層正在做什麼,我希望綜合功能整合嵌入到工程當中,希望控制能夠大量數據包,需要能夠改變我們數據包一個處理的方式,我們也被告知,這些事是不可能的,因為成本太高了,或者說速度太慢,電力消耗太多這是我們一個動畫,顯示出一個路由器或者交換機有一個驅動,會有這個控制交換機的操作系統,還有(英文)等等其他一些不同的一個架構。當我們數據包進來以後,他進入一個固定的線路,會是有不同的顏色來代表在不同一個線路當中處理一個速度和方式,這基本上是我們所有路由器工作方式,希望有一個新的能力,對於數據包處理能力我們首先第一個要做的事情就是要能夠寫軟體,這是非常容易的部分,第二個部分將一個新的管路當中一個環節。這個時候你就需要要去構建一個新的晶元,給大家舉一個例子,2010年的時候(英文)和(英文)共同的合作來發布了一個(英文)的標準,(英文)是一個新的方式,非常的簡單,可以去分辨不同的客戶而且在一個虛擬中心區分辨,是最具有利潤,而且是最值得投資的網路領域。四年之後思科才出現了,這就是我們需要改變這個架構。要去增加這樣一個新的能力,實際上是一個非常昂貴的代價,在自己網路當中會去設備廠商那裡面他說我喜歡這些特點,那應該怎麼做呢?他們需要去找那些軟體的團隊,說在這裡幾周之內就能完成,或者找一些貴的廠家,再回來說我們還是可以做的,但是需要幾年的時間。你要花幾年的時間才能增加這樣一個新的功能和特點。

與此同時,如果能找到其他解決方案,並不是效果很好,也許你對這個方案不再感興趣了,你感興趣的話就要替代所有硬體。基本問題就是這樣組建的設備相當於是一種從底層到上面的設計,由下而上的設計,通過晶元設計師也許從來沒有運營過一個網路,確定這樣子的特點,無論在中文還是英文裡面都是含糊不情的含義。這就是我們運行網路的方法。實際上我們還有另外一個頭腦風暴的方式,這個固定功能,可編程的交換器比固定交換器的速度要慢10-100倍。在這裡的話,我並不宣傳思科或者任何一種解決方案,這個時候我們就是能夠看到很多的機會要去創新我們的網路這個才是我們最關注的。

在這裡面SDN第二部分就是當人們組建了一個網路的設備的時候,他們要去控制他的轉發層。實際上這個設計的流程是由下而上,從上至下的,我們要去學習我們所想要的行為,比如說一種語言,如果說一種語言模糊不情去界定我們所想要的行為,然後他就會說在一個晶元上去運營,在CPU或者在任何上面去,無論是交換機或者是什麼上面去運營,這是我們的目標,為什麼現在就會發生呢?我想說現在就在發生是因為我們行業很顧忌其他人,但是沒有真正走出擁抱和追趕高科技行業。

這裡面我們用一些(英文)語言去編成,把他們組合到一起,放到CPU裡面,用CPU的指令,並且我們還使用具體一個領域,當你想變成CPU的時候會有一個編輯語言,放到一個說明器裡面,對於這個任務而言是完美的。因為它是可編程的,可以改變他,找到自己新的應用,比如說自動駕駛汽車裡面,與此同時在過去就是我們的信號處理,你也是寫一個高層的語言編輯到一個電子處理器裡面,你的這個高層語言就確定了它的語言,具體底層流程會有一個指令,知道這個模型知道這個功能的想法,我們現在有雷達還有視頻的編輯,編碼,你可以寫一個變成放到USB裡面,我們過去是用這樣的模式。

現在在這個機器學習裡面也是這樣的,你可以用(英文),如果能夠用TPU的話也可以用這個來編程。組網是怎麼樣的?我們沒有一個具體的處理器,也就是說有一個結構集來幫助我們優化整個的編程和處理器,我們知道有NPU這樣的處理器但是目前的話還是具有一定的風險,在這個過程當中會有一些具體特點的設計,在過去十年裡面我的目標一直都是想要改變這一點,我真的相信我們能夠創造一個解決方案來創造組網,讓行業裡面全面應用,很多技術商也可以提供這個方案,並且速度是非常快的一種創新。

目前的方法就是P4的語言大家都聽說過,而且有人已經用過,是在一個底層架構裡面,是用獨立的協議,這裡是一個協議,大家之前已經見過了左手邊是可編輯的數據集,你可以看到用什麼樣的模型來去處理,每一個階段裡面所有路徑都是可以被識別出來的,而且之前已經預定好的目標或者是項目,而且沒有任何一個階段,他們都不知道,他們都是記憶的序列,這個就是綠色的三角形,我給大家舉一個例子,從左手邊有一個路徑但是(英文)是用不同顏色去顯示的話,第一部分的話我們一旦意識到的話就去分解,然後同時放到這個處理器和記憶裡面去,這個時候相當於結耦了一個TTL。所做的就是通過這樣的記憶匹配再加上第一階段行動就能夠創造出一個新的數據集,在這些極端裡面因為序列都是獨立的項目,獨立的序列這個編程,我們在整個路徑當中就可以實現同時進行,此前這個階段在處理下一個階段了,與此同時能夠處理多種語言包,數據包原來過去的一種比如說過去的話我們有15、20、25不同階段,最終的話所有這些都會回發到數據包裡面,對於IPV4也是一樣的,大家原來已經看過很多P4編碼例子,中間的話能夠告訴我們數據包的頁面是什麼樣子的,左手邊上是綠色的,告訴我們這個編程如何找到這些頁眉,有什麼樣的內容,在整個流程集裡面去處理的。

這裡是一個這樣一個晶元的例子,我並不是這裡來賣晶元的,只是給大家展示一個已經存在的例子,當然我們還會有很多這樣子的案例,這樣子的一個晶元與這個固定功能晶元價格功能是差不多的,我們有IPV4路徑的話,就不用擔心你所做的路徑,因為你可以去選擇上乘的這個頁眉,現在我們的情況就是當大家建立起一個系統的時候,比如說這裡是一個系統的例子,你知道鑒定最主要的原因是有多種情況,我們是否能夠證明可編輯這種交換器的晶元,速度以及功能於固定功能交換器的晶元是一模一樣的呢,因為人們都會有先進為主的方法,我們就問過見過這個組建設備的人,看一下他們是否能夠告訴我們,就做了這樣一個對比,左手邊是一個可編輯的晶元,右手邊是非常流行的一個固定功能的晶元,他們基本上性能是一樣的,速度還有這個容量都是一樣的。我們對他們進行一個對比。

首先來看一下這個4D,4D這個速度基本上都是一樣,我們可以看到速度是最快的,我們看一下這個功率稍微低一點,如果有一個固定功能設備的話,你需要在所有的這個特點上都需要消耗能耗,如果說你要編輯它的話,所有功能和特點都需要進行編程,就會耗能,就是為什麼這個功耗會稍微低一點。這個固定功能設備的話眼上延時是比較低一點的,那是因為他們走的同樣一個路徑,而不是常規的CPU,我們總是覺得可編輯就是與CPU掛鉤,但是實際上你可以去解決這些問題。

另外一點非常有意思的事情,因為是統一的,所以偶爾有的時候也會解決其他的問題,因為在這個路徑當中很容易改變行為,人們很容易抱怨的行為,可變功能交換器的話需要很長的時間,因為它是如此之複雜,你需要很多這種按紐,去改變,有了這種可編程晶元的話只是用圖片去改變,並不是對於這個具體的晶元,在未來化像(英文)還有一些其他的可編輯的設備都是一樣的,他們可以速度做到非常快,基本上可以做到在50秒之內完成一個新的項目的下載。

通過這種統一進來實現這種簡化和快速,我們看一下怎麼去應用,首先人們做的第一件事情就是我在過去的幾年我觀察到了,首先他們希望能夠讓自己的生活更加的簡單,他們不喜歡複雜,他們不喜歡組網太過複雜的特點,如果是編程的話如果實現這一點呢?固定功能晶元上基本上會有45個特點,你知道沒有人願意去買它,事實上你只希望用到其他一部分的功能或者是特點,你就把他們劃掉在思科裡面把不用那些特點的話,在文件裡面刪掉,就會有自己主要一個項目。

比如說在我這裡就是稱作為我的P4,你不知道在未來的話有什麼樣的功能,這就是它的複雜性減輕了,並且消耗的能力也會更少,因為我們要學習在未來使用要是哪一點。他們所增加一些新的特點有一些是可以預測的,比如說一些新的包裹,新的這種渠道或者是新的一些變遷包來進行特殊的處理,或者是一些新的方法來進行一些數據路線在一些數據中心或者是財務中心,我們可以看到會有一些資源的路徑,會有一些財務中心的話,他們是用這樣子的功能。

另外基於我們一個交換器的一個狀況有一種新的對於交通堵塞控制,還有其他一個方式。另外載荷均衡器,這個是在很多大型數據中心非常歡迎,我們可以看到它要麼是一個硬體式的,載荷平衡器成本很高,外部一個索引的訴求,然後這個時候我們能夠選擇哪一個伺服器進行響應。這樣一個載荷的平衡器,到底要把這樣一個數據包裹索引需求交給誰,哪一個伺服器去處理,很多附在會有軟體平衡載荷,他們做的工作是一樣的,會有這樣一個伺服器進行平衡,我們網頁伺服器進行一個應答,索引,我們5-7%的伺服器都可以幫助我們客戶生成收益而不是進行載荷一個過渡的集中,我們這個時候可以意識到載荷平衡其實就是更加智慧化的路由而以,是基於我們伺服器狀況進行一個載荷,我們就可以設計這樣一個載荷平衡器,可以是我們硬體軟體化,像我們P4的就是這樣的。另外還有我們的防火牆。

最後一個例子就是我們的遠程遙感,我們在早期的時候這個項目還有一個很大的可能性,遙測技術我們之前沒有這樣一個固定式遙測技術,我們有可編程的能力的話,這個時候就需要我們遙測的技術,我們一些專業人員來講他們更多了解自己的行業跟背景,想像一下對於網路(英文)怎麼樣進行做的,我們會有(英文)會有其他一些SMP,同樣一個特性,我25年前做研究生學習的時候也是一樣的,對於我們一個ISB來講也會是沒有太多一些變化,所以我們有這樣一個數據包進入到我的網路,當為什麼有的時候會有數據包無法能夠通過呢?我們能夠問一下,哪一個數據包所採用一個通路。在網路當中問這樣的問題是不可以的實現,你可以問一下哪一個數據包從哪一個通道走的,當時告訴我對安全形度來講,我希望能夠高度關注為什麼到達這樣一個位置,數據包運行原則是什麼,每一個交換機都知道,為什麼沒有告訴我呢?對於這個數據包來講我是特定按照這樣一個標準。

這是一個非常明顯的,看上去一個實際的情況。告訴我對於網路功能是什麼,包括性能的表現,到底我的數據包花多長時間來排隊,在我們這樣一個交換機來講排隊等待多長的時間,有的時候數據比較高,很大的問題,我不能換一個交換機,尤其我們排隊的情況,可能這個時候我就知道哪一個交換機有比較多的問題,我會轉發這樣一個數據,你到底需要跟誰分享數據包排隊的情況,如果我能夠知道哪一個是沒問題,哪一個有問題的,綠色是沒問題的,其他的有問題這個時候交換機一個通路可以通過繞路其他的交換機保證數據通路,這個時候就是到底採取哪一個通路,什麼樣通信的準則,排隊的情況以及跟誰能夠分享我暢通的通路,有的時候在我們網路運行過程當中,這些問題都非常重要。我們標記我們一個數據包,標記這樣的話對於所有的交換機都會知道你這個問題的答案。一個特定方式就是我們之前說遙測的網路,實際上是非常靈活的,我們進行標記,通過的時候進行標記,然後我們在每一個交換機經過的時候進行一次標註,這樣之後的話我們就能夠進行實際化一個在線,能夠知道一個通路的情況,會有很多監控系統這樣一個方式,在(英文)展台那邊也會有一個展示。通過這個來講大家都能夠進行參與,都有一個開元式的標準,這是一個時間在我們整個交換機當中分布的情況,每納秒每一個數據包在一個交換機包是多少,是50毫秒,現在可能有7個量級的減少我們現在做的就是能夠去把這樣的數據分享給外部的世界。這樣他們就知道自己可以做到這一點,有可編程的能力知道哪一個信息特別是我想要知道的,現在我們很多一些方式就會是讓我們能夠可能從規模的角度得以應用。

P4的一個語言以及P4(英文)是一個開元的平台,能夠開發出我們這樣一個語言,我們可以開發出共同一個語言,這是P4語言聯盟,可以做智慧交換機等等,我們非常大概4個小時就知道我們怎麼去寫一個簡單的程序,很多人沒有寫過變成語言可能通過我們的培訓在一天時間之內就可以了解網路的特徵自寫編程,這是我們合作夥伴非常廣泛行業參與,如果大家想要了解,大家可以到我們的網站上(英文)界面,最後我想說一下,我們確實可能有現有這樣一個明政,但是數據量太多,對於我們交換量來講有同樣一個能力,在我們固定功能交換機和我們可編程交換機晶元進行選擇的話,如果把兩者進行選擇和比較,我當然會選擇可編程交換機晶元矽谷他們一些供應商正在提供這樣一個可能性。從這一點來講這一路沒有返回的回程票,16納秒是一個速度,第一次我們實現這一點我們相信對每一個處理器處理能夠都能夠達到這樣的水平,我認為這樣一個好消息,這樣的話我們就能夠實現更好處理速度,如果有這樣的可能的話還是建議大家選擇我們可編程處理晶元,你的一個好的想法就是你不需要能夠告訴其他人說到這一點,我相信大家也能夠自己嘗試。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 至頂網 的精彩文章:

思科CoE:卓越行業解決方案煥發新生
Facebook提前一年實現數據中心綠色能源目標

TAG:至頂網 |