國科微楊應麟：論應用於AI上的低延遲NVMe系統

最新 07-27

7月20-21日，2018全球存儲半導體大會暨全球快閃記憶體技術峰會（簡稱「GSS大會」）在武漢光谷拉開帷幕，大會以「構建快閃記憶體新生態」為主題，針對全球快閃記憶體和存儲半導體的產業新生態、行業新熱點、企業新發展，進行全面分析與解讀。國科微美國研究所總經理楊應麟發表了題為《應用於AI上的低延遲NVMe系統》的主題演講。

以下為演講實錄：

楊應麟：各位嘉賓，我是楊應麟，美國國科微美國研究所的總經理。

今天我給大家演講的內容與AI有關，在我之前的演講嘉賓談到了不同的應用場景以及分類，我們也發現了它還有一些不同尋常的應用場景，包括股市或者癌症治療的一些非常態情況的捕捉，除此之外，還有現在可以和人類下棋的阿爾法狗機器人等等。基於以上不同的分類，我們可以識別出迎面而來的公交車或其他車輛，以及看到人行道是否處於可通行狀況，綠燈是否亮了，以上這些都是人工智慧的具體應用。

比如，在這裡我們看到一名行人正準備過馬路，但是我們又可以看到方向不同，那麼我們到底是轉向左邊還是右邊呢？這個是瞬間做出的決定，它停下然後馬上又跑起來，這就是AI避免公交事故的一個辦法。

所以我們必須有這樣一個系統，將不同的數據進行積累，包括來自感測器和攝象頭的數據，這些數據來了之後，我們必須進行一些處理，如雜訊的過濾，或者是數據格式的處理，數據的安全性壓縮，另外還有機器學習等等。

我們還會有不同的候選模型進行選擇，然後才知道哪個是最好的學習模型範本，看左邊也就是數據處理的部分，在網上或者是一些商場會儲存這些數據，藉助模型版本進行機器學習，然後把他們歸納起來應用，所以這裡有很多的數據。另外還有波音公司的無人駕駛，每小時會有80TB的數據產生，所以我覺得這一切歸根結底都涉及到機器學習，所以我會把這個部分移除。

從數據中心的需求來看，需要很大的功能。我們所做的是虛擬學習，如何使這兩個部分能夠聯繫起來呢？數據和學習，所以我們在中間填補了一些虛擬化。我們有一個這樣的虛擬化儲存器，把它們連接起來，會有很多數據在中間來來回迴轉移，在這個部分讓數據在儲存器中轉移，包括前面我們提到的一個圖片，數據會在這裡被放大或縮小，這就是我們的人工智慧學習的一個演算法。

那麼，我們現在談到這些技術有哪些優勢呢？在這張片子里，我們看到固態硬碟的一個學習部分。正如之前我們提到的無人駕駛的汽車一樣，我們可以去管理和處理這些數據，而且這樣的一個機器學習的過程應該是有一個層級的，最重要的是找到合適的演算法，使我們能夠通過這個演算法建立起這樣的一個級別。另外還有深度學習的一些演算法，大概可能會有50個層級用到這裡面，我們必須要找到一個最好的演算法去使用。因此，這部分是一個有序的模型，有級別的、層級的模型，這些不同的節點都是非常重要的。

還有一個虛擬化機器的數據中心，通過它來處理有什麼好處？基本上會減少處理量，這是一個關鍵點。每年我們會發現和診斷400萬例這樣的例子，所以如果通過這樣的方法幫助我們去了解這些全球被診斷的新增癌症病例，包括去進行數據的分析，還考慮到這些病患是否有足夠的經濟來源，去服藥，去確保在它最終死亡之前能夠找到解決辦法。

下面我想談一下我們的企業，今天早上我也聽到有些學生會受到邀請來到這裡參加大會，這是一個很好的學習機會。我們的公司在台北和矽谷設有研發中心，在成都、北京、上海、深圳等地也有我們的分子公司等。去年國科微在深交所上市，我們的員工有近600人，絕大多數在美國從事研發的工作人員都有博士學位。我們的業務範圍包括四個方面，監控、廣播電視、存儲，還有物聯網。可以說我們的工作涉及到整個市場的不同細分部分，包括企業和專業SSD的市場和消費者市場。在控制器方面，我們獲得了中國信息安全測評中心、國家密碼管理局等多項認證。

下面回到技術方面的介紹，剛才談到了存儲，下面我們看一看數據是如何處理的。在這裡我們可以看到一些數字，假設這些人都在使用智能電話，這意味著每一個人都會產生大量數據。基本上未來的數據收集會來自於很多的方面，包括前面提到的自動駕駛數據等等，我們生活的方方面面都會產生大量的數據。

在這種情況下，我感興趣的是，當我們在街上行走的時候，有人喜歡自拍，而自拍也會產生大量的數據，而且大部分人會用到美顏功能，這些應用都會產生大量的數據。

另外，我想介紹的是我們的低延時存儲的系統。早上聽到了很多這樣的技術，如何使用？我們先來看看關於存儲方面的要求，包括深度學習的演算法，我們有2600萬個這樣的參數，放在網路中進行深入學習，如果把這些匯總起來，可以得到這樣一個圖片。

如果使用一個這樣的監控攝像機，進行一些檢測，例如我們在天安門地區範圍內，放置十個典型的集線器攝象頭，它的性能大家非常清楚，存儲的數據量級是海量的，所以在這個方面我們要去補充一些對儲存的需求。如果我們想知道一張被拍攝的圖片中發生了什麼，需要把這個複雜問題簡化，希望從這裡獲得一些數據，包括前面嘉賓談到控制器，一些製造商已經可以提供這種低延時的產品，所以在技術方面都有很多優勢。

一個非常有意思的圖片，AI訓練了機器狗喝水，但機器狗卻喝了馬桶裡面的水，我覺得十分有趣，這是AI待完善的點。最後，我總結一下，第一點，神經網路使用了大量的數據和內存。第二點，大量數據移動代價很高，我們可以讓處理更接近存儲；第三點，DRAM很昂貴，減少緩存延遲變得越來越關鍵。

(註：文字已通過演講人確認)

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 DOIT 的精彩文章:

※戴爾將重新上市，但不會與VMware合併
※浪潮存儲李輝：新技術新應用智慧驅動新數據時代

TAG:DOIT |