美國高通華裔高級工程總監：高通如何開創邊緣計算時代？

科技 06-22

高通公司高級工程總監Jilei Hou表示，隨著雲計算時代即將結束，邊緣計算成為焦點，開發人員和公司開始看到從集中式計算流程轉向分散計算流程的主要好處。

「我們正在研究的邊緣計算的一個基本方面是平台創新，以及如何提供最有效的處理工具，以便為行業提供可擴展的支持性影響，」Hou說。

Qualcomm AI Research是Qualcomm Technologies，Inc。的一項倡議，它有一個雄心勃勃的目標：在整個AI領域進行人工智慧研究和開發，尤其是在無線邊緣的設備AI。該公司希望成為基本上無處不在的設備上應用程序的先鋒。

該公司十多年來一直專註於人工智慧; 當他們為公司推出他們的第一個AI項目時，他們是最初認識到該技術的重要性和潛力的公司之一。接下來是深入學習，當時他們成為最早考慮如何將深度學習神經網路帶入設備環境的公司之一。

目前，侯的人工智慧研究團隊正在對生成圖像，視頻或音頻樣本的深度生成模型進行大量基礎研究，廣義卷積神經網路（CNN）提供模型等效於2D和3D旋轉，以及深度使用案例學習圖形，計算機視覺和傳統麥克風或相機之外的感測器類型。

邊緣計算將如何變得無處不在

為了迎接邊緣計算的時代並將AI分配到設備中，高通公司的研究人員正在將注意力轉移到打破設備AI為開發人員提供的障礙上，侯說。從相對意義上講，與雲相比，設備上的計算資源非常有限，因此處理仍然受到我們所擁有的區域和功率限制的限制。

「在如此有限的空間內，我們仍然必須提供出色的用戶體驗，使用例能夠以非常流暢的方式實時執行，」他解釋說。「我們今天面臨的挑戰歸結為電源效率 - 確保應用程序運行良好，同時仍保持在合理的功率範圍內。」

諸如深度學習之類的機器學習演算法已經使用了大量能量，並且邊緣設備以雲不是這樣的方式受到功率約束。基準測試正迅速成為可以從每一焦耳能量中擠出多少處理。

節能創新

Qualcomm AI Research還發布了許多創新技術，旨在使開發人員能夠以高效的方式將工作負載和用例從雲遷移到設備，包括緊湊神經網路的設計，如何通過模型壓縮來修剪或縮小模型大小，有效地編譯模型和量化。

「例如，谷歌正致力於使用機器學習技術在最有效的模型架構中實現搜索，我們正在嘗試使用類似的機器學習技術進行模型量化，壓縮和自動編譯。方式，「侯說。

侯繼續說，許多應用程序開發人員，甚至當今社區的研究人員都只知道或專註於浮點模型，但他的團隊正在考慮的是如何將浮點模型轉換為量化或定點模型，對功耗產生巨大影響。

「對很多人來說，量化可能聽起來很簡單，」侯說。「您只需將浮動轉換為固定點模型。但是一旦你試圖轉換到定點模型，在非常低的位寬--8位，4位或潛在的二進位模型 - 那麼你就會意識到這是一個巨大的挑戰，並且還會設計權衡。「

使用訓練後量化技術，您不依賴於模型再訓練，或者在位寬變得非常低的情況下，轉到二進位模型，您如何通過允許微調來保持模型的性能或精度？

「我們現在處於最方便的位置，進行系統硬體協同設計，以確保我們提供工具，幫助我們的客戶有效地將他們的模型轉換為低位寬定點模型，並允許在設備上非常有效地執行模型，」他解釋。「這絕對是一個改變遊戲規則的方面。」

Qualcomm AI研究用例

「我們專註於提供量化，壓縮和編譯工具，以確保研究人員能夠方便地在設備上運行模型，」侯說。

該公司開發了Qualcomm Snapdragon移動平台，使OEM能夠構建能夠提供身臨其境體驗的智能手機和應用程序。它採用了高通AI引擎，可以在相機，延長電池壽命，音頻，安全性和遊戲等領域實現引人注目的設備AI體驗，硬體有助於確保更好的整體AI性能，無論網路連接如何。

這導致了邊緣計算領域的一些重大創新。這裡只是幾個例子。

個性化的進步。語音是一種變革性的用戶界面（UI） - 免提，永遠在線，對話，個性化和私密。而且，設備上的人工智慧語音用戶界面需要大量的實時事件，但其中最重要的可能是用戶驗證，侯說，這意味著語音用戶界面可以識別誰在說話，然後完全個性化回應和行動。

用戶驗證特別複雜，因為從聲音到音調，每個人的聲音都會隨著季節變化，溫度變化甚至空氣中的水分而變化。為了實現最佳性能，需要高通公司研究人員正在進行的持續學習的進步，這使得模型本身能夠適應用戶語音隨時間的變化。

隨著技術的成熟，情感分析也變得越來越有可能，研究人員正在尋找新的方法來設計並將這些功能和功能整合到語音UI產品中。

有效的學習飛躍。卷積神經網路或CNN模型可以處理所謂的移位不變性屬性，換句話說，只要狗出現在圖像中，AI就應該將其識別為狗，即使它是水平或垂直移位的。然而，CNN模型與旋轉不變性鬥爭。如果狗的圖像旋轉30或50度，則CNN模型性能將明顯降低。

「開發人員今天如何應對這種情況是通過一種解決方法，增加了大量的數據，或增加了更多的輪換數字，」侯說。「我們試圖讓模型本身擁有我們稱之為等效性的能力，這樣它就可以在2D或3D空間中以非常高的精度處理圖像或物體檢測。」

最近，研究人員將這個模型擴展到任意流形，應用來自現代物理學領域的相對論的數學工具，他補充說，使用類似的技術以非常有效的方式設計等效CNN。等效CNN也是一個基本的理論框架，可以在3D空間中實現更有效的幾何深度學習，以便識別具有任意表面的對象並與之交互。

統一架構方法。為了使設備上的AI高效，神經網路必須變得更加高效，並且統一架構是關鍵。例如，即使音頻和語音通過相同的感測器，也可能需要許多不同的任務，例如處理語音識別的分類; 回歸，用於清除音頻中的雜訊以便進一步處理; 和壓縮，它發生在語音呼叫上，具有語音編碼，壓縮，然後在另一側進行解壓縮。

但是，雖然分類，回歸和壓縮是單獨的任務，但是可以開發通用神經網路以在一般上下文中一起處理所有音頻和語音功能。

「一般來說，這可以幫助我們提高數據效率，同時也可以讓模型在不同的任務中非常健壯，」侯說。「這是我們正在積極研究的角度之一。」

研究障礙

侯說，研究人員面臨的障礙一般分為兩類。

首先，研究人員必須擁有可供他們使用的最佳平台或工具，以便他們可以進行研究或將模型移植到設備，確保他們可以從原型設計角度獲得高質量的用戶體驗。

「另一個歸結為從根本上沿著自己的研究路徑前進，研究創新挑戰以及他們將如何開展研究，」侯說。「對於機器學習技術本身而言，我們面臨著非常好的挑戰，但機遇在我們面前。」

模型預測和推理仍處於早期階段，但研究正在取得進展。隨著ONNX越來越廣泛地應用於移動生態系統，模型的普遍性變得更加強大，對象多任務變得更加複雜，邊緣計算的可能性將繼續增長。

「這是關於推動人工智慧創新，以實現設備上的人工智慧用例，並主動擴展利用5G連接邊緣和雲，我們可以在那裡進行靈活的混合培訓或推理框架，」侯說。「通過這種方式，我們可以最好地服務於移動行業並為生態系統服務。」

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 黃葛樹 的精彩文章:

※iOS 13這個新功能，如何做到比Google和Facebook更安全？
※蘋果持續20年的系統安全漏洞，終於在4月修補完成

TAG:黃葛樹 |