中國類腦晶元再傳佳訊

科技 08-01

來源：內容來自[機器之心]，謝謝。

8 月 1 日，頂級學術期刊《自然》雜誌的封面文章介紹了清華大學在通用人工智慧上的新嘗試：一款名為「天機」的全新晶元架構，結合類腦計算和人工智慧演算法，展示了迄今為止從未有人實現過的強大能力。

這篇名為《面向通用人工智慧的混合天機晶元架構》（Towards artificial general intelligence with hybrid Tianjic chip architecture）的論文展示了一輛由新型人工智慧晶元驅動的自動駕駛自行車。試驗中，無人自行車不僅可以識別語音指令、自動控制平衡，還能對前方行人進行探測和跟蹤，並自動避開障礙。

新型晶元結合了類腦計算和基於計算機科學的人工智慧——這種融合技術有望提升各類系統的能力，最終實現通用人工智慧。作為人工智慧的終極目標，人們對於「通用人工智慧」的定義通常是：一種可以執行人類能夠完成的所有任務的 AI。

發展通用人工智慧的方法

在「天機」的論文中，作者介紹了晶元的設計思路以及可以實現的通用化智能。目前，發展通用人工智慧（AGI）通常有兩種方法：神經科學導向和計算機科學導向。由於兩種方法在公式和編碼方式上存在根本差異，它們依賴於不同且不兼容的平台，阻礙了 AGI 的發展。因此，我們亟需一個既支持計算機科學導向人工智慧網路又支持神經科學導向模型的通用演算法和平台。

圖 1：促進 AGI 發展的混合方法。該混合方法結合了面向神經科學和面向計算機科學的方法的優勢（如左圖所示），從而開發出具有人類大腦和主流機器學習演算法廣泛特徵的跨範式計算平台。

神經科學導向的 AGI 方法試圖密切模擬大腦皮層，它基於對記憶和計算之間緊密互動的觀察、豐富的時空動態、基於脈衝的編碼方案和各種學習規則的研究，典型的模型包括脈衝神經網路（SNN）。相比之下，計算機科學導向的方法主要涉及在計算機上執行的顯式演算法。在這些演算法中，目前流行的非脈衝人工神經網路（ANN）在處理諸如圖像分類、語音識別、語言處理和遊戲等特定任務方面取得了長足的進展。

雖然這兩種方法都可以在數據豐富的專門領域解決子問題，但是由於許多系統存在不確定或不完整的信息，解決一些複雜的動態問題仍然很困難。為了進一步提高實現 AGI 所需的智能，一個趨勢是將更多生物啟發模型或演算法納入主流的人工神經網路中，從而使這兩種方法之間的互通更加明確。

鑒於目前機器學習和神經科學的進展，AGI 系統至少應該具備以下特徵：首先，支持能夠表示豐富時空關係的龐大而複雜的神經網路；第二，支持分層、多粒度和多域網路拓撲，但不局限於特定的網路結構；第三，支持多種模型、演算法和編碼方案；第四，支持為並行處理中不同任務而設計的多個專用神經網路之間的交叉合作。因此我們需要一個通用平台來有效地支持統一架構中的這些特性，該架構可以實現流行的 ANN 以及神經科學啟發的模型和演算法。

計算機科學神經科學

為了支持這些特性，研究者開發了一個跨範式（cross-paradigm）計算晶元，它可以適用於計算機科學導向和神經科學導向的神經網路（圖 1）。設計一個兼容多種神經模型和演算法的通用平台是一項基本的挑戰，特別是對不同的 ANN 和生物啟發的基元（如 SNN）而言。通常情況下，ANN 和 SNN 在信息表徵、計算哲學和記憶組織方面具有不同的建模範式（圖 2a）。其中，最大的差異是 ANN 以精確的多位值（multibit value）處理信息，而 SNN 使用的是二進位脈衝序列。為了在一個平台上實現這兩種模型，脈衝需要表徵為數字序列（1 或 0），以便它們與數位的 ANN 編碼格式兼容。

其他幾個關鍵點也需要仔細考慮。首先，SNN 是在時空域上運行的，它需要在特定的時間內記憶歷史膜電位和脈衝模式，而 ANN 則是在中間累積加權激活，並在每個周期更新信息；其次，SNN 的計算包括膜電位集成、閾值交叉和電位重置，這些都是由脈衝事件驅動的。與之相反，ANN 主要與密集的乘法累加（MAC）運算和激活轉換有關；第三，SNN 中脈衝模式的處理需要可編程位存儲器和高精度存儲器來存儲膜電位、觸發閾值和不應期，而 ANN 只需要位元組級存儲器用於激活存儲和轉換即可。

通過編譯這兩個領域中的各種神經網路模型，我們能夠進行詳細的比較，從而促使模型數據流一一對應相關構件，即軸突、突觸、樹突、胞體和神經路由器（router)。在統一抽象的基礎上，研究者構建了一個跨範式的神經元方案（圖 2c）。總的來說，其中的突觸和樹突是可以共享的，而軸突和胞體是可以單獨重構的。

在軸突塊中，研究者部署了一個小的緩衝存儲器來存儲 SNN 模式下的歷史脈衝模式。這個緩衝區內存支持可重構的脈衝收集持續時間和通過移位操作實現的位級訪問。在 ANN 模式下，相同的內存可以被重組為雙向數據塊（ping-pong chunk），以緩衝輸入和輸出數據；這就為並行處理解耦了計算和數據傳輸。在這裡，突觸權重和神經元參數被固定在晶元上的內存中，並通過最小化處理單元與內存之間的數據傳送來實現本地化的高通量計算。在樹突塊中，SNN 模式下的膜電位集成與 ANN 模式下的 MAC 共享相同的計算器，同時在處理過程中重新統一了 SNN 和 ANN 的高級別抽象。

結合軸突、突觸、樹突和胞體，研究者設計出了一個統一的功能核（FCore）；為了實現深度融合，幾乎整個 FCore 都是可重構的，從而可以在不同的模式下獲得較高的利用率。樹突和胞體在操作過程中被分成多個組，每個組中的計算都是並行的 (在每個時鐘周期下每個樹突使用 16 個 MAC)，而組間執行是串列的。FCore 能夠涵蓋大多數 ANN 和 SNN 所使用的線性集成和非線性轉換操作。此外，為了在神經元之間傳遞信息，研究者還建立了一個神經路由器來接收和發送消息。由於消息可以根據配置以 ANN 或 SNN 格式進行編碼，所以研究者為路由包設計了統一輸出格式。路由包通常包含控制、地址和數據段，其中數據段既可以是 ANN 模式下的多位激活值，也可以是 SNN 模式下的空值，因為路由包本身充當了一個脈衝事件。根據需要，前胞體（pre-soma）可以根據胞體配置將輸出打包成 SNN 或 ANN 格式，後軸突（post-axon）可以根據軸突配置將路由包解析為 SNN 或 ANN 格式。

由於軸突（輸入）和胞體（輸出）完全獨立的可配置性，以及共享的樹突（計算），FCore 通過適當地連接多個核心，為構建同構或異構網路提供了極大的靈活性。如果將所有部件以相同的模式配置，一個 SNN 或 ANN 網路基元的同構範式可以支持許多單一範式模型，包括 SNN 和 ANN（如多層感知器、卷積神經網路、循環神經網路和基於速率的生物啟發神經網路）。此外，FCore 允許構建異構網路來探索混合建模。通過對軸突和胞體在不同模式下的獨立配置，可以輕鬆地實現一個「以 ANN 為輸入、以 SNN 為輸出」或「以 SNN 為輸入、以 ANN 為輸出」的混合網路基元（圖 2e）。換句話說，FCore 可以充當 ANN/SNN 轉換器。這種跨範式方案為設計創新的混合模型提供了可能，並為跨模型探索提供了一個有效的平台。

圖 2：天機晶元的設計。

a.ANN 或者生物啟發神經元（例如 SNN）的計算模型。w_0、w_1、w_2 是突觸權重；x_0, x_1, x_2 是輸入激活；Σ是樹突整合；f 是激活函數；b 是偏差。b 圖是 ANN 或者 SNN 神經元的實現圖解。V(t) 是 t 時間步的神經膜電位，V_th 是發放閾值。藍色框中的數值是輸入激活/spike 和權重值樣本。SNN 通道中暗紫色相乘符號表明樹突或許可以不做乘法運算（例如，時間窗長度等於 1 時）。c 圖是混合線圈的圖解，表示融合了 ANN 和 SNN 組件的一種跨範式神經元。d 圖是統一的功能核（FCore）圖解。每個 FCore 包括軸突、突觸、樹突、胞體和神經路由器構建單元。e 圖是 FCore 的靈活建模配置和拓撲結構。編碼方式可在 ANN 和 SNN 模式之間自由轉換，使得異相神經網路成為可能。這種方式也能滿足實現任意網路拓撲結構的靈活連接。f 圖展示了核與晶元級別 2D 網路架構的層級，證明了該技術的擴展能力。

圖 3：晶元評估與建模。

a：集成布局和封裝的天機晶元。b：左：不同功能（軸突、樹突、神經路由器等）所佔晶元面積的百分比。得益於高水平的資源共享和可重構性，只需要很小的區域增長（大約 3%）就可以融合這兩種範式。c：FCore 電源故障。d：評估 FCore 在各種單一範式模型中的性能，包括 SNN、MLP、CNN（摺疊或展開映射下）和長短期記憶網路（LSTM）。e：左：一個大規模使用 ANN 樹突狀繼電器實現 SNN 的例子。在人工神經網路繼電器的幫助下，傳輸中間膜電位的精度很高，混合設備能夠達到比單獨 SNN 更高的識別精度，硬體開銷可以忽略不計。f：天機晶元還可以支持更多生物學上可行的神經網路模型（如 CANN、樹突狀多室模型）。

圖 4：基於天機晶元的無人自行車多模態集成。

a：左、中：自行車實驗中執行的任務，包括實時目標檢測、跟蹤、語音感知、跨越減速帶、自動避障和姿態平衡。這輛自行車配備了攝像頭、陀螺儀、速度計、馬達和一個天機晶元。IMU：慣性測量裝置。b：無人駕駛自行車實驗中使用的多個神經網路。NSM 圖中的狀態定義為：語音命令執行 (S0)、人體檢測 (S1)、人體跟蹤 (S2)、避障開始 (S3)、避障完成等待 (S4)。init 坐標是初始化坐標。C_en、A_en、V_en、T_en 分別表示 CNN、CANN、語音控制、轉彎控制的啟用信號。c：SNN 語音命令識別測試。產生最多脈衝的神經元表示結果分類。d：跟蹤測試。y 軸表示人體在畫面中的相對水平位置。這輛自行車自動避開障礙物，然後跟隨一位沿 S 型曲線跑步的教練。e：MLP 網路控制的平衡和轉彎，在不同速度下（從低到高）模擬多個調諧良好的控制器的輸出，進行訓練。

研發團隊：清華大學領銜

該研究的團隊成員來自清華大學、北京靈汐科技、北京師範大學、新加坡理工大學和加州大學聖塔芭芭拉分校等科研機構。領導者為清華大學精密儀器系教授、類腦計算中心主任施路平。

施路平表示，現階段發展人工通用智能的方法主要有兩種，一種基於電腦思維，另一種基於人腦思維，兩種方法各有優缺點，但都代表人腦處理信息的部分模式。他與研究團隊由此提出將兩種方法異構融合的架構，並在此架構上發展出了天機晶元（Tianjic chip）。天機晶元是完全由中國自主研發的技術成果，其中的異構融合思路由項目研究團隊首先提出。另一方面，天機晶元也是多學科融合的結晶。

施路平教授

據澎湃新聞報道，天機晶元有多個高度可重構的功能性核，同時支持機器學習演算法和類腦電路，它由 156 個 FCores 組成，包含約 40,000 個神經元和 1000 萬個突觸，採用 28 納米工藝製程打造，晶元大小為 3.8×3.8 毫米。

同時支持計算機科學模型和神經網路模型是天機晶元的一大特點。負責晶元設計和演算法細節的論文作者鄧磊表示，通常市面上的深度學習加速器只支持計算機科學模型，神經形態晶元只支持神經科學模型，而天機晶元兩者都可支持，同時支持神經科學發現的眾多神經迴路網路和異構網路的混合建模。

天機晶元單片和 5×5 陣列擴展板

鄧磊提到，實現上述兩類模型深度而高效的融合是天機晶元設計中最大的挑戰，因為兩類模型所使用的語言、計算原理，編碼方式和應用場景都不相同。

施路平透露，目前團隊已經啟動了下一代晶元的研究，預期明年年初可以完成研發工作：「人工通用智能是一個非常難的研究課題，但我們相信它是一定會實現的。從未來發展的角度看，人工通用智能會是一個必然的趨勢。」

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 摩爾精英 的精彩文章:

※NVIDIA統治了AI加速雲市場，已佔4大雲平台97.4％份額
※韓媒：SK海力士已開始測試國產高純度氟化氫

TAG:摩爾精英 |