高性能計算、數據爆炸到深度學習，從熱點話題變換看計算機行業的發展

新聞 08-03

前言

吳曉波在《激蕩三十年》中這樣描述一個國家裡輝煌的三十年：「它承載了太多人的光榮與夢想，它是幾乎一代人共同成長的全部記憶」，「當這個時代到來的時候，銳不可當。萬物肆意生長，塵埃與曙光升騰，江河匯聚成傳，無名山丘崛起為峰，天地一時無比開闊。」

時代車輪向前，2008 到 2019 又已過去十年，以信息和通信技術為基石、人工智慧為使能的第四次技術革命引領著人類社會邁向萬物感知、萬物互聯、萬物智能的世界。在我們的個人生活、商業和社會形態等領域掀起前所未有的變革。

其中風起暗涌，讓我們跟隨 CNCC 年度話題中探尋。

一、不可思議的高計算能力

——1970 年，Intel4004 處理器每秒可以處理 92000 條指令，而相比我們現在的普通手機，每秒處理 10 億條指令，電腦也越來越強大，能夠存儲越並處理這些龐大的數據。

1999 年，NVIDA（英偉達）公司首先推出了 GPU，主要用於處理遊戲中每秒產生的大量的幀數數據。專家們發現，將 GPU 加入深度學習的架構中，賦予其訓練神經網路的能力，可以執行大量任務的並行計算能力，能更迅速的處理各種各樣的任務。GPU 讓深度學習系統有能力完成幾年前計算機不可能完成的工作，比如房屋地址識別、照片分類和語音轉錄。有 10 億個連接的 GoogleX 項目，訓練人工神經網路的時候使用 1000 台電腦和 16000 個 CPU。然而在同等工作量和時間下，裝備了 64 個 GPU 的 16 台電腦就可以運算出結果。

讓人工神經網路快速運行是很困難的，因為成千上萬的神經元要同時互動。取決於任務種類，有時候使用傳統的中央處理器（Central Processing Unit,CPU）運行神經網路需要幾周才能出結果。然而用圖形處理器（Graphics Processing Unit,GPU）, 時間能大大節省，同樣的任務只需要幾天或者幾小時就可以出結果。

代表論壇：

中國計算機事業創建五十周年紀念大會暨 2006 中國計算機大會的「千萬億次計算機」主題，報告人：孫凝暉：中科院計算所研究員；祝明發：聯想集團首席科學家；謝向輝：江南計算所研究員；王恩東：浪潮集團高級副總裁向社會揭示了先進的算力器。

在 2011 年中國計算機大會深圳高性能計算論壇:George Cai-Intel Inside HPC - Architecture and Challenges；唐志敏 - 可持續的高性能計算；王恩東 - 高效能計算機架構與應用創新；謝強 - Kepler GPU 體系架構與 E 級超算的挑戰再次論道高性能計算髮展。

高計算能力發展作為計算機技術的基石，伴隨著摩爾定律，其不可思議的發展速度讓計算機行業日新月異。

二、爆炸的數據量

——根據 Cisco(思科) 同濟，1992 年全球互聯網流量是每日 100GB，而到 2015 年的時候，流量已經達到了每秒 20235GB，現在全球九成的數據都是在過去兩年生成的。

互聯網的爆發讓大數據變成了可能，為火熱的人工智慧模型訓練提供了充足的原材料。這些大數據是訓練深度人工神經網路里上百萬的神經元和權重的前提。用數據構建神經網路的最好例子是上文提及的 Google X 的一個項目。2012 年 6 月，Google 展示了當時最大的神經網路之一，其擁有超過 10 億個連接，啟用了 16000 個 CPU。有斯坦福大學計算機科學教授 Andrew Ng 和 Google 研究員 Jeff Dean 帶領的團隊給這個系統展示了 1000 萬張從 Youtube 視頻中選擇的圖片，這種圖片數據量在十年前是想像不到的。

代表論壇：

2013 中國計算機大會以「數據空間，放飛夢想」為主題，重點探討大數據領域的學術、技術以及應用問題，以及移動互聯網等業界關心的問題。上海交通大學梅宏等兩院院士在大會的主題論壇「大數據」上演講，闡述大數據對計算領域和社會產生的深遠影響並探討業界對大數據的解決之道。

2014 CNCC 主題「信息安全，數據為先」，探討在互聯網時代、大數據背景下的信息安全所面臨的全新挑戰和亟待解決的問題。

數據使用、數據治理再到數據安全，是行業對於數據爆炸本身的再審視。

三．演算法不斷突破（尤其是深度學習）

——科技企業、風投資本以及各國政府，都在大力支持人工智慧，機器學習作為人工智慧的主要技術手段，吸收了高達六成的投資份額。

深度學習

2006 年，Hinton 在 Science 和相關期刊上發表了論文，首次提出了「深度信念網路」的概念，這種分階段兩部訓練技術的運用大幅度減少了訓練多層神經網路的時間，讓深度學習從邊緣課題變成了谷歌扥互聯網巨頭依賴的核心技術。機器學習方式尤其是深度學習領域的突破。機器學習的手段是讓電腦從大量的真實經驗、信息和案例中學習，然後會像人類一樣吃一塹長一智，在以後遇到同樣的問題時，電腦就有能力用學習到的經驗做出準確的判斷。2017 年 10 月，關於深度學習的未來，被譽為深度學習始祖的 Hinton 交出了「膠囊網路」（Capsule Network）的研究成果嘗試解決泛化問題。

強化學習

當深度學習和強化學習結合後，對現實情況的枚舉變成了首先對現實情況做模式識別，然後對有限的模式進行枚舉，這就大大減少了計算量和存儲代價。這種學習方式也更接近人類思維的模糊判斷的特點，被認為是人工智慧領域接下來的幾年裡最值得關注的技術。強化學習隨著人機圍棋大戰機器的勝利被推上學術研究熱點。

對抗性神經網路

不管是深度學習還是強化學習，目前主要的機器學習手段還是依賴大量的數據進行分析和系統訓練。2014 年，蒙特利爾大學博士生 Ian Goodfellow 突然想到了這個問題的答案——「對抗性神經網路」GAN，數字版的貓鼠遊戲模型互相拼殺。

Hinton 表示：「在機器學習這個領域，很難預測五年以後的事情，不過可以確定的是，這僅僅只是開始。」，伴隨著演算法的更迭，更多的人工智慧創業團隊不斷的在尋求商業落地。

幾乎每場論壇，產業對接都是最受關注的議題：

如今，機器學習也被廣泛開出各種商業用途。互聯網廣告實現投放，在圖片中辨識和標記好友，把語音轉化成文字或者將文字轉化成語音，把網頁上的文字翻譯成不同的語言，還有無人駕駛，都是深度學習的支持。除此之外，很多我們沒有想到的地方也能找到深度學習的影子。信用卡公司用深度學習來做反欺詐測試，醫院和實驗室使用深度學習來測試、確診和治療疾病。自動化流程性能的改進。

總結：

2003 年，CNCC 首屆大會於在北京國際會議中心舉辦，14 個領域的分會場學術論文，大會主題：計算機改善人類生活到 2010 年「網聯世界計算無限」註冊參會者首次突破 1000，彰顯著那五年間越來越多的人開始投入這個行業，同行學者越來越關注中國計算機大會。

作為一個學術組織，CCF 也開始承擔越來越多的社會責任。為了讓更多的學者參加中國計算機大會，2010 年 CCF 首次設立特別資助他們參加中國計算機大會。2012 中國計算機大會的博士生培養論壇，殷建平向社會各界人士分享如何培養高水平創新型研究生，社會開始關注更加規整和健康的人才培養體系。2015 年 CCF 會議期間，舉辦 CCF 優秀大學生獎頒獎儀式，來自 60 多所高校的百餘名優秀本科生接受表彰。

2019 年 CNCC 圍繞「智能 ——引領社會發展（AI ——Leading the development of society）」主題確定 keynote 報告人及相關會議內容。CNCC2019 大會論壇主要圍繞互聯網 50 年、工業互聯網、深度學習三個主題展開討論及探討，開設量子計算：從理論到實踐、類腦計算論壇、AI 賦能社會，公平倫理與責任自治等 51 個話題分論壇。

戰略合作媒體

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 DeepTech深科技 的精彩文章:

※首個毫米級機器水母誕生，未來或可在血管內「游泳」

TAG:DeepTech深科技 |