李國傑院士：AI創業公司如何擺脫被收購的命運「附雷克世界專訪」

科技 10-27

「人工智慧已經炒過幾回了，經歷了幾個夏天和冬天，忽冷忽熱；現在終於到了秋天了，是收穫的季節了。」中國工程院院士李國傑近日在「2017中科曙光智能峰會」上，如此評價當前正熱門的人工智慧產業。

儘管到了收穫的季節，儘管中國AI產業的發展速度舉世矚目，但是我們仍然面對AI基礎設施建設不足，以及AI創業公司難以做大做強的問題。對於這些問題，李國傑院士有以下思考：

（根據李國傑院士演講速記做了遵照原意的部分修改）

話題一：大數據、AI融入各產業將推動經濟邁入新的繁榮期

現在是人工智慧2.0時代，過去二十年算一代。但是，國際上通用的說法是人工智慧已經經過了兩波的發展。第一波是上個世紀50年代-80年代，是做編寫知識搞邏輯推理為主。第二波是從80年代開始，以統計學習、概率推理為主，也就是人工神經網路為主，這裡面的感知和學習能力比較強，但是抽象的能力比較弱，推理的能力也比較弱。從2010年開始做的是第三波，從2就是加強抽象的能力和推理能力，保持感知和學習能力，對環境有著更強的自適應性，與過去六十年相比，更加通用化，在各個行業裡面引領著經濟下一波大的浪潮。

我自己畫了一個示意圖，經濟發展變化是有周期性的，比如從二戰以後進入到第四波，就是以電子計算機、石化為主驅動的發展；到了第五波就進入了互聯網，九十年代開始，移動通信，軟體驅動經濟發展。

大家注意，從九十年代開始那波到2008年金融危機的時候，經濟形勢已經開始走下坡路了，現在是經濟的低潮期，整個增速是在2%左右，發展中國家也是平均5%左右。所以，過去十年正好是經濟低潮的時候，也是研究最活躍的時間，所以今後的二十年，正好是人工智慧技術基本創新爆發期，在今後的一、二十年會產生觸發2030年開始的第六波的繁榮期。

這裡得出什麼結論呢？在未來10-15年，對經濟貢獻最大的可能不是大數據和人工智慧的新技術，而是信息技術包括大數據和人工智慧融入各個產業的新產品，提供個性化產品和服務的新業態，產業跨接融合的新模式，這些創新主要是和已知技術的新組合。任何新技術的推廣需要10-20年的時間。在經濟衰退的復甦期要特別重視基礎性技術的發明，未來10-15年應力爭在大數據和人工智慧領域做出像電子計算機、集成電路、互聯網一樣的重大發明，但是重大發明是自己冒出來的，不是規划出來的。

歷史上重大基礎發明都是經過較長時間的技術改進和擴散之後才產生巨大經濟效益，人工智慧也不應例外。很多公司都預測，從2016年到2025年的10年內，關注汽車、消費品、電力、物流等行業的數字化轉型有望帶來100萬億美金。

話題二：人工智慧和大數據基本是一回事要重視AI的剛性需求

大家流行的說法，是人工智慧=A+B+C。我個人的看法，人工智慧和大數據基本一回事，A+B+C+D+E。A是演算法，B是基本理論和基礎設施，C是計算能力，D是領域知識，E是生態環境。

發展人工智慧和大數據要重視大眾的剛性需求，2011年我跟徐志偉寫了一篇文章在CACM上發表了，與「Computing for the Masses」的追求一樣，我們要努力實現「Big Data for Masses，AI for the Masses」，不能只關注高端消費人群。發展大數據與人工智慧要重視大眾的剛性需求（如健康、出行、安全等）。要滿足大眾剛性需求要有基礎設施，過去工業化時代就是所謂「鐵公機」，鐵路、公路、機場。信息時代的基礎設施是互聯網、雲計算中心。到了智能化階段的基礎設施是大數據中心、機器學習訓練平台等。大數據的存儲分析和機器學習能力已成為新的基礎設施需求，計算機能力的高低將決定人工智慧產業和智能服務的水平。

話題三：公用的大數據分析平台和機器學習訓練平台

目前，網路服務的龍頭企業（BAT、滴滴打車等）都有自己的大數據平台，但智能軟體和服務行業每個中小型創業公司都建立自己的機器學習訓練平台，既無必要也不可能。各地雙創園區要建立共享的大數據分析平台和機器學習訓練平台，這是新時代的重要基礎設施。

我國一半以上的HPC用於大數據和AI，過去HPC主要用於科學計算，現在HPC主要用於大數據分析和機器學習。2015年，鍾一HPC在數據分析與機器學習領域的應用只有27%，2016年達到了48%，今年有進一步提升。另外每個行業都需要AI，每個行業分別做是很累人的，有些東西是又有區別又有共性，我的想法是將來要有生產每個行業的AI引擎生產線，前面有公共的東西做局部化調整，有局部的參數調整，調完了以後出一個行業的AI引進來。

話題四：擺脫人工智慧創業公司被收購的命運

人工智慧創業公司只有兩個命運：一個是被大公司收購，一個是倒閉。即使像科大訊飛這樣的大企業，科大訊飛市值約700億元，凈利潤不到1.7億元，市盈率已經超過300倍，所以如何提高凈利潤是AI公司的一大困擾。

人工智慧企業史說明，演算法固然很重要，但是光有演算法決定不了公司的命運。AI公司要在賣產品、授權、廣告、服務模式中找到新的賺錢末路，或者另外開闢技術變成錢的商業模式。AI公司要做大做強，不但要有一技之長，而且要有自己的平台和特有的數據，軟體和硬體都要有過人的實力。

現在的問題，我國人工智慧應用技術與國外差距不大，有些應用領域已經超過美國。但是基礎軟硬體與國外還有較大差距。在全球企業2000強名單中，美國有14家晶元公司和14家軟體公司，中國尚未沒有一家，我講的是以軟體作為主要產業的公司。全球集成電路企業前20名沒有一家中國企業。我國集成電路與國外仍有兩代差距。

話題五：發展AI要打造完整的生態系統

所以人工智慧產業要像一棵大樹，必須紮根在系統結構和軟體理論的深土中，發展人工智慧不能停留在演算法層面，要關注從演算法、軟體、人機截面到系統結構和晶元這一完整的產業鏈和生態系統。

發展人工智慧和大數據，還是要特別重視基礎的東西。中國人很重「名」，「名不正則言不順」，信息領域不斷創造新名詞，一旦新名詞（新學科）上升為國家意志，原來的基礎學科就被邊緣化，現在以「系統結構」和「基礎軟體」申請國家項目，已經很難拿到經費。去年國家自然科學基金計算機學科的4863項申請項目中，計算機科學的基礎理論只有16項，計算機體系結構22項，程序設計語言及支撐環境13項，高速數據傳輸技術2項。但是，計算機圖像與視頻處理有439項，模式識別理論及應用357項，人工智慧應用258項，這是巨大的反差。沒有基礎的話，將來還是難以扳回局面。

話題六：人工智慧本質還是計算機科學

什麼是人工智慧？人工智慧從科學上講，它是計算機科學的前沿研究，從應用來講，它是計算機技術的的非平凡應用。人工智慧本就是計算機技術，現在很多人講人工智慧是新的科學，內容涉及腦科學、計算機科學、統計學、社會科學等。但是迄今為止，腦科學（神經科學）對人工智慧的貢獻很小，統計學對推動機器學習的崛起起了較大作用，但是沒有人把人工智慧看成統計學的分支。

所以目前來講，人工智慧本質上是計算機學科的一個分支，。所以智能化的前提是計算機化，目前不存在脫離計算機的人工智慧。所以說，沒有計算就沒有智能。

有人說信息化時代已經過去了，現在是智能化的時代，這恐怕不夠全面，智能時代不是後信息時代，真正的後信息時代可能是生物時代。與其過分強調智能與數字化、網路化的區別，不如多強調智能化與信息化的聯繫，數字化和網路化沒有做好，智能化就是空話。

我們吸取歷史上的教訓，既要重視智能應用的特殊要求，但是也不能忽視通用的計算機主流技術的巨大包容能力。

話題七：產學研的結合

中科曙光公司與人工智慧的淵源已久，曙光公司是國家智能計算機研究開發中心創辦的企業，是國家863計劃智能計算機主題長期支持下成長起來的高技術公司，智能應用一直是國家智能計算機研究開發中心和曙光公司關注的重點之一。

上世紀九十年代在建立了國家智能計算機研究開發中心的中國科大分中心，專門從事語音識別/合成的評測，後來這個中心孵化出科大訊飛公司。

中科曙光和現在比較熱門的晶元公司寒武紀是同根生的兄弟公司，寒武紀研究晶元不但用在華為的手機上，也用在了曙光伺服器上。（即此次發布的「全球首款基於寒武紀晶元的AI推理專用伺服器」。）

我們要特別注重知識的融合，錢老（編輯註：錢學森）說過「必集大成，才能得智慧」，人工智慧是對付複雜性的科學，發展人工智慧不能追求「另立山頭，分道揚鑣」，要跟其它學科密切融合。

如何看待領域知識呢？10月19日，谷歌DeepMind團隊新成果，名為阿爾法元的機器完全靠增強型自我學習，訓練3天就戰勝了阿爾法狗，比分100：0。這表明在某些領域，AI不再需要人類知識。過去我們相信知識就是力量，現在有些領域數據和機器學習比知識和人類經驗更有力量。

最後引用一段話，是美國曼哈頓負責人澳本海默在二戰勝利以後說的一段話「我們得到了一棵碩果累累的大樹，並拚命地搖晃，結果得到了雷達和原子彈……其全部精神實質在於對已知的瘋狂而粗暴掠奪，而毫無對未知的認真而謙恭地探索」。

人工智慧已經六十年了，我們是拚命搖晃這棵大樹不變，還是懷抱對未知的認真和謙恭，自己新種幾棵樹苗？深度學習為什麼這麼有效，沒有人講得清楚。最近以色列科學家提出「信息瓶頸」理論，發現深度學習與量子物理的相似之處。

人工智慧與大數據任重而道遠，最後以一首詩結束這次報告：

莫言下嶺便無難，

賺得行人空歡喜。

正入萬山圈子裡，

一山放過一山攔。

——宋?楊萬里《過松原晨炊漆公店》

以下是專訪問答

雷克世界：您特彆強調了AI基礎設施建設，但是如何去做好AI基礎設施呢？和晶元還是有所不一樣，AI時代系統研究需要和應用場景結合，可能是很難僅僅在象牙塔就能裡面完成的，您怎麼認為呢？

李國傑院士：人工智慧在早年我讀書的時候，流行的觀點就是要做一些跟現在主流的計算機不一樣的、所謂的智能的計算機。當時有一種觀點，人都是用自然語言對話，我們編的程序不是自然語言，是面向機器的，面向機器的這些語言效率高，但不方便，編程不好編，他們想將來編程用自然語言編，人怎麼想的就像寫作文一樣編，這很簡單，想的挺好，這就是智能計算機的方向。

但是想是一回事，實際發展是另外一回事，後來八十年代後期的時候，晶元出來了，晶元走的這條路恰好相反，是從底層做起，做晶元、集成電路等就一統天下了，所以是從晶元領域從底往上發展。

再回頭看，並不是我們這代人，比我們早的這批人，他們做計算機也是想模仿人的智能來做，上世紀五十年代也是假定人的思維可以精確的描述，用人工的方法做出來，但是後來馮?諾依曼發現模仿人腦做計算機，這是太陽底下最複雜的事情，所以就改了，從第一台計算機做起，就和模仿人的智能和人腦思維的做法分道揚鑣了。

後來的60年下來，都是靠二進位等做法，和人腦沒有關係，計算機發展的非常快，包括現在做的語音、圖像識別，最重要的是識別快，晶元厲害了，我們統計過，我們現在做一款計算機晶元100多億的晶體管，一分錢可以買到1千個晶體管，比沙子還便宜，這麼強大的能力，所以這套東西在計算機裡面就有一個主流的技術，這個主流技術不要的話，搞另外一套人工智慧的辦法，要特別小心這個事情，不要輕易的談我不用這些方法完全搞一套新的東西，這個難度是極大的。

話說回來，人工智慧和原來的技術處理是不是一樣的？其實也不是一樣的，人工智慧裡面有很多是動態的，是一些非確定的，和原來固定的東西不一樣，原來是演算法，和演算法是固定的，人工智慧的環境都是在變的，將來應對的負載是不一樣的，我們現在遇到的問題，人工智慧裡面的一些很稀疏的圖和原來做矩陣是不一樣的，我們要考慮它的特殊性，這裡面有一個難題，要做所謂的加速晶元，做的很特殊，就是你的市場是很窄的小市場。

而寒武紀他們的目標並不僅僅是做一個加速某一個應用的晶元，它是想做一個針對很多人工智慧的比較普及的、比較通用的晶元，想做寒武紀的系統，和x86系統一樣，他們也是想搞一套指令系統做的比較大的、比較廣的人工智慧，這是一個方向，但是能不能做得到，這還有一個過程，還有一段的路要走，就是晶元的設計等都要從專用的體系變成通用的體系。

雷克世界：您在演講中提到人工智慧的發展要注重剛性的需求，這有沒有輕重緩急？您認為剛性需求主要是哪些方面？

李國傑：有一些人工智慧是吸引眼球的需求，大家一樂就結束了。剛性需求比如涉及到人的健康、安全，都是剛性的，人工智慧不完全把一個事情做的很快、效率高，更多的是帶來很多方便，早GDP裡面不一定那麼容易反映出來，因為這是老百姓所需要的。我覺得現在關心殘疾人、關心老人，這些弱勢群體都是屬於剛性需求。如果我們所有的努力都朝著高收入人群去做，必然導致兩極分化，政府應該在這方面做一些導向。

雷克世界：您提到很多的人工智慧的中國企業可能面臨的結局就是被收購或者是倒閉的命運，為什麼會這樣，技術公司如何成功的商業化？

李國傑：將來，是會出來一些像現在的BAT一樣的人工智慧龍頭企業，獨角獸企業是會逐步成長的。但每個企業不是光靠一個演算法就可以長命百歲，無非開始是賣產品，後來是像微軟這樣賣版權，後來賣服務，都能找到掙錢的辦法，人工智慧這些企業也要找到它靠什麼掙錢，羊毛出在羊身上，但是也要找到這個羊，比如做廣告是別人嘗試過的，所以人工智慧也要在這方面動腦筋，錢、現金流從哪來？

人工智慧公司里還是以搞技術的人為主，未必能擔當真正的企業家角色，需要真正有市場經驗的人，幫助人工智慧企業成長，這還是一個難題。

當然，人工智慧肯定還會冒出很多新技術，任何新技術，尤其是比較重要的技術都會產生很大的市場，需要時間慢慢的成長，不是冒一個新技術馬上就能變成幾百億的市場，這不太可能的。

我們看到國外的統計材料，一個新的技術出來轉化成十億的市場要二十年，變成一百億的市場可能要三四十年。所以現在看起來，真正變成市場的技術，可能不是這幾年變出來的，肯定在應有的技術方面能創新商業模式。人工智慧公司要在這方面動腦筋，不光是技術上有新的發明，在商業模式上還要有新的創新，結合起來才可以把新的技術用好。

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 雷克世界 的精彩文章:

※機器學習時代，企業如何應對？你需要克服這「三座大山」！
※Google公布OpenFermion：量子計算機的開源軟體包
※詳解Nervana最新開源深度強化學習庫Coach
※KDnuggets整理最新機器學習必備十大入門演算法！都在這裡了
※人類如何從不同角度識別物體？你需要對「小樣本學習」有所了解

TAG:雷克世界 |