七場高端報告,帶你大視角看人工智慧發展
雷鋒網 AI 科技評論消息:2018 年 3 月 30 日,AITech 峰會在深圳龍崗區正式召開。
本次會議以配合國家新一代人工智慧發展規劃實施,支撐人工智慧產業技術協同創新,加強人工智慧領域的國內外技術交流為目的,由深圳市人民政府指導,深圳市龍崗區人民政府、中關村視聽產業技術創新聯盟、新一代人工智慧產業技術創新戰略聯盟主辦,深圳龍崗智能視聽研究院承辦。雷鋒網作為獨家戰略合作媒體將進行現場內容詳細報導。
為期兩天的會議將包括兩場主論壇和四場分論壇,分別為:
主論壇一(3 月 30 日上午)
分論壇(一):智能技術與標準及 IEEE Fellow 論壇(3 月 30 日下午)
分論壇(二):超高清與 VR 技術論壇(3 月 30 日下午)
主論壇二(3 月 31 日上午)
分論壇(一):人工智慧與安全論壇(3 月 31 日下午)
分論壇(二):人工智慧投融資論壇(3 月 31 日下午)
下面我們詳細介紹 AITech 主論壇一的詳細內容,其他內容將稍後呈現。
在該論壇中,共有四項議程。
首先,深圳市龍崗區區長戴斌先生和深圳市政協副主席張曉莉女士作為東道主為大會致辭。
據戴斌先生介紹,龍崗區在 2017 年實現地區生產總值 3858 億元,增長 9.8%,躍居全深圳市各區第二,穩居全國經濟十強區。目前已集聚了包括智能機器人在內的六大產業集群,擁有華為、比亞迪等知名企業。力爭到 2020 年,人工智慧等新興產業工業增加值占 GDP 比重超過 60%,成為驅動發展的強大引擎。
張曉莉女士在致辭中表示,目前深圳在人工智慧和機器人密切相關的智能製造、智能汽車、無人機等領域已形成較為完備的產業鏈,在全球人工智慧企業數量排名榜上深圳位居第八。
隨後龍崗區副區長陳廣文先生詳細介紹了龍崗區作為全國經濟十強區的創新創業環境。主要概括有以下幾個特點:產業基礎雄厚;創新勢頭強勁;文體氛圍濃厚;環境配套優越;政府服務超前。
接著在高文院士、徐揚生院士、丁文華院士等人的見證下,龍崗區金融投資控股有限公司董事長張靜女士、中國國新基金管理有限公司副總經理姜開宏先生以及新一代人工智慧產業技術創新戰略聯盟聯合秘書長張偉民先生簽署了新一代人工智慧產業基金框架性合作協議。
在最後一項議程,由7位領域內專家分別作出精彩報告。
高文院士:AI 開源平台的挑戰與機遇
徐揚生院士:人工智慧時代的教育
John E. Hopcroft:Deep Learning Research
芮勇:人工智慧的字母表
鄢志傑:IoT 時代的智能語音交互
林擁軍:城市數據湖——城市發展
張清:端到端 AI 計算系統設計與優化
下面我們對幾位專家的報告一一做簡要介紹。
一、AI 開源平台的挑戰與機遇
報告人:高文院士,中國工程院院士,新一代人工智慧產業技術創新戰略聯盟理事長。
高文院士針對 AI 開源平台的四個方面進行了介紹,他認為這裡既有挑戰,也有機遇。
首先是我國人工智慧發展的瓶頸問題。高文院士認為這有四點:(1)開源平台多,但平台之間相互隔離,模型不可相互轉換,導致形成「演算法孤島」;(2)演算法需要適配的異構硬體,性能和效率受制於硬體的組織管理;(3)應用綁定在 AI 演算法平台與硬體,基礎受制,推廣性受限;(4)國際巨頭通過 AI 開源工具打造生態和壟斷智能硬體,嚴重擠壓我國 AI 產業發展空間。針對這些問題,對這些瓶頸的應對策略就是,通過構建支撐開源軟/硬體基礎平台來支持人工智慧技術產業鏈。
深圳雲腦計劃正是這樣一個平台,它是為了配合國家新一代人工智慧重大專項,解決上述四項瓶頸問題而成立的一項計劃。這項計劃近期主要為深圳雲腦(SCB-AI),長期來看則還包括深圳量子云(SCB-QS)。
深圳雲腦的體系架構分為三層:雲腦硬體平台、雲腦操作系統、重大應用。其中硬體平台包含了 GPU 集群,FPGA 推理節點、專用人工智慧晶元推理部件。其次將這些硬體連接起來構成雲腦操作系統,並提供給各種各樣的人工智慧應用,例如智能交通、智能醫療、自動駕駛等。通過這種方式,可以保證智能硬體的高能效、智能操作系統與軟體的高效和可擴展,以及人工智慧決策應用平台的高效實時、高性能和可解釋。
在開源硬體之上就是依託聯盟,建立 AI 技術的開源開放平台,實現 AI 數據共享、模型共享、技術共享等,共同開發建設 AI 開源共享社區。例如 AI 交流社區、AI 開發社區、AI 共享社區、AI 標準化社區、AI 教育社區等等。此外還會通過聯盟來維護開源開放平台,建設開源開放平檯子基金,通過聯盟向深圳以及國內外開放,建立人工智慧協同開發的生態。
高文院士總結到:我國人工智慧發展面臨四個挑戰,解決這些挑戰則需要強大的開源平台,深圳雲腦是可能的選擇之一。希望這個計劃對整個中國人工智慧計划起到幫助。
二、人工智慧時代的教育
徐揚生:中國工程院院士、香港中文大學(深圳)校長
徐揚生院士在報告中首先給我們簡單介紹了機器人的發展,隨後提出「智能革命將是從生產力解放到心腦解放的一次革命」,這次革命所帶來的影響將遠遠大於人類歷史中所有通過解放肉體的革命所引起的影響。在這種智能革命下,人類以前以及現在所做的許多事情都將被人工智慧所取代,人類社會也將進行重新分工,很多行業將會消失,同時也會產生許多新的行業。
在這種情況下,人類的教育需要做什麼樣的改變是一個嚴峻的問題。徐揚生院士認為,我們時代的教育主要還是在訓練人類的弱點(例如記憶、邏輯判斷;相比於人工智慧),這需要改變。因此他提出人工智慧時代下的教育的四條原則:
注重培養文理融合的複合型人才;
注重培養學生的想像力和創造力;
注重非知識型的教學和考試;
注重學生自我能力的培養。
三、Deep Learning Research
John E. Hopcroft,美國工程院院士、美國科學院院士、中國科學院外籍院士、圖靈獎獲得者
在報告中,圖靈獎獲得者 John Hopcroft 分享了一些深度學習領域中比較有趣的研究問題和對此的一些思考。
最近幾年,隨著深度神經網路的引入,特別是卷積神經網路(卷積神經網路,由卷積層、池化層、全連接層組成,最後是 softmax 輸出每個類別的概率)的引入,圖像分類等方面的錯誤率逐年下降,在 2015 年微軟亞研院提出的 152 層深度殘差網路(ResNet)在圖像分類中超過了人的識別水平。但是在這方面還有很多問題值得研究,例如每個門學習的是什麼、怎樣讓第二層的門與第一層的門學習不同的信息、怎樣讓一個門學習的內容隨時間演化、用不同的初始權重門學習的是否是相同的內容、用不同的圖像集訓練兩個網路早期的門學習的是否相同等等。
此外,在訓練一個深度網路時,可能會有許多局部極小值,有些極小值可能會比其他的好。如何保證我們在訓練的過程中能夠找到一個好的局部極小值呢?訓練深度網路往往會花費很長的時間,我們是否可以加速訓練呢?這些也都是非常有意義的研究方向。
隨後 John 考慮了當訓練兩個網路時會出現什麼有趣的研究。對於兩個網路,我們可以同時訓練,也可以一先一後。那麼這兩種情況,兩個網路在激活空間里是否共享相同的區域呢?一個當前比較火的例子就是生成式對抗網路(GAN),這個網路便屬於一先一後的情況。
最後 John 提出了一個問題:人工智慧是真的嗎?他認為,現在的人工智慧只是高維空間中的模式識別,AI 還不能提取出一個事物的本質或者理解它的功能。在 John 看來,要想實現這一點,只是需要另外 40 年的時間。他還說到,其實很多現在看來是智能的任務其實都不是 AI,有些只需要強大的計算以及大數據就足夠了,例如棋類比賽。計算機正在做越來越多的人們以為需要智能的事情,實際上有些並不是 AI。所以我們在從事人工智慧相關的工作時要想一想,這個問題的核心的是 AI 嗎?還是僅僅需要大計算而已?
四、人工智慧的字母表
芮勇:聯想集團首席技術官,高級副總裁,ACM Fellow,IEEE Fellow
芮勇博士在演講中介紹了人工智慧字母表中的 A(Algorithm,演算法)、B(Business,行業)、C(Computing,算力)、D(Data,數據)。他認為想要把一個人工智慧系統做好,這四方面缺一不可;如果把人工智慧看做一輛車的話,演算法就是引擎,算力就是輪子,數據就是汽油,而行業則是方向盤。
A:演算法-引擎
從人工智慧出現至今,演算法的沿革及演化大概是:邏輯回歸,神經網路,支持向量機,隱馬爾科夫模型,專家系統,深度學習。而事實上人工智慧的演算法也分為不同的陣營,例如符號學派(規則和決策樹);連接學派(神經網路);貝葉斯學派(概率圖模型);類推學派(SVM);進化學派(遺傳演算法)。目前來看,則是連接學派發展勢頭很好,其他稍次。
C:算力-車輪
計算力是車輪,承載了整個人工智慧的運行。在幾年前大家主要還是通過 CPU 集群來跑演算法,而目前主流的計算引擎則是 GPU,CPU 則主要用於控制和參數同步;另一方面 FPGA 在嵌入式解決方案上的前景比較光明,而專用的 ASIC 晶元則羽翼未豐。
D:數據-汽油
數據是整個人工智慧的能量來源。我們現在處於一個新數據時代,面臨著一些列的挑戰。
首先是數據量爆發,例如目前 90% 的數據都是兩年內生成的,預計到 2020 年全球平均每人每秒都會產生 1.7MB 的數據,如何充分地利用這些數據是一個很有挑戰性的問題。其次如何解決數據的質量問題,讓數據能夠覆蓋更廣泛的領域,而不只是集中在某些特定的領域。再次,如何高效地進行新數據的生成,例如生成對抗網路(GAN)。
B:行業-方向盤
行業就是人工智慧的方向盤,決定著整個大方向向哪個地方發展。芮勇分別舉了智慧交通、智慧醫療、智能心電衣等幾個行業案例說明了這個問題。
芮勇總結到:請記住人工智慧字母表的這前四個字母,A,B,C,D。它們是開好人工智慧這輛車必須掌握的。
五、IoT時代的只能語音交互
鄢志傑:阿里巴巴達摩院-機器智能技術研究院 語音交互首席科學家
我們知道阿里前兩天剛剛發布要全面進軍 IoT 領域,鄢志傑博士在報告中則介紹了阿里巴巴在 IoT 方面的工作。簡單來說,阿里巴巴想要數字化整個物理世界,其觀點是:計算是心臟,AI 是大腦,而 IoT 則是神經;神經能夠使他們觸達更多的用戶,產生更多的數據,產生更大的價值。其表現為,阿里要做 IoT 基礎建設的搭建者,在 5 年內布置 100 億個 IoT 設備。
隨後鄢志傑博士詳細介紹了語音交互智能在 IoT 與互聯網內容和服務中的橋樑作用,下面這張圖是阿里內容架構圖:
更詳細地,鄢志傑博士則分別介紹了阿里的智能音箱、智聯網汽車、電視(盒子)、公共場所服務機、多模態語音交互打平等產品。他認為在 IoT 時代,必須將技術、產品和商業打造成一個閉環才能夠共同促進發展。
六、城市數據湖——城市發展
林擁軍:易華錄總裁
林擁軍先生介紹了在大數據時代,數據如何存儲和利用的問題。在現代,我們有了更多和更先進的感知器來收集數據,也有光纖、5G 等等數據傳輸管道;在計算上我們也有 GPU、TPU 以及超算等高性能計算硬體,但是在存儲上我們仍然還在使用以硬碟、磁帶等為主的器件,這些存儲設備不僅能耗大,壽命短,而且安全性也較差。林擁軍先生在此介紹了藍光存儲技術。
他把數據分為熱數據、溫數據和冷數據。其中熱數據一般採用電存儲,優點是速度快,輕便;而缺點是容量低、成本高、壽命短。溫數據則一般採用磁存儲,優點是速度較快,容量大;但缺點是能耗大、壽命短、易故障。而大量冷數據可以採用光存儲的方式,其能耗只有磁存儲的 0.3%,成本只有磁存儲的 6.5%,壽命為 50-100 年,單張容量 300GB。他認為以「冷技術」保存冷數據,使冷、熱數據得以完美結合,將成為人工智慧時代數據存儲的最優選擇。
林擁軍先生等人以藍光存儲技術為基礎,構建一個城市新的基礎設施,他們稱之為城市「數據湖」。他認為這以後將是每一個城市的標配基礎設施。在這個構想中,數據湖將成為政府主導建設的存儲節能優先的基礎設施,IDC 則將是企業主導建設的計算性能優先的商業實施。林擁軍先生認為「古人逐水而居,今人逐數興業」,因此數據將成為地方政府吸引人才的一個重要因素。
數據湖的 IT 架構將是湖存儲+ABCD,其中 ABCD 分別為為人工智慧(AI)、區塊鏈(Blockchain)、大數據(Data)和雲計算(Cloud)。而其特點有四個:海量(存儲容量大、單機櫃 1.6PB、數據密度高)、綠色(能耗低、磁存儲、存儲成本低、磁存儲的 6.5%)、安全(壽命 50 年以上、數據不可修改、方電磁公積、防病毒刪改)、生態(數據開放)。
最後林擁軍先生還提出了數據湖構建的三部曲——建湖、引水和水資源利用。建湖即為以光磁融合技術作為構建城市數據湖的核心要素;引水為政府已有數據的引入;水資源利用為數據驅動、決策支撐,推動改進政府治理方式,提升政府治理的高度。
七、端到端AI計算系統設計與優化
張清:浪潮集團AI首席架構師
目前人工智慧計算面臨著一系列問題,例如如何優化模型、自動學習模型、構建大規模演算法等,這往往需要專家才能完成,且限於硬體設備的限制往往也不能達到最優化。
張清先生在報告中介紹了浪潮集團提出的端到端 AI 計算系統的設計思路。大概分為四層:
AI 計算平台:在平台中會針對某一問題的計算特點、領域特點、部署環境等進行設計演算法。例如參數密集型或者計算密集型,平台會根據這些特點做出不同的配置。
AI 系統管理:對於個人來說可能只能配置少量的 GPU,硬體設施會限制運算的效率。但是如果基於大型的集成計算硬體平台,它們可以根據硬體資源的具體情況進行資源管理、調度和監控,可以有效地利用資源和提升運算效率。
AI 計算框架。系統將根據不同的場景要求、模型特點和平台特徵選擇合適的框架(TensorFlow、Caffe 或者別的)。
AI 應用方案:對 AI 應用實現進行分析,則會有四個過程,包括任務分解(例如是圖像識別、語音合成還是機器翻譯等)、數據準備(數據清洗、數據增強、數據標註等)、演算法選擇(RNN、ResNet、FCN 等)、系統構建(管理平台、計算平台等)。
端到端的 AI 計算系統優化技術方向包括三個:計算、通信和 IO。其中計算為 CPU 與 GPU 並行訓練,進一步提高資源利用率。通信則採用硬體技術,實現通信的低延時域高貸款;IO 則採用線上與線下同意存儲架構設計,降低數據傳輸時間。
雷鋒網總結:以上為 AITech 主論壇一的內容介紹。在半天會議中,通過深圳市以及龍崗區政府領導的講話,我們能夠了解到深圳市(龍崗區)政府在人工智慧以及相關產業方面做出的巨大投入。從高文院士的報告中可以看出國家層面正在以及將要如何布局人工智慧發展;徐揚生院士的報告讓我們認識到,人工智慧時代我們應當重新思考(子女)教育問題;John Hopcroft 則通過淺顯的語言讓我們認識到深度學習的不足、可能改進的方向以及對此應該有哪些反思;芮勇博士的報告,則形象化地闡明了人工智慧良好發展的 A、B、C、D 四大要素;鄢志傑博士的報告則非常具體地闡述了阿里巴巴在 IoT 方面的架構;林擁軍先生則給我們展示了一個宏大的數據存儲場景,對各級地方政府都有很大的參考價值;張清先生則介紹了端對端 AI 計算系統的設計和優化,類似平台的出現或許將讓大量研究人員不再需要單獨購買 GPU 或者自己設計演算法。總之,每場報告都讓人有一種心靈和視野的激蕩。
更多內容請關注雷鋒網隨後報道。


※給正在讀論文的你:如何高效閱讀文獻?
※宣傳光纖掃描成像多年,Magic Leap最終投入光波導懷抱
TAG:雷鋒網 |