當前位置:
首頁 > 新聞 > 深度學習已至「瓶頸」?英特爾:數據處理是一劑良藥

深度學習已至「瓶頸」?英特爾:數據處理是一劑良藥

深度學習已至「瓶頸」?英特爾:數據處理是一劑良藥

【新智元導讀】霍金弟子Alan Yuille在前不久發表言論稱,至少在計算機視覺領域,深度學習的瓶頸已至。然而,人工智慧與大數據的發展是相輔相成的,數據將會推動人工智慧的發展,促進更多技術應用落地,將人工智慧帶入一個新台階——數據紅利悄然將至

深度學習已至「瓶頸」?數據處理或許是一劑良藥。

前不久,霍金弟子、約翰霍普金斯大學教授Alan Yuille發表言論稱,至少在計算機視覺領域,深度學習的瓶頸已至

在此問題上,Alan Yuille認為該領域最嚴峻的挑戰是開發能夠應對組合爆炸的演算法,如果研究人員追求更多樣性的方法和技術,而不僅是追逐當前的流行趨勢,這一領域將會得到更快的發展。

而現在,對於深度學習發展已經到了天花板的問題,似乎有了另外的解決方案——數據

深度學習已至「瓶頸」?英特爾:數據處理是一劑良藥

英特爾公司架構圖形與軟體集團副總裁和數據分析技術總監馬子雅

6月18-21日,以「打破理論與現實的壁壘」為主題的O』Reilly和英特爾人工智慧大會在京舉行。

大會期間,英特爾公司架構圖形與軟體集團副總裁和數據分析技術總監馬子雅在被問到如何看待「深度學習到達瓶頸」的問題時表示,人工智慧、數據分析界在此問題上長期以來有兩派意見:

  • 一派意見認為人工智慧的發展一定要通過對其演算法的不斷提升才能真正把AI推到一個新台階;
  • 另一派意見認為人工智慧只做演算法是不行的,若是不能更好地利用、分析數據,人工智慧很快就會達到它的瓶頸。

而馬子雅認為,二者是相輔相成的,如同事物發展規律曲折回復,其最終結果會呈上升趨勢

人工智慧一直有所精進,但其應用方面並不是非常理想。自從有了大數據,對圖像分析領域產生了突破性推進作用。

數據會推動人工智慧的發展,會將人工智慧帶入一個新台階,部署行業應用,推進人工智慧落地


「人工智慧業務的需求牢牢地根植於數據,要充分利用以數據為中心的基礎架構,充分利用將數據分析與人工智慧無縫銜接起來的軟體創新技術。」

而圍繞數據為核心,英特爾在AI時代的戰略圖景也可通過此次大會有所了解:

  • 在軟體方面,提供一系列通用工具集,幫助用戶最大化利用硬體, 以及通過BigDL和Analytics Zoo構建統一的大數據分析與人工智慧平台,幫助用戶開發部署行業應用,推進人工智慧落地;
  • 在硬體方面,提供完整的硬體產品組合和計算平台,滿足用戶從設備到邊緣再到雲端的不同工作負載需求 。
  • 在產、學、研生態打造方面,英特爾宣布在中國成立大數據分析和人工智慧創新院,進一步加快集成數據分析和AI的大規模創新與部署。

英特爾人工智慧戰略的核心在於,致力於給客戶帶來領先的人工智慧硬體和軟體產品組合,幫助用戶搭建所需要的AI應用,幫助客戶解決所面臨的個性化問題。除了技術本身,英特爾還致力於與廣泛的行業夥伴合作,一起面向共同服務的客戶,開發全套、全面、完整的AI解決方案。

在AI時代,英特爾正在完成一次轉型——從「晶元航母」到以數據為中心,深挖數據紅利,釋放數據價值,通過軟硬體協同加速人工智慧的行業應用。


低門檻開源工具BigDL、Analytics Zoo,數據紅利悄然將至

人類處於一個數據變革的時代——歷史上90%的數據都是在過去幾年產生的,而50%的數據卻是在短短兩年所生成。

在過去的一段時間數據分析和人工智慧得到了空前的發展。

但事實上到目前為止,只有2%的數據被真正的分析用來幫助人類的生產生活。人工智慧是時候走出實驗室了,走向落地應用了。

而這一過程需要一條完整的數據分析流水線:

  • 第一步,通常需要從生產線上收集大量的原始數據;
  • 第二步,要對這些原始數據進行大量的清理和預處理;
  • 第三步,利用數據分析、機器學習、深度學習對於清理過的數據進行歸納總結;
  • 第四步,可視化。

這條流水線有著較高的門檻:20%的任務是深度學習,但80%都是在做數據收集、數據存儲、數據管理、數據清理、數據預處理

這也正是英特爾開源BigDL、Analytics Zoo的重要原因——降低門檻,讓人工智慧走出實驗室。

目前,BigDL和Analytics Zoo都已開源,大大降低了普通大數據用戶和數據科學家在使用深度學習進行數據分析和構建人工智慧應用時的門檻。

深度學習已至「瓶頸」?英特爾:數據處理是一劑良藥

GitHub開源地址:

https://github.com/intel-analytics/BigDL

先來看看BigDL,BigDL是一個建立在大數據平台(Hadoop/Spark)之上原生的分散式深度學習庫,它提供了在Apache Spark上豐富的深度學習功能,以幫助 Hadoop/Spark成為一個統一的數據分析平台,為整個數據分析和機器學習過程提供比現有框架更加統一和集成化的支持。

深度學習已至「瓶頸」?英特爾:數據處理是一劑良藥

GitHub開源地址:

https://github.com/intel-analytics/analytics-zoo

同時,在Apache Spark、BigDL以及TensorFLow、Keras的基礎上又構建了一個大數據分析+AI的平台Analytics Zoo,方便用戶開發基於大數據、端到端的深度學習應用。

不止降低了開發者學習深度學習的門檻,在建立AI生態上,「釋放數據紅利」已經逐漸變成現實。

人工智慧如果不能真正地效力於生產實踐,其實是沒有任何價值的。看未來的趨勢,必須先看到人工智慧對於未來哪幾個方面能產生比較大的影響。

英特爾通過Analytics Zoo構建統一的大數據分析和人工智慧平台,幫助用戶開發部署深度學習、人工智慧和大數據分析的應用,攜手眾多合作夥伴和用戶,共同推動人工智慧部署,加速落地。

美的,韻達,歐洲核子研究組織(CERN)都在利用英特爾Analytics Zoo進行人工智慧的落地。英特爾藉助BigDL和Analytics Zoo幾乎與各行各業的廠商展開了合作,實施部署了各種各樣的人工智慧的解決方案。

這其中就包括智慧醫療、智慧銀行、智慧交通、智慧生產、智慧電信等等。英特爾也與大型雲服務提供商、原型設備製造商、軟體開發商進行合作,將技術整合產品當中,包括阿里巴巴、百度、騰訊、京東等等。

同時,英特爾還推動與產、學、研的深度合作,打造AI生態

在大會上,英特爾宣布啟動英特爾數據分析和人工智慧研究院創新院。創新院的主要負責人是英特爾高級首席工程師、大數據技術全球CTO戴金權

這個創新院的主要工作集中在以下幾點:

  • 第一,加速人工智慧在中國市場的落地,尤其是通過將它與數據分析進行整合來加速落地。
  • 第二,解決中國市場的最新需求,引領創新,創新用法、創新演算法。第三,幫助中國市場更好地使用英特爾最新的軟體和硬體技術。

AI晶元,絕不能輸的戰場:不局限於CPU,需要研發多種硬體形式

如今AI晶元已經成為一個「絕不能輸的戰場」。

在O』Reilly大會期間,有著「晶元航母」之稱的英特爾在接受媒體採訪時透露了在硬體方面的布局圖景。

馬子雅表示:英特爾的硬體圖景不只集中在計算,我們希望英特爾的硬體能夠比較全面,例如針對存儲方面,英特爾開發了「傲騰」技術,另外英特爾也已經做了很久的網路架構技術。

而作為整個產業的根基,AI晶元如今成為各大巨頭紛紛爭先想要佔領的高地。收購Nervana Systems,成為英特爾全面擁抱人工智慧的一個重要節點。

在去年接受新智元採訪時,英特爾全球副總裁兼人工智慧產品事業部總經理 Naveen Rao 表示 AI 已是英特爾「絕不能輸的戰場」。在2019年1月,英特爾推出了Nervana神經網路推理處理器。本次馬子雅也透露對於Nervana的未來規劃公司已有路線圖,會在更合適的機會和大家分享。

馬子雅強調未來的計算力不能局限於CPU一種,尤其是在AI時代,需要通過研發多種多樣的硬體形式,保證計算力能夠在固定每幾年翻一番的速度繼續下去,可能都不是集中在通用晶元上,有時候是專用和通用的結合。

事實上,儘管CPU不再是「唯一」,但仍然是計算結構里不可或缺的重要組成部分。就如同Naveen Rao此前說得一樣,只要是馮·諾依曼架構,「你必須要有一個CPU」。

英特爾一大優勢在於,市面上已經安裝並且投入使用的CPU,而硬體基礎設施的更新則是逐步進行,「把舊的全扔掉然後換新的」並不現實。如今,全球有3500萬公司使用英特爾的CPU,眼下最火熱的人工智慧推理,也有近 90% 是在英特爾的晶元上完成。

英特爾在製程與封裝上仍處於領先位置。製程工藝不斷向更高的晶體管密度發展,為晶元帶來更強的性能和更低的功耗。擁有領先的製程技術,是構建領先硬體產品的關鍵。

製程的領先仍然是英特爾繼續發揮產品優勢的關鍵因素,在10納米領域英特爾繼續推動產品的發展。在Foveros的製程中,英特爾的3D封裝技術可實現在邏輯晶圓上堆疊邏輯處理單元,能夠把邏輯晶元和邏輯晶元連在一起,更好地發揮異構功效。

另外,在CPU的周圍,你可以放上GPU、DSP、ISP,以及NNP,或者各種新的架構。

深度學習已至「瓶頸」?英特爾:數據處理是一劑良藥

英特爾認為,未來十年架構創新會是創新的主要驅動力,將繼續帶來指數級的擴展效應。除了常見的標量、矢量、矩陣和空間這四種計算架構外,英特爾在架構創新上還做了更多的工作,例如:

  • Loihi神經擬態計算。它可以用超低的功耗去完成一個GPU用很高功耗才能完成的任務,並能通過學習得到一個新的網路。
  • 量子計算。量子計算是在架構上的另外一個全新的超大並行規模計算。英特爾在量子計算有兩個不同的探索模式,一個是和業界類似的通過超導方式做量子位和量子晶元;另外一種是基於英特爾比較擅長的硅處理工藝,用自旋的方式,目前也有了(自旋)量子位晶元,並且為了能夠規模化的生產和測試,專門和產業界、學術界合作。

保持CPU王者的領先優勢,同時開發適合AI時代的多種硬體形式,AI化是英特發展硬體的未來方向。


AI並非「一策萬能」:軟硬體協同創新,實現超異構時代的技術願景

事實上,過去幾年間計算力正在以驚人的速率增長。計算力指數級上升的實現,正是基於硬體與軟體的結合。如果想實現指數級的增長,必須要硬體和軟體共同創新。

在講述硬體未來圖景時,馬子雅提到需要研發多種多樣的硬體形式。然而,AI並非「一策萬能」。

沒有一種方案能解決所有問題(one size doesn』t fit all),需要多樣化的產品組合滿足不同人工智慧應用的需求。

從某種程度上,在人工智慧這一領域,英特爾更像是AI解決方案提供者,針對不同的案例提供不同的軟硬體組合:

  • 從軟體層面,英特爾主要集中在開源方面,例如開源BigDL和Analytics Zoo。
  • 未來十年的計算創新由架構驅動。英特爾具備獨具一格的優勢,可以將標量(CPU)、矢量(GPU)、矩陣(AI)和空間(FPGA)等不同架構整合到系統級平台和系統級封裝,同時也在進行架構創新的新探索,比如Loihi神經擬態計算晶元、量子計算。

而怎樣進行組合則是由客戶的工作負載來決定,決定適的軟體和合適的硬體。

深度學習已至「瓶頸」?英特爾:數據處理是一劑良藥

馬子雅透露到,最有效的辦法、為客戶提供最好的解決方案,就是先知道他的工作負載是什麼,然後找到相應的軟體硬體結合來解決那個工作負載,這是最行之有效的。

英特爾強調在硬體上每得到一個指數級的性能提升,如果加上軟體的話可能有兩個指數級的性能提升。對於此,英特爾從操作系統再到上層整合成一個完整的全棧軟體技術(Vertical Stack),然後在硬體架構的優化全部打通。

通過這種技術能夠把各種性能,架構上所有軟體的性能整合起來然後提供給用戶,大大提高其在這些架構上得到的性能和算力。值得一提的是,英特爾「One API」項目將為開發者帶來一套能提供一個統一編程模型的工具。針對跨多種架構的工作負載,這個模型簡化了相關的開發工作。

對英特爾而言,就是要提供多樣化的標量、矢量、矩陣和空間架構組合,以先進位程技術進行設計,由顛覆性內存層次結構提供支持,通過先進封裝集成到系統中,使用光速互連進行超大規模部署,提供統一的軟體開發介面以及安全功能,從而實現超異構計算的技術願景。

AI計算如今已經邁入超異構時代,硬體基礎只是AI超級生態中的一個環節,但是以數據為中心的未來還需要更完整的系統思考,單一因素已經不足以滿足多元化的未來計算需求,必須實現軟硬體協同創新。

2019 英特爾? 人工智慧開發者大會-深圳站

將於7月11日正式召開!

地點:深圳馬哥孛羅好日子酒店

此次大會為開發者準備了為期一天的AI實踐學習,此大會免費參與,掃描上方二維碼註冊參會。前75位完成線下籤到並全程參加會議的出席者可免費獲得英特爾? 神經計算棒二代。名額有限,請儘快註冊,收到參會確認函即為報名成功。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 新智元 的精彩文章:

機器人教父:自動駕駛30年內能上路,實現通用人工智慧還要300年
超強平衡!雙足機器人Cassie玩轉高難度漂移板

TAG:新智元 |