當前位置:
首頁 > 科技 > 有了數據、輸出和模型,你就敢擁抱人工智慧嗎?

有了數據、輸出和模型,你就敢擁抱人工智慧嗎?

「人工智慧」這個詞出現在上世紀50年代,它最基本的定義是「機器模仿人類智能行為的能力」,後來又被重新修訂為「機器接近或超越人類智能行為的能力」。隨著人們對人工智慧了解的不斷加深,今天的人工智慧概念更趨完整,即「機器通過訓練來學習期望的行為,接近或超越人類智能行為。」

有了數據、輸出和模型,你就敢擁抱人工智慧嗎?

MathWorks公司總部產品市場經理趙志宏

在Gartner最近所做的一次問卷調查中,不同行業的3000多家公司大約有50%已經把AI列入了他們未來的產品和管理計劃當中,但是只有大約4%的公司能夠真正地運用AI技術。所以,MathWorks公司總部產品市場經理趙志宏日前在MathWorks Expo 2018上發表主題演講時稱,「即使今天才去了解AI,其實也並不晚。」

有了數據、輸出和模型,你就敢擁抱人工智慧嗎?

「毫無疑問,我們正處於一個重大技術變革的時代。」但趙志宏說,目前還只是AI的初級階段,機器學習實際上也只是人工智慧這個大範疇里的一個重要組成部分而已,很多時候人們把這兩個詞互相等同,甚至互相代替,是完全錯誤的。

那麼,如果擁有了數據、輸出和機器學習模型,是否就意味著可以開始擁抱人工智慧了?趙志宏對此給出了否定的回答。在他看來,數據、輸出和模型只是整個AI開發流程的一個步驟而已,對感測器、文件系統和資料庫的數據訪問,以數據探索、預處理和特定領域演算法為代表的數據分析,以及如何在桌面應用、企業系統、嵌入式設備中進行部署,甚至是開發流程中的演算法開發、建模與模擬,都是人工智慧應用過程中需要認真考慮的問題。

有了數據、輸出和模型,你就敢擁抱人工智慧嗎?

萬事俱備,只欠……

在演講中,趙志宏以膨化食品智能檢測為例,向大家證明即使用戶從未使用過機器學習,也可以利用MATLAB提供的APP進行學習,去嘗試所有機器學習的演算法和模型。在這一案例中,研究人員在用戶咬食品的時候提取特徵,用咬合聲音和力度去衡量食品的鬆脆度,再利用MATLAB提供的分類學習器進行訓練。在訓練過程中,用戶可以看到每個分類器的整體結果,選擇精確度最高的一個,然後進行更多的調查和研究。

有了數據、輸出和模型,你就敢擁抱人工智慧嗎?

相比從數據中提取特徵值,其實分類器的開發並不是最困難的。如果對「特徵工程」有所了解的話,就會知道特徵工程主要目的,其實就是最大程度地從原始數據中提取特徵向量,然後再利用這些特徵向量去訓練機器學習或深度學習模型。尤其是在深度學習流程中,深度神經網路不需要人工手動的找出特徵值,而是可以自動的從數據中學習到特徵值。但顯而易見的是,這一過程需要大量的數據做支撐,如果遇到以下幾個問題,開發者是否就會處於束手無策的境地?第一,數據量不夠如何訓練模型?第二,數據量太大如何快速進行標註?第三,沒有合適的數據怎麼辦?

  • 遷移學習:通過模型產生數據訓練神經網路

如果數據不足,能做人工智慧嗎?這是很多初創公司的困惑。「遷移學習可能會是一個不錯的選擇。」在趙志宏所列舉的高效隧道鑽探案例中,日本科學家利用已有的AlexNet網路,將手邊僅有的1000餘張經過標記的隧道表面地質狀況照片進行定製性訓練,使得新網路能夠識別地質參數,識別精度也達到了90%以上。然後,將開發好的演算法利用MATLAB Production Server部署到雲端,這樣,鑽井工程師、探測工程師就可以通過使用IPAD隨時隨地對隧道的表面照片進行探測,從而大大地提高了挖掘效率。

「只需要寫5行的MATLAB代碼,用戶就可以建出一個能夠識別食品或者其他家庭常用物品的網路。」趙志宏說。

有了數據、輸出和模型,你就敢擁抱人工智慧嗎?

  • 數據量太大也是個問題

隨著感測器的大量採用,數據量激增,給人工智慧進行特徵標記帶來了一定的困難,趙志宏建議可以採用深度學習進行標記。例如最新發布的Autopilot toolbox自動駕駛工具箱里,就提供了為自動駕駛而使用的自動標註功能。LiDAR三維點雲技術可以對每一點進行標註,把這個點聚類在一起聚成一個目標模型,然後再把目標具體代表的實物辨別出來。有些用戶已經採用MATLAB的工具進行了開發,著名的汽車配件公司AUTOLIV就在用這種方式進行自動數據標註。

  • 如果完全沒有數據

「沒有數據還玩什麼AI?」這可能是很多人的第一反應。但在趙志宏給出的另一個案例中,用戶不可能等採集到大量風力發電機的故障數據之後再做預測,這樣不符合設備維護的目標。所以業內人士的做法是先用Simulink模型建立一個風裡發電機的模型,通過校正讓這個模型非常接近風力發電機,然後通過該模型產生故障數據,進而訓練機器學習或者深度學習的神經網路。

有了數據、輸出和模型,你就敢擁抱人工智慧嗎?

這就是基於模型設計的優勢。它的開發理念是在真正做出產品之前,建好一個與實際產品非常接近的模型,不管是從數字計算、行為計算產生的結果與真正的結果都非常接近。然後在這個模型上加入故障情況就很容易產生故障數據,這比在實際設備上產生的故障要容易很多。因此,可以進行故障預測和維護。

數據、演算法和算力並稱為AI三大要素。除了數據外,快速迭代的神經網路演算法和針對不用應用的算力,會在多大程度上影響MathWorks的工具開發?趙志宏對此回應稱,公司的研發團隊時刻都在關注AI演算法的演進和變化,他們希望深度學習工具箱新增的功能與技術發展是同步的。此外,工具箱不僅是針對某一功能產生正確的結果,還要考慮如何把這個功能做得簡單易用。比如針對AI應用,MathWorks的願景是希望把界面做得非常適合該專業領域,兼顧用戶感受,降低學習門檻,容易上手。

而在計算力方面,面對需要極強算力的場景(GPU應用)和需要在功耗/算力間取得平衡的場景,MathWorks的主要目的在於通過提供多樣化的代碼生成工具,加速用戶開發過程。以最新開發的GPU coder工具箱為例,工程師可以將訓練出來機器模型網路直接下載到英偉達的晶元中,不必手動嘗試各種代碼,幾分鐘或者幾小時之內就可以得到測試結果。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 EET電子工程專輯 的精彩文章:

中國多所大學發布AI專業招生計劃,專家提醒「勿跟風報考」

TAG:EET電子工程專輯 |