當前位置:
首頁 > 最新 > 深度學習完整方案 節省80%開發時間

深度學習完整方案 節省80%開發時間

不只軟、硬體廠商,許多雲端服務商也紛紛卡位人工智慧(AI)市場,但競爭白熱化對於開發者來說倒也不是一件壞事,再加上大廠之間互相合作,這也促使整個AI生態系走向開放的型態,至少在市場上,資源會來越豐富與完整,從而降低開發者的入門門檻。

資源缺乏集成性 容易讓開發出現斷層

雖然市場上已有相當充足的資源供開發者使用,說來簡單,但實際上要投入開發卻也不簡單。在深度學習複雜龐大的知識體系下,開發者難以專精於每種技術層面,就好比擅長對大數據進行整理與分析的人,對於最底層運算環境中的硬體架構、IT技術知之甚少。

一個擁有數據科學背景的人尚可自己訓練一個深度學習模型,畢竟市場上有許多流行的深度學習開源框架可以使用,像是Tensor Flow、Caffe、CNTK、Theano等,這些框架都各有自己的優缺點。

加上過去由史丹佛大學(Stanford University)舉辦ImageNet圖像識別競賽中,包括Google、微軟(Microsoft)、百度等大型企業除了爭奪圖像識別寶座外,也會藉此機會同時測試自家系統的效能與極限,因此在比賽過程中,透過自家的深度學習框架訓練出一些新的神經網路演算法,這些資源經過大廠的「監定」與「驗證」,開發者若有需求都可取之。

利用已成熟的資源投入模型的訓練不難,但若開發者要再往下探究到更底層的運算環境,包括選擇合適的硬體組裝,或是建立基礎運算環境時,情況就變得更複雜了。研華智能系統事業群協理劉厚儀觀察,過去在深度學習的開發環境中,由於各技術層面之間壁壘分明,資源更難以集成。

就算開發者想對外尋求協助,在市場上也缺乏一套較完整的解決方案可以透過一次性的導入,解決系統建置所耗費的繁瑣工程,以及軟體開發的設計,這讓如SI的業者很容易在建立最基礎的運算系統過程中止步,迫使開發進程出現斷層。

深度學習完整解決方案 縮短開發時間、提高效率

因此,整合性的設備對於縮短系統建置時間至關重要。市場上最具有代表性的是NVIDIA在2016年所推出的DGX-1,當中便結合了硬體、深度學習軟體、程序開發工具軟體等,是全球第一款專為AI分析所打造的整合性設備。

DGX-1整合基礎運算環境所需的資源與工具,用以減少系統整合與軟體工程設計所需的時間,有了這樣的設備,企業能快速、簡易地部署相關的運算環境。不過DGX-1造價不斐,尤其對小規模的企業或是個人開發者而言,基於成本的考量很容易望之卻步。

所幸研華也發現市場上面臨資源分散、系統難以整合的問題,為了降低業者在建置訓練系統的複雜性與技術門檻,研華近年也積極投入人工智慧市場,並攜手大廠技術合作,開發深度學習完整解決方案。

研華將訓練系統中最底層包括硬體設備、深度學習軟體開發套件、模型訓練平台等基礎運算環境所需的資源集成起來,藉此除了協助業者加速訓練系統的建置,縮減人力和時間成本外,亦能讓諸如SI的業者能投入更多資源專註於解決終端使用者的需求。

開發者唯一要做的事,便是「搜集數據、整理數據」如此簡單,而最繁瑣的系統建置工程,未來都能透過市場上完整部署的解決方案來完成。這也是為什麼研華積極從投入人工智慧市場、攜手大廠集成最底層運算資源的原因,「目的即是讓開發者將有限的開發時間,投入在最具有價值的數據處理與分析上。」研華智能系統事業群協理鮑志偉如此強調。

然而,「訓練」只是深度學習的開始,更大的挑戰是接下來如何將深度學習技術實際運用到各種場景中進行預測和分析,而這部分的關鍵則是終端的推理系統。各種終端應用場景像是交通運輸、機器人、醫療保健和公共安全等,而每個應用場景實際上也面臨一些特殊需求。

例如在交通場景需要極度安全且可靠的硬體設備進行感知、在公共安全領域則需要質量穩定的攝影鏡頭以維持可靠的執行效率,同樣地,在苛刻和嚴峻的應用環境中也面臨各種挑戰。因此,若業者無法如實掌握產業端的特性,在系統建構的第一步便容易卡關、遇到阻礙。

這對於在產業深耕已久的研華來說,除了擁有積累多年的產業Know-how外,更能比一般業者熟悉市場客戶的需求。研華也在市場上提供以產業端需求為中心所設計的推理系統,以加速AI在終端應用場景中落地。

像是在研華所開發的IVA(Intelligent Video Analysis)推理系統中,使用者便可透過內含多種智能影像分析功能,包括移動偵測、人臉偵測、人群密度偵測等,將其快速導入到AI應用的開發中。而研華完整的深度學習解決方案不僅包括前端所需的訓練伺服器,也集成終端推論環境所需的數據存儲設備、網路設備等。

80%時間都耗在開發前數據處理

前百度首席科學家吳恩達曾把深度學習比喻成一個火箭。在火箭的結構中,推進火箭最重要的部分就是引擎,而目前在深度學習這個領域裡,引擎的核心就是神經網路。而火箭除了引擎外,還需要有燃料,那麼大數據便是構成火箭的重要組成部分─燃料。

大數據對於深度學習的發展與推進至關重要。研華智能系統事業群協理鮑志偉認為,驅動人工智慧的核心便是來自於大數據資料,一旦獲取的數據量越多,便能藉此優化訓練模型,讓模型的推理與分析更佳精準。不過,具有分析價值的數據必然事先經過整理,否則最終只是「Garbage in, garbage out」。

然而,處理數據非常消耗人力與時間,以往由於缺乏數據處理工具,通常開發者在訓練模型的過程中,會花費將近80%的時間在數據處理,象是整理或收集數據組合、10%的時間在運算,而10%的時間則在優化模型。

消耗大量的數據處理時間會拖慢開發進度,而市場也試圖解決這個惱人的問題。像是在研華的深度學習超級工作站中,因其內建自動卷標工具,開發者唯一需要做得便是檢查卷標是否正確,因而開發者在數據處理工具的輔助下,便能有效地節省80%的數據處理時間。

AI開發走向平民化

人工智慧之所以掀起熱潮,除了歸功於硬體運算能力的提升、類神經網路演算法的突破外,雲端服務的興起也讓系統建置成本大幅降低。在雲端建置訓練與推論系統的好處除了不需花費大量成本建構實體機外,還可以相當彈性地選擇擴充或減少部署。

開發者現今可以透過各種雲端服務商來建置訓練、或是推論系統,也可以選擇直接在終端環境中部署。但基本上,選擇在終端的成本無疑是最昂貴的,原則上有點像買斷與租用的區別。若是在終端建置推論系統,由於需配合產業端的特性與需求,這對業者來說仍有一定的門檻。

現今市場上的雲端平台除了提供運算資源,更打包好包括基礎設施、儲存空間及各種API等整套服務。目前市場上較知名的雲端運算服務有AWS EC2、Azure或GCP平台。

亞馬遜AWS由於創立較早,和其它平台相比擁有先發優勢,如今提供的運算、儲存、資料庫、分析、應用程序服務等超過70種,覆蓋面極廣,自然成為用戶首選;而微軟於2010年成立的Azure也不惶多讓,擁有67項服務,與微軟的產品結合度高;GCP則挾帶Google本身在人工智慧領域的優勢,以低價策略搶食市場大餅;而IBM的Bluemix則釋出許多人工智慧API。

關注DIGITIMES,產業資訊一手掌握


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 DIGITIMES 的精彩文章:

區塊鏈市場5年內至百億美元 中國積極拓展應用
自駕車感測技術 2018年持續創新演進

TAG:DIGITIMES |