當前位置:
首頁 > 科技 > 黑箱難題仍在阻礙深度學習的普及

黑箱難題仍在阻礙深度學習的普及

原標題:黑箱難題仍在阻礙深度學習的普及



當前,深度學習扛起了人工智慧的大旗,讓我們得以一窺智能機器在將來的能耐。但深度學習有個不小的問題:沒人知道它是如何運作的。

我們並不是對深度學習一無所知。作為當今神經網路的核心,機器學習演算法已經發展了幾十年,它定義完善,文獻豐富。在銀行和保險業等受到嚴格監管的行業,這些演算法已經普及多年,不曾引發重大問題。


「機器學習基本就是線性數學,很好解釋,」數據公司Teradata首席技術官斯蒂芬·布羅布斯特(Stephen Brobst)在Teradata合作夥伴大會的一場小組討論上說。「然而,一旦涉及到多層神經網路,問題就成了非線性數學。不同變數之間的關係就糾纏不清了。」


神經網路的明晰性問題植根於它的基本架構,這種架構的複雜性是與生俱來的。通過將很多隱藏層逐層堆疊起來,我們其實創造出了幾乎無限量的路徑,供數據在網路中訓練時經過。繼而,通過讓數據一遍又一遍地經過這些路徑,將每次循環中變數的權重交由機器自己決定,我們發現可以製造出更好的機器,提供比傳統機器學習方法更加優質的答案。


這是對人腦的一種粗糙演繹——這裡要強調的是「粗糙」,因為我們仍未充分掌握人腦的運作原理——但我們知道人腦能起作用,也知道神經網路能起作用,雖然我們對它們的運作原理不甚了了。從某種層面上講,神經網路的不透明性不是什麼缺陷,而是一種特色。


複雜性正是深度學習起效的秘方。


這也是一個不小的研究領域。金融服務等行業都對神經網路垂涎三尺,但目前都被禁止使用,因為他們無法向監管機構充分解釋神經網路的運作原理。「在將機器學習投入風險評估等領域的過程中,這是最大的一個障礙,這些領域受到嚴格的監管,」布羅布斯特說。「若只是欺詐檢測和推薦引擎,你還可以僥倖過關。但監管嚴格的領域就不行了。」


這足以使DataRobot公司在這些領域的客戶迴避深度學習框架,如Tensorflow等,儘管DataRobot會幫助實現其自動化使用。「有時候,這些模型會因無法驗證而被拒之門外,」DataRobot首席運營官克里斯·德瓦尼(Chris Devaney)說。「你不太容易為它辯護。即便不是黑箱,它也表現得像個黑箱,因為你無法記錄神經網路演算法深處發生的一切。」


TensorFlow可以針對大規模數據集作出快速預測,但DataRobot的顧客不願觸及。目前,DataRobot正在與Immuta合作,旨在尋找並削減機器學習中的偏差,這方面的工作終將有所成效,但任重道遠。「對於一些受到嚴格監管的客戶,如果必須在政府機構面前捍衛這種模型,他們就會放棄考慮,」他說。

研究公司ForresterResearch副總裁、首席分析師麥克·格列蒂里(Mike Gualtieri)說,有些公司一邊使用深度學習,一邊還抱有某種程度的懷疑。「連使用這些模型的公司都不信任它們,」他在近期的合作夥伴會議上說。


他說,開始使用深度學習的公司有辦法對付這種不確定性,包括加入人類干預,用規則加以限定,他說。


「模型可以作出預測——這個預測始終都是一個概率——但如果預測不準呢?」他說。「你可以用規則加以限定。比如告訴它『這是欺詐』,模型可能會說:『這不是欺詐』。你也可以設定有利於人類的規則,比如說,『我才不管模型怎麼說——在我看來,這就是欺詐。」


在增加神經網路的透明度方面,人們已經做了一些工作。其中之一被稱為「局部可理解的與模型無關的解釋技術」(Model-Agnostic Explanations;下簡稱LIME)框架,由華盛頓大學計算機科學教授馬可·圖裡奧·里貝羅(Marco Tulio Ribeiro)和他的同事薩米爾·辛格(Sameer Singh)及卡洛斯·格斯特林(Carlos Guestrin)共同提出。


LIME框架的設計旨在提高可理解性,使各類不透明演算法生成的預測更易於解釋。這包括傳統的機器學習技術,比如隨機森林與支持向量機(SVM),以及當今日益流行的神經網路技術。

作為GitHub上的開源軟體,LIME框架有望逐層剝開神經網路的外衣。「LIME是一種高效的工具,賦予機器學習從業人員以信任感,可以加入到他們的工具組合中,」里貝羅、辛格和格斯特林教授在2016年發表於電腦資訊網站奧萊利(O』Reilly)的文章中寫道。


然而,在得到業界的信賴之前,LIME還有很多工作要做。Teradata的布羅布斯特說。「以上提到的LIME框架,我們還沒有完成呢,」他說,「這是一個活躍的研究領域……但我稱之為『畢業生代碼』。其用例非常有限。專門用例需要專門定製。」


原文:https://www.datanami.com/2017/10/27/dealing-deep-learnings-big-black-box-problem/


轉自: 品覺

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 ImaginationTech 的精彩文章:

TAG:ImaginationTech |