當前位置:
首頁 > 最新 > 與機器學習教父對話:深度學習目前還無法認識媽媽

與機器學習教父對話:深度學習目前還無法認識媽媽

Tom Mitchell是美國卡內基梅隆大學計算機科學學院機器學習系主任、教授,美國工程院院士,美國科學促進會(AAAS)會士,國際人工智慧協會(AAAI)會士,他在機器學習、人工智慧、認知神經科學等領域卓有建樹,撰寫了機器學習方面最早的教科書之一《機器學習》,是機器學習領域的著名學者。

鄧侃大數醫達創始人

這是一段有趣的對話,關於近年來大熱的深度學習。一段時間以來,深度學習風頭正勁,提人工智慧必然會提深度學習,而Tom Mitchell則明確告訴我們,深度學習也有缺陷,我們需要更多的方法來做AI、做機器學習。

以下內容是4月27日下午GMIC大會上,Tom Mitchell和鄧侃以及現場嘉賓的對話,未來圖靈稍作編輯呈現。

鄧侃:很多人都誤以為深度學習等於機器學習,等於人工智慧,我和Tom Mitchell都不太同意這種觀點。我今天想請Tom Mitchell說一說傳統的AI的好話。

Tom Mitchell:謝謝。深度學習能夠流行是有原因的,在過去十年有非常大的進展。去年有一篇論文在《自然》雜誌發表,證明深度學習可以進行培訓來診斷皮膚癌。只要獲得足夠的皮膚癌的照片,就可以確認皮膚病症是不是癌症。

深度學習到底能不能實現推理?

你認識你媽媽,但是你是怎麼認識的呢?

深度學習很擅長的是認知,比如說視覺、聲音、分析等等。然而,它也有缺陷,我們仍然需要更多的方法來做AI、做機器學習。

深度學習是很難理解它自身結果背後的理由的。它能得出一個診斷,知道這是皮膚癌,但是它不能給出為什麼,它沒有推理能力,沒有解釋的能力。

有其他的機器學習方法更優於深度學習,能夠解釋為什麼。比如說概率、圖形模型,它也用很多符號性的方法,當答案提出來,你可以看到各自的變數。

患者出現癌症,你可以看到他出現什麼樣的結果,以及原因是基因突變等等。我要提出來「學習樹」的方法被我們信任,也非常實際和有意義,它也需要給出解釋。我們十年前寫了一篇論文,我們對機器學習系統進行了培訓,使用了一些孕婦的醫學數據來預測出生是否正常。最後我們把結果發表的時候,我們決定把這個「決策樹」方法發表出來,而不是發表神經網路方法。原因是醫生、病人,都可以看決策樹,可以讀一讀他得出這個結果的理由是什麼,為什麼是這個診斷。深度學習無法做到這一點,在這件事中,推理能力是非常關鍵的。

鄧侃:第二個問題,Tom Mitchell剛剛提到深度學習缺陷之一就是它無法進行推理。剛才Tom Mitchell講過的事情,在一次醫療應用上,沒有選擇深度學習,最終選擇的是傳統古老的神經網路。雖然神經網路很傳統,但是整個的推理過程能看得一清二楚,所以醫生比較願意接受。所以Tom Mitchell在這一塊就問了一個問題,深度學習不太好解釋它的推理過程。剛才我就追問了一個問題,雖然現在深度學習不太好解釋,但是將來是不是完全不能解釋?在未來深度學習是不是還是不能解釋呢?

Tom Mitchell:我可以給大家兩個回答,我也不知道哪個是對的。一個答案是可以的。我們正在使用深度的網路去進行深度的語言處理、深度的理解,我覺得這個研究非常重要。因為它會聯繫兩個主要的東西,比如說不能解釋的這種表徵,也就是神經元、神經網不能解釋的表徵和語言進行聯繫、和符號進行聯繫,這種研究非常重要。這樣可以幫助我們去理解是否能夠搭建一個橋樑,去聯繫這些神經元的表徵和那些帶符號性的語言。目前來說,語言研究領域正在和深度學習進行融合和交流,這是非常令人興奮的。還有另外一種可能性,就是不能解釋。大家都知道,我們都可以認出我們的母親,我們有視覺系統做這件事,但是沒有人能夠解釋你是怎麼認出你自己的母親的,這和解釋電腦程序不一樣。作為人來說,我們有這些能力,我們有很多的神經的認知方面的能力。對於這個來說,對我們來說解釋也是不可能的,你為什麼能做這件事?所以說這種競爭,包括視覺方面的競爭,如果說語言是不可能解釋正在發生的事情,確實是有這種可能的。

鄧侃:我剛才問一個問題說深度學習能不能解釋,即便今天不能解釋,未來是不是可以解釋?Tom Mitchell很聰明,這個問題有點難,是一個坑,他沒回答,他沒跳坑。他反問我兩個問題,第一個問題,你真的相信人類所有的邏輯推理都可以被解釋嗎?他舉了一個例子說你認識你媽媽,但是你是怎麼認識的呢?你怎麼能識別你媽媽那張臉呢?這就很難講。同理,說了另外一個問題,你的女朋友想讓你買一個很好的禮物,你就問什麼叫作好的禮物呢?你女朋友一定會很生氣。他說明一個問題,很多人類的推理的過程、邏輯過程其實是不可清晰描述的,這是Tom Mitchell問的第一個問題。第二個問題是說通常情況下,AI有兩個不同的學派。一個叫符號學派,一個叫連接學派,深度學習是連接學派,我們通常認為符號學派的路子比較容易解釋,所以他問了第二個問題,是說將來有沒有可能這個符號學派和連接學派走在一起呢?大家有沒有回答?可以直接向Tom Mitchell進行回答。

嘉賓1:謝謝。我簡單地回答一下,現在所說的深度學習依然還是未成熟的階段。我舉一個例子,有幾個新公司來找我說,他們要用深度學習演算法去分析一些圖,來看一個病人是否有疾病,所以他們要花幾個月的時間去算這個演算法,現在這個演算法和醫生識別疾病的能力是一樣的。如果你教醫生、學生去認識這個病的話,可能幾分鐘他們就學會了。所以,深度學習在今天來看仍然還是一種非人的思考方式。

關於有人認為兩種思維方式,一個符號的方式,一個連接的方式,我覺得我們現在還沒有到達一個時間點,能夠做出好的模型來把這兩種方法結合起來。我們仍在開發人腦科學,我們想知道人腦是怎麼做出基於不確定性以及基於基本的關鍵的元素進行決策的。也許每一個深度學習的演算法都能夠被使用,或者被應用在一些分類的定義上,也就是關鍵因素的分子級的定義上,其他的還可以進行疊加,一個上級的,一個下級的,這是我的一個簡單答案。

會不會有AI巨無霸公司統治一切?

訓練數據加上演算法才能決定勝出方

嘉賓1:我還有一個問題想問Tom Mitchell,您覺得在未來是否可能,某些大公司能夠成為特別特彆強大的公司、特別先進的公司,他們就有這樣一個演算法呢?一個大公司就可以贏得所有的市場,把一個大演算法用在一個地方几乎是零成本的,在未來會不會有一個在AI方面巨無霸的公司統治一切呢

Tom Mitchell我同意您的分析,醫院方面的情景。您問的問題很有意思,是否會有一個AI的公司統治所有的AI界,我覺得答案是否定的

因為成功的AI到今天需要我們手中的數據,即使一個公司有最好的演算法,如果他們的公司不擁有所有的世界上的數據的話,仍然還有其他類型AI的測試,在其他的公司可以做,用他們自己的數據。我覺得訓練數據加上演算法才能夠決定誰會在未來勝出。

深度學習能否複製人的學習過程?

接觸數據只是人學習的其中的一種方式

鄧侃:謝謝。我覺得您說的這個很有趣,我問Tom Mitchell一個問題。當我們說傳統的機器學習、深度學習的時候,就會產生另外一個可能,即使深度學習目前也不是這樣很好的方法,在未來也許會變成下一個新的階段的某種新的學習,這個特別令人受啟發。

我這樣問吧,比如說這個人提了一個問題,目前深度學習仍然不是和人腦學習相同的,比如說真實的老師不會用同樣的例子去教那個學生,但是學生可以舉一反三學習到這個事情,但是深度學習需要百萬級的訓練真實的情景,這個是非常不好的一件事。深度學習能否複製人的學習過程呢?比如說訓練。

Tom Mitchell我覺得這個問題非常有道理,事實上有時候人們就會問,未來機器學習會變成怎麼樣?我覺得這個問題,如果你想知道機器學習在未來會變成多麼不一樣,你需要做的就是看看人們的學習,哪些是電腦不能做的,人類的學習是去上課、去讀書、去對話、去體驗世界、去接觸數據。接觸數據只是人學習的其中的一種方式,今天的機器學習,尤其是深度學習,幾乎都是圍繞著統計、分析、大數據,我覺得在未來這個會改變,也必然改變,這樣才能產生新的應用

您的問題,就像一個關於肺病的問題。這個病可能是五分鐘你教一個醫生就可以診斷出這個病,但是要教一個機器學習診斷,則需要幾個星期才能學會。我不是醫生專家,但是我想說,根據我的經驗,有很多的案例,我可以教一個學生五分鐘就教會,或者是別人可以五分鐘教我一個事,我能學會,我就能掌握得很好了。如果我做幾年我了解得更好,我覺得這個同樣的事情對於醫學也是這樣。

有不同的想法、不同專業等級,真正的專業人士是綜合結合起來的。老師給你講要學背景知識,又加上了很多的例子,隨著時間的發展來累積,如果你看醫學,有一點非常有意思。像鄧先生的公司,有上百萬個病例,數據量比一個醫生一輩子看診的患者量還要多。我們不知道怎麼給出指令,沒有演算法,但是有這麼大的一個數據級,在某些情況下,這樣大量的數據可以用電腦進行檢查,最後得出來的結果比醫生還好,因為它的數據級比一個醫生一輩子看的患者量還要大。所以說在未來我覺得我們需要,我也希望像您,還有其他的研究人員給我們更好的學習方法,這樣機器學習既能聽從指令,又能利用大數據。現在我們只能利用大數據,現在就是這樣子的。

機器是否能夠控制人的大腦?

不希望人們開發技術控制別人的大腦

嘉賓2:非常感謝,針對Tom Mitchell的問題,針對好禮物我有一個定義,一個好的禮物你要聯想一下,利用你的知識來考慮這個人,比如說這個人喜歡大房子,一個大房子就是好禮物,當然這個過程也非常合邏輯。我問Tom Mitchell,我是非常喜歡科幻小說,在《銀河帝國》裡面有一個機器人能讀人的想法,能夠干預人的行動。計算機怎麼計算,它就會怎麼干預,你會看到有很多理論在這些小說當中,最後都變成了現實,您覺得這樣子可以嗎?

Tom Mitchell:謝謝您有關禮物的定義,我明天回家得想給我愛人買什麼樣的禮物,就像你說應該從她的偏好入手。我理解您講的這個科幻小說,因為電腦能夠干預人的思維,就帶來問題了。是這個意思嗎?

嘉賓2:機器能夠讀人的思想,它能夠影響或者控制人的行動,它要根據自己的計算來影響、控制人。

Tom Mitchell:明白了,我要承認在我自己的研究當中,我們研究把機器學習和大腦圖像結合起來來解碼人的大腦活動,當然利用的是他們的神經圖譜。這樣的工作帶來兩個非常不同的問題,第一就是觀察某個人的大腦活動狀態,第二是控制那個人的大腦活動狀態。

比如把你放到我們的掃描儀或者核磁共振下面,看一下你在想鎚子或者是草莓。當然了,我只要放上去,大腦就會產生活動,我們的程序就能知道當你看到什麼東西,你的大腦活動是什麼樣子的,我們看你的大腦活動就知道你是看到了草莓還是鎚子。

也有一些情形我們可以觀察,可以解碼,但是有的時候我們能做到這一點,但是控制大腦的活動,我們現在還沒有這樣的設備、儀器。除非人工耳蝸,這些人生下來失聰,人工耳蝸植入到聽神經之後就會讓這些失聰的人停止失聰。這是非常簡單的一種界面,但是我們還沒有真正控制大腦的。

我真的不希望人們開發這樣的技術來控制別人的大腦,我覺得觀察大腦的活動是研究大腦的一種非常好的方式,可以幫助到患者,因為有的患者已經無法進行溝通交流了,觀察大腦活動是非常有意義的。

我們能否實現全球普遍語言?

AI系統用內嵌矢量可以創造出新屬性

嘉賓3:謝謝Tom Mitchell,我是一個本科生,學軟體工程的,我的問題可能不成熟,您提到深度學習的原則有點像一個黑盒子,它的原則並不為科學家和工程師所熟知,我讀過哲學、心理學的幾本書,您覺得是否可以從哲學、心理學學到一些東西,借鑒一下,比如說語言、哲學、心理學等等。可以把這些方法論視角加入到深度學習當中,這樣子是一個綜合的視角,比如說符號學視角來解決問題呢?

鄧侃:我再重新把這個問題給問一下,這是一個很好的問題,講到針對女朋友的最好的禮物是什麼,有自然語言,人使用自然語言,人的自然語言對於邊界定義比較差,什麼是好禮物、什麼是壞禮物,現在有一個好的方法——深度學習。我們說潛入一個叫Tencer(音)的數據陣列,如果你把倫敦轉換成一個數碼,你會發現距離差不多,所以說我們可能找到一個全球普遍語言叫Tencer(音)的,把人的自然語言和圖像結合起來,和聲音結合起來等等。能不能稍微介紹一下,我們能不能實現這樣一個全球普遍語言呢?

Tom Mitchell:特別好的問題,根據您的例子,如果倫敦這邊有一個矢量圖,北京有一個矢量表示,我們就問問電腦,倫敦和倫敦之間平均的城市是什麼樣子的?那個城市可能甚至不存在,也這樣一個矢量,你就可以想像一個城市,AI系統就會利用這些內嵌的矢量、編碼,這樣的城市擁有什麼樣的屬性?既有北京特色,也倫敦特色。

在醫學當中,這點非常有意思。如果說每個疾病,比如說某一種癌症、肺炎,所有的疾病,如果說他們能夠用矢量編碼的話,基於數據來訓練這些矢量,我們就可以問,不一定問一個不存在疾病方面的問題,但是非常有意思的是有很多疾病。我的醫生朋友告訴我一種疾病不清楚是一種疾病還是12種疾病的組合,我們有這種人為的離散的名字,但是我們對此不太理解,它到底是一種病還是一種症候群。所以說我覺得這個概念讓我倍受吸引,我們是不是會有矢量語言來代表不同的疾病呢?那個存在的話,那麼我們就可以更合理的方式來應對這些症候群,因為我們現在不知道症候群裡面可能有幾種疾病。

鄧侃:時間到了我就不多說了。大家覺得剛剛進入狀態,但是很不好意思,非常感謝大家,大家問的問題非常有意思,特別是三位問的問題非常有趣,沒有回答完,其實你們剛才打開了巨大的話匣子,但是我們的時間到了,我們用熱烈的掌聲謝謝Tom Mitchell。


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 機器學習 的精彩文章:

機器學習優化演算法「梯度下降」及其變種演算法
結合Apache Kafka生態系統,談談2018年機器學習5大趨勢

TAG:機器學習 |