當前位置:
首頁 > 科技 > 解構盛名之下的人工智慧:真正潛力在哪、實踐意義如何、面臨什麼障礙?

解構盛名之下的人工智慧:真正潛力在哪、實踐意義如何、面臨什麼障礙?

作者|Eric & Andrew

編譯|NER

在過去的 250 多年裡,技術創新一直是經濟發展的根本推動力。我們這個時代最重要的通用技術就是人工智慧,尤其是機器學習。AI 盛名之下,也會有許多噪音,這篇文章將穿過這些喧囂的噪音,描述出人工智慧的真正潛力、它的實踐意義,以及它在被採用的過程中面臨的障礙。

寫在前面

在過去的 250 多年裡,技術創新一直是經濟發展的根本推動力。這些技術創新中最重要的就是經濟學家所說的「通用技術」,包括蒸汽機、電力,以及內燃機。它們中的每一個都催化了互補性創新與機遇的浪潮。舉例來說,內燃機讓汽車、卡車、飛機、鏈鋸、割草機,甚至大型零售商、購物中心、交叉對接倉庫、新供應鏈以及郊區得以出現。像沃爾瑪、UPS 和 Uber 這樣擁有多樣性的公司找到了利用新技術創造新商業模式的方法。

我們這個時代最重要的通用技術就是人工智慧,尤其是機器學習,也就是說機器能夠持續提高自己的性能,而無須人類明確解釋所有這些任務要怎樣完成。在過去幾年的時間裡,機器學習已經變得越來越高效和廣泛地使用。我們現在已經能建造出自己學習如何完成任務的系統了。

為什麼這件事非常重要呢?有兩個原因。第一,人類的知識比我們能表達出的更多,我們不能解釋為什麼人類能完成那麼多的事情,從識別出一張人臉到在古老的亞洲策略遊戲圍棋中走出絕妙的一招。在機器學習之前,我們無法精確表達出我們的知識,這種無能正意味著我們不能自動化很多事情,而現在我們可以做到了。

第二,機器學習系統是非常出色的學習者。這些系統能在廣泛的領域中達到超人類性能,包括檢測欺詐和診斷疾病等。人們在整個經濟領域中都部署了這樣出色的數字學習者,它們的影響力將會十分深刻。

在商業領域,人工智慧在早期通用技術的階段就被認為擁有變革性的影響。雖然它目前已經被應用於全球上千家公司,但大多數重大的機遇並沒有被利用開發出來。隨著製造業、零售業、交通運輸、金融業、醫療保健行業、法律、廣告業、保險業、娛樂、教育業,以及事實上每一個其他領域轉變其核心進程和商業模式,並從機器學習中受益,人工智慧的影響,在即將到來的這個十年中一定會被放大。現在的瓶頸在於管理、執行,以及商業想像力。

然而,就像很多其他新技術一樣,人工智慧也催生出了一大批不切實際的期望。我們看到有大量商業計劃隨意揮灑在機器學習、神經網路,以及各種其他形式的技術方面,但卻幾乎與其真正的功能沒有聯繫。舉個例子來說,簡單地把一個約會網站叫做「人工智慧驅動的網站」,並不能讓它變得更高效,但那或許有助於網站融資。這篇文章將穿過這些喧囂的噪音,描述出人工智慧的真正潛力、它的實踐意義,以及它在被採用的過程中面臨的障礙。

人工智慧今天能夠做些什麼?

「人工智慧」這個詞是 1955 年由約翰·麥卡錫(John McCarthy)創造的,麥卡錫是達特茅斯學院的一位數學教授,他組織了之後一年那場具有開創意義的人工智慧大會。從那以後,也許部分原因是因其令人回味的名稱,人工智慧這個領域開始崛起,而不僅僅停留在夢幻般的主張和承諾上了。在 1957 年,經濟學家赫伯特·西蒙(Herbert Simon)預測,十年之內,計算機將在國際象棋方面打敗人類。(事實上,計算機只花了 40 年時間。)在 1967 年,認知科學家馬文·明斯基(Marvin Minsky)說:「在一代人之內,創造『人工智慧』這個問題將會得到實質解決。」西蒙和明斯基二人都是知識分子中的巨擘,但他們都錯了。所以,對未來突破的戲劇性主張遭到了一定程度的懷疑。

我們先來看看,人工智慧現在在做些什麼,以及它在以多快的速度發展。最大的兩個進步發生在這樣兩個廣闊的領域:感知和認知。在早期的分類中,最有實用性的進步都是跟語音有關的。語音識別還差強人意,但現在有百萬計的人們在使用它,想想 Siri、Alexa,以及 Google 的語音助手。你現在在讀的這篇文章,最開始是我口述給一台計算機並讓它以足夠的精確度轉寫出來的,這樣比打字要快。由斯坦福計算機科學家詹姆斯·蘭迪(James Landay)和他的同事們進行的一項研究發現,平均來說,語音識別比在手機上打字要快三倍,其錯誤率已經由曾經的 8.5%降低到了 4.9%。令人震驚的是,這個顯著的改進並不是經過 10 多年時間才實現的,而僅僅是從 2016 年夏天才開始。

同樣地,圖像識別也進步得非常驚人。你可能已經注意到,Facebook 和其他應用程序現在可以在發出的圖片中識別出你很多朋友的臉,並且提示你給他們貼標籤。一個在你智能手機上的應用就能識別出野外的任何一隻鳥。在一些公司總部,圖片識別甚至正在取代身份證件。視覺系統,比如那些用在自動駕駛汽車上的視覺系統,以前在識別行人方面每 30 幀中就會出現一次錯誤,而現在它們的錯誤率比在 3000 萬幀中出錯一次還要低。圖片識別有一個巨大的資料庫,叫 ImageNet,它擁有幾百萬常見的、模糊的或完全怪異的照片,頂級系統的圖片識別錯誤率已經從 2010 年的 30%多,降低到了 2016 年的 4%。

最近幾年來,由於採用了基於龐大的或「深度的」神經網路的新方法,圖片識別的改進速度迅速加快。視覺系統的機器學習還遠非完美,但即使是人類,也可能會在快速識別出一隻小狗方面有困難,人們也可能會在根本沒有可愛小狗的地方看出小狗來。

小狗還是瑪芬蛋糕?圖像識別的進步

機器已經在識別相似圖像的類別方面取得了長足的進步。

圖片識別的錯誤率

第二個主要改進的方面是認知和問題解決。機器已經戰勝了最棒的人類撲克選手和圍棋選手,這是一項專家們之前預測需要至少又一個十年的時間才能實現的成就。Google 的 DeepMind 團隊用機器學習系統提高冷卻數據中心的效率,高達 15 個百分點,即使人類專家已經優化過數據中心,它也還是達到了這個水平。網路安全公司 Deep Instinct 正在使用智能代理來檢測惡意軟體,PayPal 用智能代理防止洗錢行為。使用 IBM 技術的一家新加坡保險公司支持用戶自動進行索賠流程,而數據科學平台 Lumidatum 能提供實時建議來改進客戶支持系統。

一大批公司在使用機器學習來決定接受華爾街的哪一筆買賣,有越來越多的信用決策都在機器學習的幫助下做出。亞馬遜採用機器學習優化庫存並改善他們向用戶推送的產品推薦。Infinite Analytics 開發了一個機器學習系統,來預測用戶是否會點擊一個特定的廣告,改善全球消費品商品公司的在線廣告布局,另一個系統則是為了優化用戶在一個巴西網路零售商的搜索和發現過程。第一個系統將廣告投資回報率提高了三倍,第二個系統則增加了 1.25 億美元的年收入。

機器學習系統不僅在很多應用里代替著原始的演算法,而且在很多人類曾經表現最好的工作任務中更為出色。雖然這個系統還有待改進,它們在 ImageNet 資料庫的錯誤率(大約是 5%)已經達到或比人類水平的表現更好了。語音識別也是這樣,即使在嘈雜的環境下,現在也幾乎和人類水平持平。機器學習系統達到了這樣的門檻,進而為改變工作場所和經濟開闢出了新的廣闊可能性。一旦以人工智慧為基礎的系統在某個領域超越了人類的表現,它們就更容易快速廣泛傳播。

舉個例子,比如 Aptonomy 和 Sanbot,它們分別是無人機和機器人製造者,它們正在使用改進過的視覺系統,使很多安保工作自動化。在很多同類公司中,軟體公司 Affectiva 正在使用機器學習在特定群體中識別快樂、驚訝和氣憤等情緒。Enlitic 則是一家使用機器學習掃描醫學圖像進而幫助診斷癌症的深度學習創業公司,而這樣的公司已經有好幾家了。

這些都是了不起的成就,但以人工智慧為基礎的系統,其適用性依然非常狹窄。舉個例子,機器學習在擁有數百萬圖片的 ImageNet 資料庫中的出色表現,並不意味著它總能「在野外環境中」取得一樣的成功,在野外環境中,光線條件、角度、圖片解析度以及情境都可能非常不同。更為根本地,我們可能會驚嘆於一個系統能理解中國話並把它翻譯成英文,但我們不能指望這個系統理解一個特定中文字的意義,更不用說在北京去哪裡吃飯好了。

如果一個人能出色地完成一項任務,那很自然也可以假設他有能力完成一些相關的工作。但是機器學習系統就是為了某些特定任務而訓練出來的,它一貫的知識並不會擴展延伸。一個典型的謬論就是認為計算機狹窄的理解力意味著它能擴展到更廣闊的理解力中,這可能是一個最大的混淆之源,更為誇張的宣稱就是認為人工智慧能夠自己取得進步。我們離具備在多領域中擁有通用智能的機器還非常遙遠。

理解機器學習

要理解機器學習,最重要的一點就是明白機器學習代表了一條創造軟體的完全不同的道路。舉個例子,機器是去學習一件事情,而不是為某一明確結果被明確編程成什麼樣子。在過去 50 年的絕大多數時間裡,信息技術領域的進步及其應用都聚焦於把某種已有的知識和程序編成指令,再把這些指令植入機器中。確實,「編程」這個詞總是意味著這樣一種艱苦的過程,即開發者把自己頭腦中的知識轉化成一種機器能理解和執行的格式。這種方法有一個根本上的弱點:我們現有的很多知識都是大家心照不宣的,也就是說我們無法完全解釋它們。對我們來說,寫下每一條指令讓另一個人明白如何騎自行車、如何識別出一個朋友的臉龐,這幾乎是不可能的。

上圖:這就是使用人工智慧的意義。結果是人又不是人,可識別但又不是你期望中的那樣,它們美麗嗎,可怕嗎,能讓人感到愉悅嗎?

換句話說,我們所知的比我們能表達的更多。機器學習正在克服這個困難。在第二次機器革命的這第二波浪潮中,人類製造的機器正在從實例中學習,並且使用結構清晰的反饋來解決自己的問題,比如面部識別。

機器學習的不同特色

人工智慧和機器學習有很多種特色,但近年來大多數成功的案例都集中在監督學習方面,也就是關於某特定問題,賦予機器大量正確的實例學習。這個過程幾乎總涉及從一組輸入 X,到一組輸出 Y 的映射。比如,輸入可能是一些各種動物的圖片,正確的輸出就是關於這些動物的標籤:貓、狗、馬等。輸入也可以是一段音頻的聲音波形,正確的輸出就是一些辭彙:是、否、你好、再見等。

成功的系統通常使用幾千個甚至幾百萬個實例的訓練數據集,每個實例都已經被標記出正確的答案,系統會再大體看一下新的實例,如果訓練順利,系統就會以高度的精確度來預測答案。

演算法的成功多半要依仗一種叫「深度學習」的方式,而深度學習利用的是神經網路。和早期機器學習演算法相比,深度學習演算法有一個重要的優點:深度學習能夠更好地使用大得多的資料庫。舊的系統會隨著訓練數據實例的增加而改進,但會到達一個點,在那個點之後再增加數據並不能帶來更好的預測。這個領域的領軍人之一吳恩達說:「深度神經網路就不會在這種方式下失效,更多的數據的確會帶來更好的預測。」一些非常大的系統是由 3600 萬或更多實例訓練出來的。當然,要使用極大的資料庫就需要更加強大的處理能力,這就是為什麼非常大的系統通常在超級計算機或專用計算機上運行。

如果你有很多有關行為的數據並試圖預測結果,這就是監督學習系統的潛在應用機會。亞馬遜的全球消費者部門的 CEO 傑夫·威爾克(Jeff Wilke)說:「監督學習系統已經在很大程度上取代了用於向客戶提供個性化建議的基於內存的過濾演算法。」摩根大通則引入了一個系統來檢查商業貸款合同,這項工作以前需要負責貸款的員工用 360000 個小時來完成,而現在只需要幾秒鐘了。監督學習系統還被用於診斷皮膚癌。上面所說的只是部分例子而已。

相對來說,標記一組數據並把它用於訓練監督學習系統是比較簡單直接的。這也是為什麼監督學習式機器學習系統比無監督學習系統更為常見,至少目前是如此。無監督學習系統想要自己學習。我們人類就是出色的無監督學習者,我們用很少的沒有標籤的數據就能從這個世界上獲取大部分知識,比如識別出一棵樹,但是開發出一個如此運行的成功的機器學習系統就極端困難。

如果我們能建立強大的無監督學習系統,就將開啟令人振奮的新的可能性。這些機器將能夠用全新的方法審視複雜的問題,幫我們找出其中的模式,可用於觀察疾病傳播、市場證券價格走勢、客戶的購買行為等等。正是這種可能性引領著 Facebook 的 AI 研究主管、紐約大學教授 Yann LeCun,他把監督學習系統比作在蛋糕上撒糖霜,而把無監督學習比作蛋糕本身。

在這個領域裡,另一個渺小但是在成長中的領域就是強化學習。它已經被嵌入了雅達利電子遊戲和圍棋這樣的棋盤遊戲中。它還能幫助優化數據中心的電力使用,甚至為股票制定交易策略。Kindred 公司製造的機器人能用機器學習來辨識和歸類它們從沒遇到過的物體,還能加快消費品配送中心的運送速度。在強化學習系統中,編程人員會具體說明系統的現狀和目標,列出可被允許的行為,描述會影響和限制行為結果的環境因素。在可被允許的行為下,系統要找出儘可能接近目標的方法。人類可以具體說明目標而不需要說明如何做到,在這種情況下系統運行得最好。

比如,微軟利用強化學習來為 MSN 網站的新聞報道選標題,方法就是在點開鏈接的用戶更多的時候,給系統打更高的分數作為獎勵。系統會嘗試著在編程人員給定規則的基礎上最大化它的分數。當然,這就意味著強化學習系統會針對你明確獎勵的目標進行自身優化,而不一定針對你真正關心的目標來優化,因此,準確而清晰地指定目標至關重要。

上圖:今天的人工智慧應用都是由人類來驅動的,醫生嘗試著去解決一個癌症患者的病痛,家庭廚師在尋找新的菜譜,通勤上班族決定著如何開車出門。

把機器學習帶入工作中

對那些期望把機器學習付諸實踐的組織來說,現在有三個好消息。第一,人工智慧在廣泛地傳播。這個世界上還遠沒有足夠的數據科學家和機器學習專家,但在線教育資源和大學院校正在努力迎合這種需求。其中最好的資源包括 Udacity、Coursera 和 fast.ai,他們不僅教授概念性的東西,而且能真正讓學生們去實現工業級別的機器學習部署。除了培養自己的員工之外,感興趣的公司還可以利用 Upwork、Topcoder 和 Kaggle 這樣的在線人才平台尋找具備專業知識的機器學習專家。

第二,對現代人工智慧來說十分必要的演算法和硬體已經可以被買到或租賃到。Google、亞馬遜、微軟和 Salesforce 等公司都在建構強大的機器學習基礎設施,並且都可以通過雲系統得到。在這些競爭對手之間存在激烈的競爭,這就意味著,隨著時間推移,那些想要嘗試和部署機器學習的公司將看到越來越多可獲得的平價功能。

第三,也許你並不需要那麼大量的數據才能開始利用機器學習。大多數機器學習系統的表現都會隨著它們得到更多數據而提升,所以,似乎擁有最多數據的公司將會取得勝利。在這種情況下,「勝利」意味著「控制某一單一應用,比如廣告定位或者語音識別的全球市場」。但如果勝利的定義被轉變為「顯著提高性能」,那麼其實充足的數據是非常容易獲得的。

機器學習正在三個層面推動變革:任務和職業、商業進程、商業模式。用機器視覺系統識別出潛在的癌細胞就是第一個層面變革的極好例證,它把放射學家解放出來,讓他們能夠專註於真正重要的事情,能夠更好地和病人溝通,和其他醫生協作。對商業進程的變革也有一個例子,就是亞馬遜引入了機器人,並使用以機器學習為基礎的優化演算法,重新發明了工作流程,重新布局了亞馬遜的各個履職中心。同樣地,商業模式也需要利用機器學習系統來重新思考,這些系統可以智能地定製化地推薦音樂、電影等。更好的模式不是以消費者選擇為基礎銷售單曲,而是提供一種預訂和播放特定用戶可能會喜歡的音樂這樣一種個性化訂閱服務,即使這個用戶可能根本沒聽說這些音樂。

風險和極限

第二次機器革命的第二波浪潮也帶來了新的風險。尤其是,機器學習系統是「難以解釋的」,也就是說我們人類很難理解系統是如何作出決定的。深度神經網路可能擁有數億個連接,每一個連接都為最終的決策貢獻了一點力量。結果就是這些系統的預測是無法簡單明晰地被解釋出來的,機器知道的比它們能告訴我們的更多。

這就帶來了三個方面的風險。第一,機器可能會有隱藏的偏見,這些偏見不是來自機器設計者的意圖,而是來自訓練它們的數據。比如,如果一個系統利用人類資料庫的決策學習可以接受面試中的哪些工作申請,它可能會不經意間評估應聘者的種族、性別、民族等。更進一步,它們的偏見可能不會表現成明確的規則,而是嵌入在上千種考慮因素的細微互動之中。

第二,與建立在明確邏輯規則上的傳統系統不同,神經網路系統處理的是數據事實,而不是絕對的事實。可能很難證明這個系統是完全確定可以在任何情況下正常工作,尤其是在訓練數據時沒有涉及到的情況下。缺乏確定性可能是在處理關鍵任務時的一個問題,比如控制核電廠,或者涉及生死攸關的決定。

第三,當機器學習系統犯錯的時候(犯錯幾乎不可避免),診斷和糾正錯誤都極端困難。得出解決方案的基礎結構可能是我們難以想像地複雜的,如果系統的訓練條件改變了,得出的解決方案可能遠非最優。

這些風險都非常真實,合適的基準不是追求完美,而是追求最優的可選項。畢竟我們人類也會有偏見、犯錯誤,還覺得誠實解釋我們做出決定的過程很困難。以機器為基礎的系統,其優點在於它可以隨著時間推移而改進,而且你給它什麼樣的數據它都會得出一致的回答。

這是否意味著人工智慧和機器學習能做的事情就沒有極限呢?感知和認知覆蓋了絕大部分的領域,從開汽車到預測銷售,甚至還能決定僱傭什麼人、提拔什麼人。我們相信,在絕大多數領域,人工智慧很快就會超越人類水平的表現。那麼,人工智慧和機器學習不能做什麼呢?

我們有時會聽到這樣的說法:人工智慧永遠無法估計評估我們這些情緒化的、靈巧的、狡猾的人類,它太呆板太非人化了。我們不同意這樣的說法。在通過聲音語氣、面部表情來識別一個人的情緒狀態方面,機器學習系統已經處於或者已經超越了人類水平的表現。有些系統甚至能識別世界最頂級的撲克選手是否在虛張聲勢。這是一個非常精細的工作,但它不是魔法。它需要知覺和認知,這正是機器學習現在正變得越來越強大的地方。

討論人工智慧的極限,最好從畢加索開始,畢加索通過對計算機的觀察得出結論:「它們沒有用,它們只能給你答案罷了。」事實上,計算機當然不是沒有用,但是畢加索的觀察依然提供了某些洞見。計算機是用來回答問題的設備,而不是提出問題的設備。那就意味著,企業家、創新者、科學家、創造者和其他那些尋找下一個問題與機會的人,那些探索新領域的人,他們依然至關重要。

我們認為,在這個超級強大的機器學習時代,對人類智慧來說,最大最重要的機遇在於兩個領域的交叉:弄清楚下一步要解決什麼問題,說服很多人解決這個問題,一起去尋求解決方案。這也是對「領導力」的一種合適的定義,而領導力已經在第二機器時代變得越來越重要了。

我們認為,人工智慧,尤其是機器學習,這些是我們這個時代最重要的通用技術。這些創新對企業和經濟的影響不僅僅體現在它們的直接貢獻中,而且還體現在它們啟發互補創新的能力方面。通過更好的視覺系統、語音識別、智能解決問題系統,以及由機器學習所提供的很多其他功能,新的產品和流程正在成為現實。

雖然預測具體地哪個公司會在新環境中居於統治地位很難,但一個通用的原則很明晰,那就是:最為靈活的、有適應能力的公司和經營管理者會走向繁榮。能迅速感知到機遇,並對此有所反應的組織,終將會在人工智慧這片熱土上佔據優勢。所以成功的策略就是,樂於快速實驗並學習。如果管理者們沒有在機器學習領域開展實驗,那麼他們就沒有做好自己的工作。在未來的十年時間裡,人工智慧並不會取代管理者,但是,那些善用人工智慧的管理者將會取代那些沒有這樣做的人。

上圖:仔細凝視,你將會看到演算法中的人類;更仔細地凝視一會兒,你將會看到智能中的演算法。

作者簡介

埃里克·布萊恩約弗森(Erik Brynjolfsson)是麻省理工學院數字經濟先驅,斯隆管理學院的教授,數字商務中心主任。

安德魯·麥卡菲(Andrew McAfee)是麻省理工斯隆管理學院數字經濟中心的首席研究科學家和副主任。

二人合著有《第二次機器革命》(The Second Machine Age)。

https://hbr.org/cover-story/2017/07/the-business-of-artificial-intelligence

今日薦文

點擊展開全文

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 InfoQ 的精彩文章:

7位大咖關於軟體性能調優的那些事兒
Apache Kafka:大數據的實時處理時代
我們請來技術大咖講講雲原生:上雲只是開端,實現雲原生才是更重要棋局
大浪淘沙下的金融企業練就的十八般武藝

TAG:InfoQ |

您可能感興趣

俄羅斯真的會面臨解體嗎?如果面臨解體,這背後原因讓人沉思!
面臨實習的你,懂職場的潛規則嗎?
如果你面臨情感、婚姻、性心理的問題。
如果乾隆發動改革,會面臨哪些阻力?他會成功嗎?
特朗普真的面臨執政危機?本人毫不在意:若我被彈劾,人民會起義
為什麼美國會面臨這樣的難題,真正的原因讓人心酸不已!
塔羅牌心測:你們的感情會面臨怎麼樣的考驗?真的准
劉秀立下曠世奇功,卻面臨隨時被殺的危險,看他是怎樣智慧應對的
除非保護完好的森林,否則保護措施和應對氣候變化的鬥爭將面臨失敗
重蹈覆轍?文在寅正面臨被彈劾的程序,民眾:這是「壞人」的下場
特朗普面臨真正危機,競爭對手實力強勁,總統寶座恐不保
特朗普挑起貿易戰,但「受夠了」的美國人卻面臨真正的戰爭
上馬真的會面臨雨戰嗎?解答參賽者最關心的八個問題
棄文習武面臨難題,蔣百里和蔡鍔會有什麼解決辦法嗎?
塔羅占心:你們的異地戀面臨著什麼障礙?
特朗普面臨真正的危機,總統寶座恐怕不保,這個對手實力很強勁
精靈夢葉羅麗:所有謎團將解開,文茜將面臨怎樣的危險呢
實力強大的蘇聯,為何長期面臨著,糧食不夠吃的嚴重問題
電視情節都是騙人的?特種兵面臨絕境,如何解決食物問題
為什麼黑人要面臨嚴重的種族歧視?黑人的錯還是我們的錯?