從阿爾法狗到阿爾法元人工智慧動了誰的乳酪？

新聞 02-28

原標題：阿爾法元動了誰的乳酪

作者：蔣柯

2017年10月，《自然》（Nature）雜誌刊出了谷歌Deep Mind團隊的新成果。他們推出的新一代圍棋人工智慧程序阿爾法元（Alpha Go Zero）以100比0的絕對優勢戰勝上一代人工智慧圍棋程序阿爾法狗（Alpha Go）。關鍵是，阿爾法元是在沒有人類經驗指導的情況下，僅僅憑藉圍棋基本規則和自我學習而獲得了高超的圍棋技能。這一勝績再一次引起公眾的震驚和擔憂。人們擔憂的是，計算機可以不需要人類經驗作基礎，卻遠遠高於人類學習的水平。這似乎在說，人類的智力已經遠遠不敵計算機了。在計算機的智力飛速發展的情況下，人類的生存價值和活動空間不可避免地會被這種「更聰明」的人工智慧所侵佔。目前我們遭遇的事實真的是這樣的嗎？「阿爾法們」真的來搶人類的乳酪了嗎？

如何理解「阿爾法們」的勝利

從阿爾法狗到阿爾法元，計算機的圍棋技藝進步神速。但是，這兩代阿爾法的勝利究竟意味著什麼呢？

在新聞報道中，我們讀到這樣的敘述： Alpha Go Zero僅用一張神經網路、一台機器和4個TPU，經過自我對弈式的訓練，在3天的時間裡實現了近500萬局自我對弈，便能夠超越人類並打敗之前的Alpha Go版本。谷歌Deep Mind團隊總結道：Alpha Go Zero相比與Alpha Go 的更強大之處在於：「它再也不會受到人類經驗的限制，而是可以不斷向世界上最強的圍棋手——也就是它自己學習到非既定的能力。」

當Alpha Go戰勝人類棋手時，人們還可以這樣安慰自己：因為Alpha Go是學習了大量人類棋手的實際對弈棋局而獲得了下棋的技能，它戰勝了某一個棋手其實意味著人類的整體知識和智能的積累戰勝了一個個別的人。所以，對棋手個人而言，敗給Alpha Go可以說雖敗猶榮。但是這一次，Alpha Go Zero完全不從人類的經驗中學習，而是僅僅依靠最初的幾條圍棋基本規則，通過自我對弈的方式自我訓練，三天自我對弈500萬盤（這個數字與上一代Alpha Go學習了海量棋局，並且自我對弈3000萬盤，歷經數月訓練相比，可謂進步神速）就取得斐然的成就。這很容易讓人做出這樣的解釋，上一代的Alpha Go不敵新一代的Alpha Go Zero，是因為從人類智能中學習的Alpha Go敗給了師從純粹人工智慧的Alpha Go Zero，人類的知識或智能限制了Alpha Go的學習，而在拋棄了人類的經驗制約以後，計算機的智能可能遠遠把人類拋在後面。也就是說，這是人類智能對人工智慧的失敗。

面對這樣的擔憂，人類比以往更加需要確證自己的存在價值。這種確證開始於對「智能」的理解。於是，我們不禁要追問：人工智慧的「智能」的真正含義是什麼呢？

首先，人工智慧在根本上是「計算機」。因此，它們在計算任務上超過人類並不應是一件需要擔憂的事件，而應是值得高興的事件。正如人類製造了汽車——可以被稱為「移動機」。當汽車的移動速度遠遠超過人的極限時，並沒有人為此擔憂人類移動能力的價值受到了威脅。計算機最初被發明出來，是為了讓它幫人處理「按照既定規則進行計算」的任務。計算機在計算任務上超越人類，正像汽車的移動能力超越人類一樣，它們所體現出來的「優勢」不正是由人類智能所「創造」的嗎？

其次，對弈是人類發明的一種智力遊戲。這類遊戲的共同特徵是有明確的規則和清晰的邊界，並且對遊戲的最後成果有精確的衡量指標。對弈雙方必須在規則和邊界的限制下，通過合理性計算而實現「贏棋」的目標。這樣的活動是「結構良好任務」。針對結構良好任務，解決辦法是按照既有的規則「計算」儘可能多的中間狀態，並對每一種中間狀態的效價進行評估，並選擇最佳的路徑。對弈者能夠評估的中間狀態越多，贏棋的可能性就越大。但是這種評估顯然受到計算能力的限制。我們把計算過程中的中間狀態的總和稱為「問題空間」，那麼初始規則越少，問題空間就越大。在人類的棋類遊戲中，圍棋是初始規則最簡單、棋盤格子最多的一種，所以，圍棋對弈計算的問題空間非常巨大。在Alpha Go誕生之前，有很多人相信計算機的計算能力無法處理圍棋的問題空間。谷歌的研究團隊在計算方式上的革新讓計算機的計算能力有了長足的進步，所以才有了戰勝人類棋手的成績。但是我們也應該看到Alpha Go和新一代的Alpha Go Zero所處理的都是「結構良好問題」。解決結構良好問題的關鍵是計算能力，所以，兩代Alpha Go的成就其實是基於計算能力的提升。那麼，計算能力能不能等同於人類的「智能」呢？

通過「反轉圖靈測試」理解人的智慧價值

要比較人工智慧和人類的「智能」的異同或高下，我們需要對人類的「智能」做出界定。但是人的智能究竟意味著什麼，這個問題至今尚未有定論。在這裡，我們可以嘗試著通過「反轉圖靈測試」的思維實驗來釐清人類「心智」或「智能」的一些重要特徵。

「圖靈測試」是圖靈在提出人工智慧的基礎模型時為鑒定人工智慧的「智能」水平而設計的一種評價標準。如果一個計算機程序可以在限定的範圍內讓測試者不能分辨是計算機還是人類，那麼我們就可以說這個計算機程序具有了和人類一樣的「智能」。「圖靈測試」作為一個標準，一直在指引著人工智慧的設計理念，即努力讓計算機的表現更像人。可以看出，「圖靈測試」實際上基於一個潛在的預設，即人類的智能應該或可能是什麼樣的，並且以此指引著計算機朝著這個假設發展。但是，人的智能實際上具有什麼特徵，其實我們至今是不清楚的。於是，我們不妨把圖靈測試顛倒過來，讓人去模仿計算機，也就是以我們能夠清晰認識的東西作為參照，反過來觀照人類智能的意義。假如我們讓一個人去模擬一台計算機，那麼測試者將如何識別呢？這就是「反轉圖靈測試」。為了辨別對方是真實的人或是計算機，測試者只需要讓他（或它）在有限時間內完成大量的計算任務。這是計算機可以輕易完成而人絕對難以做到的。通過這個思維實驗，我們發現，人類和計算機的差異正是在於計算能力的差異。這樣看來，我們不難理解，弈棋任務作為結構良好問題，其核心在於對問題空間的計算，因此，在這類任務中人不敵計算機是理所當然的。關鍵是，人類以有限的計算能力卻能夠創造出如此豐富的知識和技能，這說明，計算能力並不是做出這些成績的唯一基礎；此外，除了不那麼強大的計算能力——和計算機相比，人類一定還擁有其他更強大的能力。

從知識論的角度看，人類的知識建構有兩條途徑，一種是自上而下的演繹，另一種是自下而上的歸納。演繹是依據既定的論證規則而實現知識的精緻化加工；歸納則是從經驗中形成一般化的認識。關於演繹，人類已經形成了相對完備的規則，即邏輯規則。正是在已有的形式化邏輯規則的指導下，計算機才可能完成各種「思維」活動。然而，關於歸納則始終沒有統一有效的「歸納邏輯」。計算機的「歸納學習」也是通過大量嘗試性練習而形成的一種概率評估，比如貝葉斯計算。我們知道，人和動物的天然傾向顯然不是通過概率計算來進行歸納推理的，也就是說，歸納不是一個計算過程。於是，我們可以將演繹和歸納分別對應於「可計算」的任務和「不可計算」的任務。

顯然，計算機被製造出來就是讓它幫助人類應對「可計算」任務。計算機科學家讓今天的計算機能夠出色地完成這一類任務，而這正是作為製造者的人類的「智能」的成就。計算機在「可計算」任務中的表現超越了人類，但是人類依然在「不可計算」任務中保持自己的優勢。哪些事情屬於「不可計算」任務呢？諸如：真正的創造性問題，結論超出了前提閾界的問題等。新聞報道說Alpha Go Zero僅僅依靠幾條圍棋的初始規則就「實現了從0到1的轉變」等。實際上，Alpha Go Zero所做的事情和歐幾里德從幾條公理出發，演繹出數百條幾何定律一樣，是通過演繹途徑對初始規則的分析，從而實現知識的精緻化演變。這樣的推衍固然顯示了演繹推理的創造力，而真正創造性地「從0到1」的轉變卻是「發明」圍棋的人提出圍棋初始規則的那一步。

假如，我們只是給計算機一把棋子，沒有任何規則，也沒有任何要求，那麼，它會計算出什麼樣的結果呢？它會不會突然停下正在執行的任務，「看著」這些棋子發獃，並開始在「地上」畫出一些格子，並想像出一些規則，然後開始「玩」一種叫做「棋」的遊戲呢？如果真的有一天計算機能夠自己「生成」一系列規則，發明了圍棋、象棋之類的遊戲，那才是人類應該擔憂的情況。

（作者單位：西南民族大學社會學與心理學學院）

來源：中國社會科學網-中國社會科學報

喜歡這篇文章嗎？立刻分享出去讓更多人知道吧！

本站內容充實豐富，博大精深，小編精選每日熱門資訊，隨時更新，點擊「搶先收到最新資訊」瀏覽吧！

請您繼續閱讀更多來自 中國社會科學網 的精彩文章:

※王廣祿：促進優秀傳統文化創造性轉化
※《系年》「周亡王九年」諸說綜析

TAG:中國社會科學網 |

從阿爾法狗到阿爾法元 人工智慧動了誰的乳酪？

從阿爾法狗到阿爾法元人工智慧動了誰的乳酪？