當前位置:
首頁 > 知識 > Yann LeCun推薦:新證據出現,喬姆斯基的普遍語法理論正被顛覆

Yann LeCun推薦:新證據出現,喬姆斯基的普遍語法理論正被顛覆

選自Scientific American


機器之心編譯


作者:Paul Ibbotson, Michael Tomasello

參與:Rick、吳攀、李亞洲


諾姆·喬姆斯基的許多語言學革命——包括對我們學習語言的方法的描述——正在被顛覆。近日,Yann LeCun 在他的 Facebook 和 Twitter 上推薦了 Scientifc American 的這篇文章,他表示這在喬姆斯基的普遍語法理論的棺木上又多釘了幾枚釘子。

Yann LeCun推薦:新證據出現,喬姆斯基的普遍語法理論正被顛覆


我們的大腦天生具有學習語法的心理模板——這個被 MIT 的諾姆·喬姆斯基所信奉的知名觀念——已經統治了語言學近半個世紀。儘管如此,由於新研究考察了許多不同的語言,最近認知科學家和語言學家們已經在成群結隊地拋棄喬姆斯基的「普遍語法(universal grammar)」理論,也就是年幼的孩子學習理解並說當地社會語言的方式。這項工作沒能支持喬姆斯基的主張。


這項研究提出了一個完全不同的觀點,它認為一個兒童學習第一門語言的過程並不依賴於一個固有的語法模塊。新的研究反而表明,年幼的孩子使用不同類型的思維方式,這個方式可能一點也不特定於語言——比如分類的能力(比如這是人還是物)以及了解事物之間關係的能力。這些能力,配合人類獨特的獲取其他人在交流中想要表達的含義的能力,就發生了語言。這項新的研究結果表明,如果研究人員真正想要了解孩子們和其他人如何學習語言,他們就需要走出喬姆斯基的理論。


這個結論是重要的,因為語言研究在不同學科中起著核心作用——從詩歌到人工智慧再到語言學本身;誤導的方法導致可疑的結果。此外,沒有動物能夠對應上人類使用語言的方式;如果你明白什麼是語言,你就對人的天性多了一分了解。


喬姆斯基的第一版理論是在 20 世紀中期提出的,它與西方知識分子的生活中出現的兩個新興趨勢相吻合。首先他指出,人們在日常生活中用來交流的語言,表現得就像是計算機科學領域中新興的基於數學的語言。他的研究探討了語言的基本計算結構,並提出了一套能創建出「構成良好(well-formed)」的句子的一系列流程。這個革命性的想法認為,一個類似計算機的程序可以產生出真實的人認為是符合語法規則的句子。據稱這個程序也可以解釋為人們造句的方式。這種討論語言的方法引起了許多學者的共鳴,他們熱衷於將一種計算方法信奉為一切。


隨著喬姆斯基發展他的計算理論,他同時提出這種理論植根於人類生物學。二十世紀後半葉,正變得越來越明顯的觀點是:我們獨特的進化史是造成我們獨特的人類心理狀態的許多方面的根源,因此喬姆斯基的理論也在該水平上與之共鳴。他的普遍語法是作為人類思維的先天成分被提出來——它允諾要揭示出世界 6000 多種人類語言的深層生物學基礎。最強大的、且不說最美的科學理論揭示出表面多樣性下隱藏著的統一性,那麼這一理論就會立即引起關注。

但是不支持喬姆斯基的理論的證據已經出現了,後者多年來一直在緩慢地走向死亡。它死得太慢了,因為正如物理學家馬克斯·普朗克曾指出的那樣,年長的學者傾向于堅持舊方法:「科學每進一步就有一個葬禮。」


起初


20 世紀 60 年代最早的普遍語法化身採用「標準常態歐洲語(standard average European)」語言的基本結構作為它們的出發點——大多數從事這方面研究的語言學家都說這種語言。因此普遍語法程序以語言塊的形式運行,比如名詞短語(「不錯的狗」)和動詞短語(「喜歡貓」)。


然而相當快地,開始出現波動的多語種語言比較並不適合這個整潔的模式。一些澳大利亞本土語言,如 Warlpiri,它有散落在句子中的語法元素——沒有被「打包整齊」因而不能夠插入到喬姆斯基的普遍語法中去的名詞和動詞短語——和一些完全沒有動詞短語的句子。


這些所謂的異常值難以與建立在歐洲語言實例上的普遍語法相調和。喬姆斯基理論的其他例外來自於對「主動格(ergative)」語言的研究,比如巴斯克語或烏爾都語,其句子主語被使用的方式非常不同於許多歐洲語言,這再次挑戰著普遍語法的理念。

Yann LeCun推薦:新證據出現,喬姆斯基的普遍語法理論正被顛覆



這些發現連同語言理論工作,導致喬姆斯基和他的追隨者在 20 世紀 80 年代期間大規模修改普遍語法的概念。該理論的新版本被稱為原則和參數(principles and parameters),由一組控制語言結構的「通用(universal)」原則取代了囊括所有世界語言的一種單一的普遍語法。


這些原則在每種語言中都有不同的表現。打個比喻:我們天生擁有一組與文化、歷史和地理相互作用著的基本味覺(甜、酸、苦、咸、鮮),從而在當今的世界美食中產生變化。這個原則和參數理論是語言學的一個味覺比喻。它們與文化(無論一個孩子是學習日語還是英語)相互作用從而語言學中產生了今天這些變化, 並定義了一套可能的人類語言。

比如西班牙語可以產生無需單獨主語的完全合乎語法的句子——例如 Tengo zapatos (「I have shoes」),其中有鞋子的這個人,「我」,並沒有由一個單獨的詞而是由動詞末尾的「o」來表示。喬姆斯基爭辯說,一旦孩子們遇到幾個這種類型的句子,他們的大腦會設置一個「打開」開關,表示該句子主語應該被丟棄。然後他們就會知道他們可以在所有句子中丟棄這個主語。


這個「主語-丟棄」參數一般也決定了該語言的其他結構特徵。這種普遍原則的概念相當適合許多歐洲語言。但是非歐洲區語言的數據表明,它們並不適合修訂版的喬姆斯基理論。事實上已­­有研究試圖去確定那些參數,比如主語–丟棄,這最終導致了對於普遍語法的第二化身的丟棄,因為它沒能經得起推敲。


最近,在一篇發表於 2002 年的《科學》雜誌上的著名論文中,喬姆斯基與其合著者描述了一個普遍語法,它只包含一個稱作計算遞歸(computational recursion)的特徵(儘管許多普遍語法的擁護者仍然寧願假定存在許多普遍性的原則和參數)。這個新轉變允許組合有限數量的單詞和規則,從而產生無限多個句子。


由於遞歸在另一個類型相同的短語中嵌入短語的方式,無盡的可能性是存在的。例如英語能夠將短語嵌入到右邊(「John hopes Mary knows Peter is lying」)或中間(「The dog that the cat that the boy saw chased barked」)。無限地嵌入這些短語在理論上是可能的。在實踐中,正如在這些例子所描述的,當這些短語被堆積在另一個短語上面時,理解就開始崩潰了。


喬姆斯基認為這種崩潰並不直接與語言本身有關。相反,它是人類記憶的一個局限性。


更重要的是,喬姆斯基提出這種遞歸能力使得語言獨立於其他類型思維,比如分類以及感知事物之間的關係。最近他還提出,這種能力是由發生於­十萬到五萬年前的一個單一的遺傳突變所引起。


之前,當語言學家真的去看了世界各地的語言變化時,他們發現了這一斷言的反例,即這種遞歸是語言的一個本質屬性。有些語言——例如亞馬遜人的 Pirah?——似乎不兼容喬姆斯基的遞歸。


和所有語言理論一樣,喬姆斯基的普遍語法試圖達到一個平衡。這個理論必須簡單得足夠值得擁有。也就是說,它必須預測一些不在理論本身之中的東西(否則它只是一列事實)。但理論並不會如此簡單,否則它就無法解釋其應該解釋的東西。以喬姆斯基的觀點,在世界上所有的語言中,句子都有一個「主語」。問題是一個主語的概念更像是特徵的一個「家族相似性(family resemblance)」而非一個整潔的類別。一個主語的特徵大約由 30 種不同的語法特徵所定義。任何一種語言將只有一個這些特徵的子集——而這個子集往往不與其他語言重疊。


喬姆斯基試圖定義語言的基本工具包組件——允許人類語言發生的某種心理機制。在那些反例被發現的地方,喬姆斯基的支持者就回應說那只是­­因為一種語言缺乏某種工具——例如遞歸——這並不意味著它不在工具包里。同樣地,只是因為某種文化的季節性食物中缺少鹽,並不意味著鹹味就不在它的基本口味條目里。不幸的是,這種推理使得喬姆斯基的建議難以在實踐中得到檢驗,而且在某些地方它們正瀕臨不可證偽的邊緣。


死亡喪鐘


喬姆斯基理論中的一個關鍵缺陷是當其被應用於語言學習時,它們規定年幼的兒童運用抽象語法規則造句的能力是與生俱來的。(精確的說法取決於的是哪個理論版本。)然而現在的大量研究表明,語言習得不是以這種方式發生的。相反年幼的孩子們是以學習簡單的語法模式作為開始;然後他們漸漸地覺察到其背後規則的點點滴滴。


因此年幼的孩子最初只說基於特定單詞模式的、具體而簡單的語法結構:「Where』s the X?」;「I wanna X」;「More X」;「It』s an X」「I』m X-ing it」;「Put X here」;「Mommy』s X-ing it」;「Let』s X it」;「Throw X」;「X gone」;「Mommy X」;「I Xed it」;「Sit on the X」;「Open X」;「X here」;「There』s an X」;「X broken.」後來孩子們把這些早期的模式結合進更複雜的模式中,比如「Where』s the X that Mommy Xed?」


普遍語法的許多支持者都接受這種兒童早期語法發展的特點。但接著他們認為當更複雜的結構出現時,這個新階段反映了一種使用普遍語法及其抽象語法類別和抽象語法原則的認知能力的成熟。


例如大多普遍語法方法都這假定說,一個兒童是通過遵循一組基於語法類別的規則來造問句,比如「What (賓語) did (助動詞)you (主語)lose (動詞)?」回答:「I(主語) lost(動詞)something (賓語).」如果這個假設正確,那麼在一個特定的發育期,兒童應該在所有 wh-似的問句中犯類似的錯誤。但兒童犯的錯誤並不符合這個預測。他們中的許多人在發育的早期都犯了下面這些錯誤,比如「Why he can』t come?」但同時當他們犯這個錯誤時——不能將「can』t」置於「he」之前——他們正確地使用「wh-疑問詞」和助動片語織了其他問句,比如這句「What does he want?」


實驗研究證實,兒童大都使用特殊 wh- 疑問詞和助動詞來造出正確的問句(通常是那些他們與之有大部分經驗的單詞,比如「What does ...」),在而含有其他(通常較少) wh- 疑問詞和助動詞結合的文具中繼續犯錯誤:「Why he can』t come?」


普遍語法學家對這樣的這種發現的主要反應是,兒童有語法能力而其他因素會阻礙他們的表現,因而它們隱藏了兒童們的語法的真實本質,也妨礙了他們對於「純粹」的喬姆斯基語言學所假定的語法的學習。掩蓋基本語法的那些因素,他們說,包括不成熟的記憶、注意力和社交能力。


然而喬姆斯基對兒童行為的解釋不是唯一的可能。記憶、注意力和社交能力可能無法掩蓋語法的真實狀態;相反它們對於早期的語言建立很可能是不可或缺的。


例如最近一項由我們之中的某人(Ibbotson)所合著的研究表明,兒童造出正確的不規則過去時態動詞——比如「Every day I fly, yesterday I flew」(不是「flyed」)——與他們抑制一個與語法無關的誘人響應的能力相關。(例如在看一張太陽的圖片而要說出單詞「moon」。)不是記憶、心理類比、注意力以及有關社交場合的反應阻礙了兒童表達喬姆斯基語言學的純粹語法,那些智力可能解釋了語言發展的方式。


隨著跨語言學數據和工具包爭論的撤退,表現掩蓋了能力——這種思想也幾乎無法證偽了。在衰退中的、缺乏一個強有力的經驗基礎的科學範式中,它們撤退到這類斷言中去是常見的——例如思考一下弗洛伊德心理學和­­歷史學的馬克思主義解釋。


即使超越這些對於普遍語法的實證挑戰,從事兒童研究工作的心理語言學家很難在理論上構思這一過程,即兒童對所有語言在一開始都使用相同的代數語法規則,然後繼續找出一種特定語言——無論是英語還是斯瓦希里語——是如何與規則體系相連接的。


語言學家稱這個難題為連接(linking)問題,而在普遍語法的背景下去解決這個難題的一個不尋常的系統嘗試,是由哈佛大學的心理學家 Steven Pinker 為研究句子主語所做的。然而 Pinker 的思考卻並不符合兒童­­發展研究的數據,或者說並不適用於主語之外的其他語法類別。因此該連接問題——應當是將普遍語法應用到語言學習中去的中心問題——從未被解決,甚至從未被嚴肅對待過。


另一種觀點


所有這一切都不可避免地導致了認為普遍語法完全是錯誤的的觀點。當然,即使面對著有矛盾的證據,科學家也從不會放棄他們最喜歡的理論,直到有一種合理的替代理論出現。現在已經出現了這樣一種替代理論,它被稱為基於使用的語言學(usage-based linguistics)。這個有多種形式的理論提出語法結構並不是內生的。事實上,語法是歷史(塑造語言形式的過程一代接一代)和人類心理(讓一代人從一開始就學習的社會和認知能力集合)的產物。更重要的是,這個理論提出語言所使用的大腦系統可能並不是為此目的專門進化的,所以這不同於喬姆斯基的遞歸(recursion)的單基因突變的思想。


在這種新的基於使用的方法中(其中包括來自功能語言學、認知語言學和構式語法的思想),兒童並不是生而就具備普遍的、專門的學習語法的工具。相反他們繼承了瑞士軍刀式的在心智上全能的套件:一組通用目的的工具,包括歸類、讀取交流意圖和進行類比;使用這些工具,兒童可以從其周圍所聽到的語言中學習語法類別和規則。


比如說,說英語的兒童理解「The cat ate the rabbit」,而且通過類比,他們也能理解「The goat tickled the fairy」。他們通過聽一個又一個的樣本來進行歸納。在經過了足夠多的樣本後,他們可能就能猜出句子「The gazzer mibbed the toma」中誰對誰做了什麼,即便其中有的詞本質上是胡言亂語的。語法是他們所要理解的超越辭彙本身的東西,因為這些句子在詞的水平上的相似度很低。


語言中的含義通過詞本身的可能含義(比如「ate」這個詞所表示的意思)和這些詞所在的語法結構的含義之間的互動而湧現。比如說,儘管「sneeze」在詞典中是一個不及物動詞,只有單一的施動者(actor)(打噴嚏者),但如果有人強迫它成為一個雙及物結構(可以由直接賓語和間接賓語),那麼結果可能會是「She sneezed him the napkin」,其中「sneeze」是一種轉移的動作(也就是說,她使這個餐巾紙到他那裡去了)。這個句子表明語法結構對一個句子的含義的重要性和詞的重要性一樣。相比於喬姆斯基,他認為語言層面是完全不具備含義的。


這個瑞士軍刀式的概念也能夠解釋語言學習,而不需要像普遍語法理論一樣牽扯到兩個現象。一是用於組合符號的一系列代數規則——一種內置於大腦中所謂核心語言(core grammar)。第二是一個辭彙集(lexicon)——覆蓋了自然語言中所有需要被學習的習語和特殊用法的例外情況列表。這種雙路徑的方法的問題是一些語法結構是部分基於規則的且又有部分不基於規則——比如說:「Him a presidential candidate?!」,其中的主語「him」保留了直接賓語的形式,但其在句子中的元素並不處在合適的位置上。使用同樣的方法,一位英語母語者可以生成無限多個類似的句子:「Her go to ballet?!」或「That guy a doctor?!」所以問題就來了:這些話語是核心語言的一部分還是例外列表的一部分?如果他們不是核心語法的一部分,它們必須每次都要單獨學習。但如果兒童可以學習這些部分規則,部分例外的話語,那為什麼他們不能以同樣的方式學習語言中的其它部分呢?換句話說,他們究竟為什麼需要普遍語法?


事實上,普遍語法的思想與兒童通過社交學習語言和使用語言學社會隨時間所創造的句子構建(sentence construction)獲得實踐的證據是矛盾的。在一些案例中,在這些學習過程的確切發生方式上我們有很好的數據。比如說,在世界各地的語言中,定語從句是相當常見的,而且往往源自不同句子的嚙合。因此,如果有句子「My brother.... He lives over in Arkansas.... He likes to play piano.」因為各種各樣的認知過程機制——涉及到圖式化、習慣化、脫離語境和自動化(schematization, habituation, decontextualization and automatization)這些術語——這些短句可以融合成一個更為複雜的結構:「My brother, who lives over in Arkansas, likes to play the piano.」或者它們也可將「I pulled the door, and it shut」這樣的句子逐漸變成「I pulled the door shut.」


更重要的是,我們似乎有一種能夠解碼他人的交際意圖(說話人想說什麼)的種族天賦。比如說,我不需要說「She donated the library some books」,我可以說「She gave/bequeathed/sent/loaned/­sold the library some books」。最近的研究表明存在一些能讓兒童約束這些類型的不適當類比的機制。比如說,兒童不會做沒有意義的類比。所以他們往往不會說「She ate the library some books.」此外,如果兒童常常聽到「She donated some books to the library」,那麼這就會抑制他們說「She donated the library some books」的想法。對於那些他或她嘗試理解的人的交流意圖,這樣的約束機制會極大地限制他們會使用的可能類比。我們都會使用這種類型的意圖讀取,比如我們可以理解「你能為我開門嗎?」是請求幫助,而不是詢問對方是否具備開門的能力。


喬姆斯基允許在其關於語言工作方式的廣義理論中的這類的「語用學(pragmatics)」——我們如何在語境中使用語言。考慮到語言能有多模糊,他也不得不這樣做。但他似乎將語用看作是語法的主要工作的輔助。在某種程度上,來自基於用途的方法的貢獻已經將其它方向上的爭辯轉變成了在說話者需要轉向句法(syntax)規則前,語用對語言有多大作用。


基於用法的理論遠遠不能為語言的工作方式提供一個完整的解釋。對兒童從所聽到的口語句子和短語的有意義的歸納並不是兒童構建句子的方法的全部——而且有的歸納有意義但卻不符合語法(比如:He disappeared the rabbit)。在兒童所有的有意義然而卻不符合語法的歸納中,這種的似乎非常少。原因似乎是他們對他們所屬的語言社區所確認的規範非常敏感,他們知道只能以「這種方式」進行交流。不過他們取得了一個微妙的平衡,因為兒童在語法規則上既具有創造性(「I goed to the shops」),又具有構造性(conformative,「I went to the shops」)。基於使用的理論還有很多的工作要做,以解釋這些力量在童年的交互方式,以便能確切地解釋語言發展的路徑。


向前看


在喬姆斯基範式被提出來的時候,它是在當時流行的非正式方法上的一次徹底突破,它吸引了人們對足以支撐說話和理解語言的認知複雜性的關注。但喬姆斯基等人的理論在讓我們可以看見新事物的同時,也讓我們無法看到語言中的其它方面。在語言學極其相關領域,許多研究者原來越對完全形式化的語言不滿,比如普遍語法——更不要提該理論的實證經驗不足。此外,很多現代的研究者也並不滿足於完全的理論分析,現在已經有了大量語言學數據的語料——許多可以在網上獲取——這些可被用來對一項理論進行測試。


這個範式轉換肯定是不完整的,但對很多人來說,它就像是湧入語言學領域的一股新鮮空氣。通過研究世界上不同語言的細節,已經出現了一些激動人心的新發現:它們如何相似又如何不同、它們在歷史上出現了怎樣的變化,幼兒是如何獲得一種或多種語言的能力的。


普遍語法看起來已經陷入了最終的死胡同。在這個地方,對基於使用的語言學的研究可以為全世界 6000 多種語言的學習、使用和歷史發展的實證研究提供一個前進的途徑。

Yann LeCun推薦:新證據出現,喬姆斯基的普遍語法理論正被顛覆




請您繼續閱讀更多來自 哲學園 的精彩文章:

你真的知道怎樣利己嗎?
從私人語言論證到物理主義綱領:維特根斯坦與維也納學派
希特勒為何是尼採的腦殘粉?
羅素與尼采,兩種不一樣的哲學人生
錯誤的國家定位把民族推向災難

TAG:哲學園 |

您可能感興趣

新證據表明iPhone 8 Touch ID可能在這
新證據表明iPhone 8的Touch ID或移至電源鍵
更多 WannaCry與朝鮮黑客組織關聯的證據被發現
證據來了 蘋果正準備推出新Apple TV?
Waymo再交出新證據:Uber明知故犯
Angelababy又整容了?還被扒出了新證據!
Apple Watch 3支持LTE的新證據出現了
全屏iPhone有望?iPhone8模具及設計圖多項證據證明
Nature發表確鑿證據證明帕金森是免疫病
新證據顯示任天堂Switch將支持GameCube遊戲
研究人員發現更多 WannaCry與朝鮮黑客組織關聯的證據
大本Ben Affleck被爆疑似出軌證據 交了新女友也是不得安生
你信嗎?又有新證據顯示Intel CPU將會有AMD核心
谷歌Waymo指責Uber隱藏關鍵證據,曾抄襲激光雷達設計
Waymo指責Uber隱藏關鍵證據 曾抄襲激光雷達設計
CNN:FBI的證據表明特朗普助手與俄羅斯合作打擊希拉里
新證據表明新款 4K HDR Apple TV 即將到來?
面對Waymo在自動駕駛專利方面的控告,Uber有了新證據
又有新證據顯示Intel CPU將會有AMD核心,但是你信嗎?