當前位置:
首頁 > 最新 > 語言學告訴你18歲和30歲到底有什麼區別?

語言學告訴你18歲和30歲到底有什麼區別?

我所說的一切都可能是錯的!

即使你贊同我的觀點,你的生活也不會因此有任何改變!

除非——你採取了相應的行動。

(這是書先生的第106篇原創文章。本文約4300字,請花7分鐘來閱讀。)

引子

昨天我的朋友圈被刷屏,幾乎所有人都在曬自己的18歲。反正這個娛樂至上的年代,每過一段時間就會颳起一股莫名其妙的潮流,然後退潮和速度和漲潮一樣快。當潮流還在的時候,人們盡情在裡面遊樂,借勢表達各種情緒:懷舊的、炫耀的、後悔的、哀嘆的,輪番上陣。匯成一句話:一切都變了,只是變好變壞不甚明了,但回不去是真的。

變了?什麼變了呢?Papi醬拍了個短視頻,說了一堆變化。是真實的嗎?或許吧!反正沒能說服我,因為我有反例——Papi醬說的沒有一條符合路夫人。按照波普爾的證偽理論,一個反例足以推翻一個理論。(順便說一下,波普爾是我的男神,我這幾年就靠他活了。)

那從18歲到30歲到底有變化嗎?如果有,是什麼變了呢?作為語言學玩兒家,我始終認為沒有什麼比語言數據更能說明問題的了,因為我們對世界的幾乎所有認知都記錄在語言裡面。只要我們找到合適的方法,我們就能從語言數據里看出很多有趣的東西。

我甚至認為,只要語言數據足夠多,我們能從中看出整個世界。如果你認為這種說法有點誇張,請原諒一個語言學愛好者對專業的狂熱。不過,想必哈佛大學的讓-巴蒂斯特·米歇爾(Jean-Baptiste Michel)與埃雷茲·利柏曼·埃登(Erez Lieberman Aiden)會同意我的看法,因為這兩位在《自然》上發表了一篇文章《通過海量電子化書籍對文化進行量化分析》(Quantitative Analysis of Culture Using Millions of Digitized Books)來闡述語言數據在文化分析方面的影響。

他們還創造了一個新名詞:文化組學(culturomics)。顯然,這個詞是「文化」(culture)加上「組學」(omics)構成的,有點模仿人類基因組學的意思。這哥倆兒還參與了Google實驗室的Google Ngram Viewer項目。這個項目通過n元語法(n-gram)分析Google圖書中的數據,以展示語言中的文化模式隨時間的變化。

他們的很多研究成果都寫在一本科普暢銷書裡面,這本書叫《可視化未來:數據透視下的人文大趨勢》,非常值得一讀,強烈推薦。

朋友圈撲面而來的「青春氣息」已經勾起了我的慾望——不要亂想——是用語言數據探個究竟的慾望。我決定做個簡單的語料庫研究,看一下從18歲到30歲,到底什麼在發生變化。

研究方法


我的研究工具(數據)就是「美國當代英語語料庫」(COCA)。選擇它的原因很簡單:夠大——5億詞,夠長——跨度27年,夠廣——5種不同文體。(前面兩個因素看起來有點猥瑣了,還好最後一個力挽狂瀾,不然好好一篇科普硬是寫成了小黃文。)

我準備了幾個關鍵詞:18-year-old,30-year-old, young man,young woman,middle-aged man,和middle-aged woman。然後搜索和他們搭配強度高的形容詞和動詞。形容詞可以告訴我們人們一般會從什麼角度去描述這些人,而動詞可以告訴我們這些人一般會做些什麼事兒。

這裡的搭配強度是由互信息值(MI)定義的,要求至少在3以上。因為僅僅是頻率不能說明問題,有些搭配頻率很高,只不過是因為其中一個單詞本身頻率很高,它和誰在一起的頻率都高,算不得數。比如a young man或者the young man的頻率肯定高,因為a和the的出現頻率很高。事實上,the是英語中使用頻率最高的單詞。

互信息值考察的是兩個單詞或片語的互選程度。這個概念可以解釋得很複雜,甚至會用到熵等信息學概念。但也可以解釋得很簡單。恰好我最擅長的事情就是把複雜的東西講得簡單易懂(學過我OP課程的人都可以證明這一點)。

簡單的說,一定範圍內,當一個詞和另一個詞在一起的概率遠大於它和其它詞在一起的概率,我們認為這兩個詞互信息值較高。就好比你辦公室一個男的經常對某個女同事噓寒問暖,但對其它女同事卻頗為冷淡,我們立馬判定這兩個人有姦情,至少這男的有想法。互信息值就是這個姦情的熱烈程度。但是如果這個男的對所有女同事都同樣的噓寒問暖,那麼這個男的我們稱為中央空調。

雖然頻率不能完全說明問題,太頻率過低是影響判斷的。比如這個男的一共只噓寒問暖過一次,那他和被他噓寒問暖的女性在這方面互信息值一定很高。但這說明不了什麼問題,因為沒有可比較的東西。所以,我在搜索時,設定頻數至少在10以上(這也是COCA網站的默認值)。當然,設得更高會更好,不過我擔心設得太高就沒有什麼結果了。

好了,我想我已經解釋得非常清楚了,下面可以做實驗了。

數據才是王道


不知道為什麼18歲成了一個特殊的年齡,或許是因為它是法律上青少年和成年人的分界線吧,又或許它是高中畢業的年齡吧——一個時代的結束或者開始總是有點特殊紀念價值的。不過我記得我小時候看的都是16歲的花季啊,按照這個定義,18歲花都謝了吧。

不過先別管花謝花開,先看下在美國,人們對18-year-old有什麼描述。

Surprisingly,和18-year-old搭配強度超過3的只有一個很奇怪的形容詞unarmed(沒帶武器的),MI值7.78。這是什麼鬼?難道美國人只關心18歲的人帶沒有帶武器?

點進去一看,悲劇啊!這些沒帶武器的18歲青年,大多是黑人,他們不是被殺了,就是被槍擊了。

再搜和18-year-old搭配的動詞,我的乖乖,在美國做一個18歲的小青年很不容易啊。

不是被捕(arrested),就是被槍擊(shot);不是被控告(charged),就是被弄死(killed)。美國對18歲的人真是不友好,怪不得Skid Row在18 and life里唱到Your crime is time(你的罪就是你的年齡)。你看,這就是能唱1000多首英文歌的好處,隨時都能用歌詞來舉例。哦,順便說一下,今天推送的背景音樂就是這首歌。

朋友圈的朋友們,看看你的青蔥歲月里,同齡美國人在經歷什麼。生在中國真是幸福!


我知道你們都想知道(有點拗口)美國人對30歲有什麼看法,美國30歲的人會做什麼。不好意思,讓你們失望了。在五億詞的語料庫里,沒有和30-year-old搭配強度很高的形容詞或動詞。這說明,在美國文化里,30歲不是什麼特殊的年齡。

我們會覺得30歲很特殊,可能是因為我們有30而立這種說法吧。但實際上這句2000年前的句子現在是否還適用,值得商榷。要知道,那時候人均壽命也就二三十歲,四十歲以上就是老叟了,70歲以上「古來稀」。而現在,中國的人均壽命是73,還用30而立似乎有點站不住腳。

所以,進入30歲的朋友,別矯情了,這就是普通一年,沒什麼值得大呼小叫的


我們已經知道18歲的少男少女在米國日子不好過,那青少年呢?出現在teenager前面與它搭配強度最高的詞如下:

數據表明,青少年在美國不是很受待見——說好的祖國的花朵呢?和那些18-year-olds一樣,我估計沒有攜帶武器的(unarmed)的青少年也沒有什麼好的結局。

青少年的身材更可能是瘦長的(gangly和lanky都是瘦長的意思),這很合理。

剩下的形容詞基本上沒有一個正面的:rebellious(反叛的),青春期嘛,很正常;troubled(煩惱的),成長的煩惱,也合理;shy(害羞的),美國的青少年很shy,有點刷新我的認知。我國的青少年都已經不shy了,你國的還shy,怎麼當人類燈塔;typical(典型的),一般我們說一個是典型的XXX,都是貶義;

awkward(尷尬的),嗯,青少年涉世未深,人情世故不熟,做起事來顯得awkward;pregnant(懷孕的),看來美國青少年早孕是個大問題啊;frightened(受驚嚇的),青少年真慘,一邊反叛一邊受驚嚇;normal(正常的),還好,有正常的青少年;

有black teenager,沒有white teenager,說明人們對黑人青少年更關心,但考慮到形容青少年的多是負面辭彙,這反映美國人對黑人青少年的負面評價更多;gay teenager也是差不多的情況,少數人群受到更多關注,但不見得是正面的;missing(失蹤),青少年容易失蹤;young,這不是廢話嗎,青少年當然young了;angry,看來青少年不但總是反叛,還總是怒氣沖沖。

綜上所述,在美國人眼中,青少年的性格是反叛的,害羞的,經常怒氣沖沖,總是麻煩不斷,做起事來笨手笨腳,還容易受驚嚇,容易懷孕,容易失蹤。不過貌似我國的青少年也好不到哪裡去。

下面我們來看一下,teenager會做些什麼事兒,或者什麼事兒更傾向於發生在他們身上。

唉,在美國做個青少年真是造孽啊!不是被診斷(diagnosed)出什麼病,就是被殺掉(killed)。我現在總算明白為什麼美國人少了——活過青春期簡直就是奇蹟啊。


如果熬過了青春期會發生什麼呢?

從與young man和young woman搭配的形容詞來看,美國人對年輕人比對青少年友好多了。外形上,雖然有鬍子(bearded),年輕男性是英俊的(handsome),好看的(good-looking),強壯的(muscular),高大的(tall),苗條的(slim),迷人的(charming);頭腦方面,年輕男性是聰明的(intelligent,bright),智慧的(brilliant),有才華的(talented),總之是卓絕的(remarkable);為人處事是禮貌的(polite),友善的(nice),有品的(fine);事業上充滿進取心(ambitious)。真是不吝嗇溢美之詞。當然也不乏麻煩纏身(troubled),怒氣沖沖的(angry)年輕男性;雖然年齡見長,但是害羞的(shy)的年輕男性也不少。

形容年輕女性的詞幾乎全是積極的:年輕女性是可愛的(lovely),迷人的(attractive)(這裡可以看出charming更多用於男性,而attractive更多用於女性),漂亮的(beautiful);身材是苗條的(slim),高大的(tall);頭腦是聰明的(bright);和年輕男性一樣,也有不少年輕女性麻煩纏身(troubled)。不知道為什麼黑頭髮的(dark-haired)年輕女性最受關注,我還以為會是金髮女郎呢。

看來,美國人只要熬過19歲(teenager是指13至19歲的人),前途就光明多了,雖然麻煩仍然不斷。

下面我們來看下年輕男性和女性傾向於做些什麼或者身上會發生些什麼。

年輕男性的確充滿活力,總是在接近(approach)什麼東西,我看了看,approach的對象主要是女性,這就很合理了。精力充沛的年輕男性更喜歡站著。

在習慣上年輕女性和男性差不多,喜歡站著;不同的是年輕女性也喜歡坐著,還喜歡走路。不過年輕女性比男性有一點要慘得多,那就是容易被謀殺(murdered)。

同樣是死,murdered比起killed多一種蓄意的意味。結合上面的數據來看,青少年更可能死於意外,而年輕女性更可能死於謀殺。這些語言數據其實是對我們很有用的參考。


這段時間,中年男性成了大眾調侃的對象,油膩突然成年中年男人的標準寫照。那麼美國人眼中的中年男性是什麼形象呢?搜索了一下,數據我都不想給你們看了,因為實在太寒磣。在COCA中,和中年男性強搭配的只有一個單詞balding(脫髮的)。看來,中年男人脫髮是個世界性難題。

中年女性其實更慘,出現頻率10次以上的形容詞沒有和middle-aged woman搭配強的。中年男性好歹還有個脫髮現象讓人關注,中年女性簡直就是隱性的。美國和中國一樣,中年女性受到的關注太少了。

無論是middle-aged man還是middle-aged women都沒有與之搭配強度高的動詞。這個群體看來不怎麼做什麼出格的事兒。被歲月磨平了鋒芒大概就是這種感覺吧。

結語

COCA的數據總結一下就是:在美國,青少年形象不是特別好,而且不是被抓就是被殺,要麼就染病,能活下來都不容易;不過熬過這段時間就好了,因為人們對年輕男性女性的評價都不錯,做的事情也正常;美國青少年更可能死於意外,而年輕女性更可能死於謀殺;中年人是最沒有個性的一個群體,除了男性脫髮比較明顯,既沒有特別的特徵也沒有特別的動作;從青少年到年輕人都是麻煩不斷的美國人,到了中年或許還是麻煩不斷,不過已經沒人關心了。

你問我為什麼不搜old man和old woman。本來也有這個打算的,但轉念一想,和old man,old woman相關的可能大多帶點蒼涼悲傷的味道。讓我們還是用調侃和幽默來面對新的一年吧,畢竟老年怎麼樣其實取決於現在做什麼。比如,研究表明,你多學一門語言,將會大大降低老年痴呆的幾率。

文章最後祝大家新年快樂!新的一年也不要忘了學英語哦!

想跟著能把語言學講成段子的書先生學英語嗎?歡迎你加入我們的微信免費答疑群,和超過500名英語愛好者共同進步。掃碼添加書先生小助為好友,備註「書路學園」,小助會拉你入群。

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 翻譯教學與研究 的精彩文章:

漢學||利瑪竇眼中的中國人:具有劣根性,向全世界進貢還自鳴得意

TAG:翻譯教學與研究 |