當前位置:
首頁 > 教育 > 什麼是世界上最怪異的語言?

什麼是世界上最怪異的語言?

縱觀全球,糾出「語言異類」

語言結構世界地圖(World Atlas of Language Structures,下稱 WALS)根據一大堆各種語言特徵,評估 2676 種不同的語言。這些語言特徵包括詞序、聲音種類、否定方式,以及許多其他方面——共計 192 種不同的語言特徵。

因此,與其採用一個以英語為中心的世界觀,WALS 毋寧允許我們換用一個世界性的世界觀。也就是說,我們評估每一門語言,根據的都是其每種語言特徵的不尋常度。例如,英語的詞序是「主語—動詞—賓語」, WALS 對 1377 種語言的詞序進行編碼,其中 35.5% 具有「主動賓」詞序。

什麼是世界上最怪異的語言?

同時,只有 8.7% 的語言以動詞作為起始,比如威爾士語、夏威夷語和馬揚語(Majang)。因此,從跨語言學角度講,以動詞作為起始,就是不尋常。另外順帶一提,實際上全世界語言有 41.0% 是「主賓動」順序。(題外話:從事了一些夏威夷語和馬揚語的相關工作後,動詞對我而言,簡直就變成如結婚般重大的承諾:每每開口,我卻總是還沒有做好準備。)

WALS 的數據相當稀疏,所以我們把研究限定於 165 種語言特徵,這些特徵至少要包含 100 種不同語言的數據。(現階段,就這 165 種語言特徵而言,數據不足其中 10 種的語言,我們也剔除掉了。因此共計還剩 1693 種語言。)

現在,有個問題就是,如果我們的篩選到此為止,那麼數據共線性太高。之所以如此,部分是因 WALS 中列舉的語言特徵本質而決定——有整體考量「主語/動詞/賓語」順序的特徵項,另又有分別考量「賓語/動詞」和「主語/動詞」的項。理想情況下,我們希望基於不相關的特徵評斷怪異度。我們可以集中關注互相之間沒有很強相關度的語言特徵(在兩種互相關聯的特徵中,我們選擇有更多語言編碼的特徵)。最終我們篩得總計 21 種語言特徵。

什麼是世界上最怪異的語言?

至於某種語言的每項數據值,我們考量其他所有具備該項編碼的語言,計算該項值的相對頻度。因此,如果我們把「主語—賓語—動詞」詞序也算進來的話,那麼英語得到的怪異度值就會是 0.355(實際上,我們根據每項語言特徵的整體熵值對所有數據值統一化處理,所以這個值本身並不正好就是 0.355,但你懂這意思就行了)。

因此,得到的「怪異度指數」(Weirdness Index),就是一項交叉考量 21 種獨特結構特徵的平均值。但是,因為不同的特徵採集數值的數量不同,我們為了減少統計偏斜,實際上取了調和平均值(又因為我們希望「數字越大=越怪異」,所以終值是用 1 減去這個平均值)。本篇博文我彙報所涉及的語言,就這 21 項語言特徵而言,至少三分之二(即 14 項)具有數據值(即 239 種語言)。

答案揭曉:全世界最怪異的語言是——

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!

TAG: |