自然語言的並列:preference semantics at its worst
NLU、NLP 多年來還有一個公認的難點,就是並列結構(conjoined structure)。並列在思維邏輯里沒有地位,它是語言表達的產物。並列是語言學中最不講道理的程咬金,它總是橫插一刀,而且任性,在任一層次。一切的 subcat arg structures 或 mod-head patterns 都必須為它讓道,否則就堵塞交通,讓 parsing 的路線斷鏈。然而,如果沒有並列,自然語言就會難以容忍地單調枯燥,盡失精簡。
舉個簡單例子:
這句話邏輯上展開以後怎麼樣呢?
頸椎間盤突出症的最常見和最典型表現是一側頸肩部及上肢的酸痛
==>
頸椎間盤突出症的最常見表現是一側頸肩部的酸痛
頸椎間盤突出症的最典型表現是一側頸肩部的酸痛
頸椎間盤突出症的最常見表現是上肢的酸痛
頸椎間盤突出症的最典型表現是上肢的酸痛這才牽涉兩個並列,一個句子出現五六個甚至上十個並列, 並不鮮見。
這才牽涉兩個並列,一個句子出現五六個甚至上十個並列, 並不鮮見。語言不是邏輯。沒有並列,語言面臨組合爆炸式啰嗦。很難想像,傳統的單層 parsing 系統,譬如教科書上經典的喬姆斯基式 CFG-based chart parsing,可以把各種並列處理妥帖。並列 can be so f* hierarchical, even for a very deep multilevel
Conjoinment can be so f* hierarchical, even for a very deep, multilevel parsing system: conjoin remains a challenge if not very carefully/skillfully handled by a very experienced linguist 』cause the boundaries are tough to identify and they just appear at any levels at will. The conjoined elements are semantically parallel but the parallelness, which ideally should be used as conditions to help identify the conjoined structure and its scope, is unfortunately in practice all relative and fuzzy, which can hardly be enforced. food can be conjoined with food, of course, but look at this:
我喜歡肥肉和哲學。
food and knowledge, totally different monsters of semantics, can also be conjoined, it is preference semantics at its worst.
OK, I am not going to elaborate solutions, which should be a long article by itself. This post serves as an introduction of this linguistic monster, to arouse the awareness of linguistic challenges in natural language parsing.


TAG:洗腳池 |
※為什麼成立中韓語言交流會?The Language Exchange of Dreamtalk in Shanghai
※Swift for TensorFlow 已在 GitHub 上開源,Tensor 成為 Swift 語言裡面的一等公民
※vscode寫c語言(windows)
※Semantic Experiences網站:用自然語言同AI交流
※大師語言 | John William Godward
※用R語言的Blogdown+Hugo+Netlify+Github建博客
※身體的語言 ya.tender
※Canonical宣布Kotlin編程語言Snap包格式上線
※首款基於Pascal腳本語言的全功能Web伺服器Moon Http Server即將上線
※Kotlin和Swift語言在Redmonk榜上排名大幅提升
※Firefox Reality VR瀏覽器支持7種新語言,書籤等
※對話 Salesforce 首席科學家 Richard Socher:選擇 ML 是出於對數學和語言的熱愛
※走向世界 Google Assistant新增30種語言
※Google Assistant大升級:新增多種語言
※身體的語言 ya.tender-1
※微軟推最新程序語言Bosque 以Functors取代Loop循環
※Stream:我們為何要從Python轉到Go語言?
※使用PaddleFluid和TensorFlow訓練RNN語言模型
※Facebook Libra的Move語言與其他語言有什麼不同?
※Google Assistant今年將提供30多種語言 覆蓋95%的Android手機