當前位置:
首頁 > 最新 > 「兒童/節約」 還是 「兒童節/約」

「兒童/節約」 還是 「兒童節/約」

「兒童/節約」 還是 「兒童節/約」 CorpusTalk分享

雷 蕾博士,教授 (華中科技大學)CorpusTalk 講述語言學和語料庫的故事堅持原創 不定期更新歡迎轉載 請留言告知

「兒童/節約」 還是 「兒童節/約」 CorpusTalk分享

昨天發布了明年兒童節期間在華科舉辦的語料庫語言學大會徵文啟事。

為方便記憶,啟事取名」2018兒童節約在華科」。

於是引來數位老師吐槽:」兒童/節約/在/華科」 是啥子嘛?

漢文與西方語言的一大不同是,其書寫系統的詞或字之間沒有空格。也就是說,漢文書寫系統沒有用空格來表示詞或字的邊界。

這樣帶來的問題是,人們在理解句子時,由於分詞不同,對句子的理解大相徑庭,或造成歧義。

上面的」兒童/節約」 還是 「兒童節/約」 就是典型的例子。

另一個很好玩兒的例子是 「武漢市長江大橋」 。

到底是 「武漢市/長江大橋」 還是 「武漢/市長/江大橋」?

(話說武漢人不會說」武漢市/長江大橋」,多數情況下會說 「長江大橋」 或 「一橋」 「二橋」 ^_^)

「語料庫語言學探索」 微信群的 @張繼東 教授還提供了一個更好玩兒的例子:

「結婚的和尚未結婚的確是個現實問題。」

—— 怎麼分詞?

@張繼東 教授提供的機器分詞的結果是:

"結婚的 和尚 未 結婚 的確 是 個 問題" !

最後,推薦幾款常見好用的漢語分詞系統:

中科院分詞系統ICTCLAS (C++, http://ictclas.nlpir.org/nlpir/)

Stanford 漢語分詞系統 (Java, https://nlp.stanford.edu/software/segmenter.shtmls)

結巴漢語分詞 (Python, https://github.com/fxsjy/jieba,開源)

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 CorpusTalk 的精彩文章:

TAG:CorpusTalk |

您可能感興趣

「節約一粒米,節約一度電,節約一滴水」
盤點娛樂圈節約成慣的明星 最節約的竟是她
搞笑漫畫:節約的她
消費有的時候比節約重要?
如今,還需要培養孩子的勤儉節約嗎?
七夕節約會,男人必須注意女人這幾個細節,這是她在期待你的愛!
漢文帝劉恆節約到哪種程度?為何如此節約?
為節約打車費 男子將3歲女兒綁在背上駕摩托上幼兒園
節約用錢的「四大天敵」
這些星男春節約個啪都捨不得花錢!
袁姍姍好節約,穿2千7小香風套裝上節目減齡又高級,這錢花的值
勤儉節約是美德,可這4個星座女節約過度了,讓人嗤之以鼻
雨季游泰國的正確玩法:不僅節約一半錢,而且過節活動多多!
汪小菲有多節約?兩條褲子穿了整整一季!
節約時間的帶娃好物
父母再節約,這3樣東西必須給孩子!
七夕節約會,男人要注意女人的這3個細節,這是她在期待你的擁抱
日本龜縮在地堡里,美俄的做法,一節約一浪費!但節約的更狠!
古力娜扎錄節目好節約,穿190T恤,配弔帶皮裙和丸子頭太可愛
男人沒本事,你憑什麼責怪妻子太節約