乾貨 | 情感分析語料庫
知識
07-05
微信公眾號
關鍵字全網搜索最新排名
【機器學習演算法】:排名第一
【機器學習】:排名第二
【Python】:排名第三
【演算法】:排名第四
1.
知網的情感詞典- http://www.keenage.com/html/c_bulletin_2007.htm
由知網發布的詞典,包括中文情感詞典和英文情感詞典
2.
台灣大學的情感極性詞典- http://www.datatang.com/data/11837
包括2810個正極性詞語和8276個負極性詞語,準確度很高
3.
酒店評論語料- http://www.datatang.com/data/11936
一個較大規模的酒店評論語料。語料規模為10000篇。語料從攜程網上自動採集,並經過整理而成。
4.
豆瓣網影評情感測試語料- http://www.datatang.com/data/13539
來自豆瓣網對電影《ICE AGE3》的評論,評分標準均按照5 stars評分在網頁中有標註。語料庫527頁。每頁20條短評。共計11323條評論
5.
酒店、電腦與書籍的評論語料- http://www.datatang.com/data/11937
數據量不太大,也有一些重複的數據
6.
評論網頁數據集
- http://www.datatang.com/data/12044
數據量挺大,包括的電影和評論都不少
7.
康奈爾大學(Cornell)提供的影評數據集
(http://www.cs.cornell.edu/people/pabo/movie-review-data/):由電影評論組成,其中持肯定和否定態度的各1,000 篇;另外還有標註了褒貶極性的句子各5,331 句,標註了主客觀標籤的句子各5,000 句.目前影評庫被廣泛應用於各種粒度的,如詞語、句子和篇章級情感分析研究中.8.
GI(General Inquirer)
評價詞詞典
(英文,http://www.wjh.harvard.edu/~inquirer/).該詞典收集了1,914 個褒義詞和2,293 個貶義詞,並為每個詞語按照極性,強度,詞性等打上不同的標籤,便於情感分析任務中的靈活應用.
9.
主觀詞詞典
(英文,http://www.cs.pitt.edu/mpqa/).該詞典的主觀詞語來自OpinionFinder 系統,該詞典含有8,221 個主觀詞,並為每個詞語標註了詞性以及情感極性.10.
HowNet 評價詞詞典
(簡體中文、英文,http://www.keenage.com/html/e_index.html).該詞典包含9,193 個中文評價詞語/短語, 9,142 個英文評價詞語/短語,並被分為褒貶兩類.其中,該詞典提供了評價短語,為情感分析提供了更豐富的情感資源.
招募 志願者
廣告、商業合作
請發郵件:357062955@qq.com
喜歡,別忘關注~
幫助你在AI領域更好的發展,期待與你相遇!
您可能感興趣
※中文突發事件語料庫
※女書語語料:義文玉傳授《盤古警》《古話語》
※韓國主流媒體看待「一帶一路」倡議的語料分析
※資源 | 囊括歐亞非大陸多種語言的25個平行語料庫數據集(拿走不謝!)
※囊括歐亞非大陸多種語言的25個平行語料庫數據集
※【雅思托福寫作語料庫】Uber停止測試自動駕駛
※第六代微軟小冰升級,可自創回應不需從語料庫檢索而得
※Google發布新的問答語料庫,專攻篇章級的NLU問題
※谷歌發布問答系統新語料,同時發布相關挑戰賽
※FAIR&NYU開發XNLI語料庫:15種語言
※word2vec中文語料訓練
※Trados的語料保護和保密