當前位置:
首頁 > 知識 > 乾貨 | 情感分析語料庫

乾貨 | 情感分析語料庫


微信公眾號


關鍵字全網搜索最新排名


【機器學習演算法】:排名第一


【機器學習】:排名第二


【Python】:排名第三


【演算法】:排名第四



1.

知網的情感詞典
- http://www.keenage.com/html/c_bulletin_2007.htm
由知網發布的詞典,包括中文情感詞典和英文情感詞典




2.

台灣大學的情感極性詞典
- http://www.datatang.com/data/11837
包括2810個正極性詞語和8276個負極性詞語,準確度很高


3.

酒店評論語料
- http://www.datatang.com/data/11936
一個較大規模的酒店評論語料。語料規模為10000篇。語料從攜程網上自動採集,並經過整理而成。




4.

豆瓣網影評情感測試語料
- http://www.datatang.com/data/13539
來自豆瓣網對電影《ICE AGE3》的評論,評分標準均按照5 stars評分在網頁中有標註。語料庫527頁。每頁20條短評。共計11323條評論




5.

酒店、電腦與書籍的評論語料
- http://www.datatang.com/data/11937
數據量不太大,也有一些重複的數據




6.

評論網頁數據集
- http://www.datatang.com/data/12044
數據量挺大,包括的電影和評論都不少




7.

康奈爾大學(Cornell)提供的

影評數據集

(http://www.cs.cornell.edu/people/pabo/movie-review-data/):由電影評論組成,其中持肯定和否定態度的各1,000 篇;另外還有標註了褒貶極性的句子各5,331 句,標註了主客觀標籤的句子各5,000 句.目前影評庫被廣泛應用於各種粒度的,如詞語、句子和篇章級情感分析研究中.




8.

GI(General Inquirer)

評價詞詞典

(英文,http://www.wjh.harvard.edu/~inquirer/).該詞典收集了1,914 個褒義詞和2,293 個貶義詞,並為每個詞語按照極性,強度,詞性等打上不同的標籤,便於情感分析任務中的靈活應用.

9.

主觀詞詞典

(英文,http://www.cs.pitt.edu/mpqa/).該詞典的主觀詞語來自OpinionFinder 系統,該詞典含有8,221 個主觀詞,並為每個詞語標註了詞性以及情感極性.




10.

HowNet 評價詞詞典

(簡體中文、英文,http://www.keenage.com/html/e_index.html).該詞典包含9,193 個中文評價詞語/短語, 9,142 個英文評價詞語/短語,並被分為褒貶兩類.其中,該詞典提供了評價短語,為情感分析提供了更豐富的情感資源.


招募 志願者


廣告、商業合作


請發郵件:357062955@qq.com


喜歡,別忘關注~


幫助你在AI領域更好的發展,期待與你相遇!

喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!

TAG: |

您可能感興趣

中文突發事件語料庫
女書語語料:義文玉傳授《盤古警》《古話語》
韓國主流媒體看待「一帶一路」倡議的語料分析
資源 | 囊括歐亞非大陸多種語言的25個平行語料庫數據集(拿走不謝!)
囊括歐亞非大陸多種語言的25個平行語料庫數據集
【雅思托福寫作語料庫】Uber停止測試自動駕駛
第六代微軟小冰升級,可自創回應不需從語料庫檢索而得
Google發布新的問答語料庫,專攻篇章級的NLU問題
谷歌發布問答系統新語料,同時發布相關挑戰賽
FAIR&NYU開發XNLI語料庫:15種語言
word2vec中文語料訓練
Trados的語料保護和保密