用Python做簡易詞雲
最近突發奇想,想做個詞雲玩玩,這算是Python的一個很初級的應用,雖然很初級,依然免不了會出現各種bug~
使用工具:
Anaconda:一個開源的用於Python科學計算的發行版本
jieba:一個Python第三方庫,用於中文分詞。
wordcloud:一個Python的第三方庫,用於生成詞雲。
一份中文字體文件:simsun.ttf
若干咪蒙文章資源:作為語料數據。
一張白底圖片:作為詞雲的蒙版。
實驗效果:
我用我的微信頭像當做蒙版:
然後生成的詞雲長這個樣子:
安裝實驗環境:
安裝Anaconda
下載地址:https://www.anaconda.com/download/
安裝jieba、wordcloud
下載地址 :https://www.lfd.uci.edu/~gohlke/pythonlibs/
中文字體文件simsun.ttf和萬篇咪蒙文章資源我放在了雲盤裡,需要的話,這裡鏈接:https://pan.baidu.com/s/1ZgOsdD5DPGYDUFUAd3Vzzw密碼:w94g
提示:需要將simsun.ttf文件和文章資源放在同一文件目錄里,而且文章資源(數據源)應為UTF-8編碼格式。並在此文件目錄通過Anaconda Prompt打開jupyter notebook。關於Anaonda的安裝和使用,參考這篇文章:https://www.jianshu.com/p/772740d57576
完整代碼:
代碼的細節在注釋里都有詳細的說明。
當然,同樣的數據源,還可以做成很多樣式的詞雲,比如下面這個:
還有這樣的:
總結:任何一件簡單的事,不自己親自去做一遍,永遠不知道會遇到多少bug。
參考資料:
https://github.com/amueller/word_cloud
https://www.jianshu.com/p/721190534061
END
![](https://pic.pimg.tw/zzuyanan/1488615166-1259157397.png)
![](https://pic.pimg.tw/zzuyanan/1482887990-2595557020.jpg)
TAG:Python |