當前位置:
首頁 > 最新 > 用Python做簡易詞雲

用Python做簡易詞雲

最近突發奇想,想做個詞雲玩玩,這算是Python的一個很初級的應用,雖然很初級,依然免不了會出現各種bug~

使用工具:

Anaconda:一個開源的用於Python科學計算的發行版本

jieba:一個Python第三方庫,用於中文分詞。

wordcloud:一個Python的第三方庫,用於生成詞雲。

一份中文字體文件:simsun.ttf

若干咪蒙文章資源:作為語料數據。

一張白底圖片:作為詞雲的蒙版。

實驗效果:

我用我的微信頭像當做蒙版:

然後生成的詞雲長這個樣子:

安裝實驗環境:

安裝Anaconda

下載地址:https://www.anaconda.com/download/

安裝jieba、wordcloud

下載地址 :https://www.lfd.uci.edu/~gohlke/pythonlibs/

中文字體文件simsun.ttf和萬篇咪蒙文章資源我放在了雲盤裡,需要的話,這裡鏈接:https://pan.baidu.com/s/1ZgOsdD5DPGYDUFUAd3Vzzw密碼:w94g

提示:需要將simsun.ttf文件和文章資源放在同一文件目錄里,而且文章資源(數據源)應為UTF-8編碼格式。並在此文件目錄通過Anaconda Prompt打開jupyter notebook。關於Anaonda的安裝和使用,參考這篇文章:https://www.jianshu.com/p/772740d57576

完整代碼:

代碼的細節在注釋里都有詳細的說明。

當然,同樣的數據源,還可以做成很多樣式的詞雲,比如下面這個:

還有這樣的:

總結:任何一件簡單的事,不自己親自去做一遍,永遠不知道會遇到多少bug。

參考資料:

https://github.com/amueller/word_cloud

https://www.jianshu.com/p/721190534061

END


喜歡這篇文章嗎?立刻分享出去讓更多人知道吧!

本站內容充實豐富,博大精深,小編精選每日熱門資訊,隨時更新,點擊「搶先收到最新資訊」瀏覽吧!


請您繼續閱讀更多來自 Python 的精彩文章:

處理異常—Python 基礎

TAG:Python |