1. 制作原料:
主料:文本(QQ聊天記錄)
輔料:WordArt,jieba(python包)
- jieba 是進行中文分詞的一個十分實用的軟件包。項目在Github的地址為:https://github.com/fxsjy/jieba。我們知道,一個文本的含義需要詞語串聯(lián)得到,利用jieba我們可以將中文字符串進行有效的分割,得到組成文本的各個詞語。然后基于詞語制作我們的詞云圖。
安裝并使用 jieba 流程,具體參考前一篇博客
【傳送門】:http://www.lxweimin.com/p/dee4ff08df2a
- 使用:
pip install jieba
進行安裝; - 使用
jieba.cut()
進行分詞
import jieba
str_cut = jieba.cut(str)
2. 制作方法:
介紹制作詞云的兩種方法:
- 基于WordArt 進行繪制
- DIY編程實現(xiàn)
在< E01 >里面我們將先進行WordArt實現(xiàn)
WordArt
WordArt 是一款十分好用的在線制作詞云的軟件。但是,需要付費得到更高清的結果。對于我們普通用戶,在網(wǎng)站上申請自己的賬號,做幾張圖娛樂一下就行了。沒必要花很多錢去買會員。
下面是國外的網(wǎng)友的一些作品:
[1] https://wordart.com/qhlv4vxrevtz/rainbow-stitch
[2] https://wordart.com/sajylyvwjx6u/emojiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiiii
[3] https://wordart.com/s3zwaue4bw0s/mickey-mouse
想要制作自己的詞云圖,首先要準備好自己的文本材料(在這里,我以qq聊天記錄為例子進行演示):有關 qq聊天記錄的提取和分詞 請翻看前篇BLOG(傳送門)
注冊登錄賬戶,創(chuàng)建(CREATE NOW)自己的項目以后,WordA如圖選項欄分為:文本、形狀、字體、布局以及風格。
-
導入自己的文本。再導入文本之前需要進行分詞操作
文本導入.png -
導入合適的字體。這里需要注意的是WordArt本身沒有支持中文的字體。需要我們手動進行導入。可以網(wǎng)上下載一些字體。導入(.ttf)字體文件。然后選擇好形狀以及布局
選項面板 -
然后點擊“Visualize”按鈕。靜靜等待一會兒。就可以得到屬于自己的詞云圖啦~
Valentine 01
Valentine 02
valentine 03
是不是很棒呀~趕快行動起來吧!!!