在python中,wordcloud和jieba等庫都可以分析中文文本解析詞頻,但對于缺乏代碼基礎的人員來說,在線詞云就成為了不可或缺的工具,例如在分析售后原因,分析社交媒體評論等方面。
詞云工具一般需要三個功能,分別是長文本的分詞,統計詞語詞頻以及將詞頻可視化,每個工具在這幾個方面各有所長,但目前我還沒有發現一款面面俱到的在線詞云工具。在優秀的詞云工具中,支持中文的可能又只有一部分,因此下面就來推薦幾個我用過后覺得不錯的中文詞云工具。
1?? 圖悅
一個近乎傻瓜式的詞云工具,功能也非常簡單,分詞功能較強,只需上傳原始文本,即可自動生成詞云,除了可以選擇圓形/方形和中國地圖的輪廓外,基本沒有可以調整的空間,但也可分為文字大小不同的權重圖和標出了文字出現頻率的詞頻圖。
2??Wordart
這是歷史很悠久的一個英文詞云網站,需要提前裝載中文字體庫才能顯示中文字庫,分詞功能不強,最好提前將單詞的詞頻統計出來再上傳。優點是本網站的自定義功能非常多,可供選擇的輪廓樣式也很多,還支持自己上傳圖形輪廓,但是下載svg格式需要付費。
3??微詞云
中文詞云工具,功能全面,但是分詞能力不強,因此最好自己整理好詞頻表再上傳,詞語,插圖,色彩調整自由度高,但是下載圖片需要付費。
4?? NiucoData·詞云小工具
這就是我最近發現的非常好用的詞云工具,雖然超過一定的文本量需要付費,但是處理速度極快。
較其他詞云工具的最大不同是,分詞能力極強,無需自己提前統計好單詞詞頻,只需要將長文本上傳,便可自動分詞生成詞云圖,詞語修改的自由度極高除此之外還附贈詞性分類占比統計以及各種詞性類別的單詞排序,方便各個維度的分析。
與其他的工具相比,雖然缺少圖形表現形式的多樣性,但是本詞云工具的優勢在于其分詞功能的強大性,可以將兩者結合各取所長。
以上就是我經常會使用的一些詞云工具總結,希望能夠對你有所啟發,或者在工作中能夠助你一臂之力。