摘要:庫常規方法方法描述例子向對象中加載文本將詞云輸出為圖像文件,或格式應用實例配置對象參數加載詞云文本輸出詞云文件分隔以空格分隔單詞統計單詞出現次數并過濾字體根據統計配置字號布局顏色環境尺寸配置對象參數參數參數描述例子指定詞云對象生成圖片的寬度
wordcloud庫常規方法
w = wordcloud.WordCloud()
方法 | 描述 | 例子 |
---|---|---|
w.generate(txt) | 向wordcloud對象w中加載文本txt | >>>w.generate("Python and WordCloud") |
w.to_file(filename) | 將詞云輸出為圖像文件,.png或.jpg格式 | >>>w.to_file("outfile.png") |
import wordcloud w = wordcloud.WordCloud() #配置對象參數 w.generate("wordcloud by Python") #加載詞云文本 w.to_file("pywordcloud.png") #輸出詞云文件
分隔: 以空格分隔單詞
統計: 單詞出現次數并過濾
字體: 根據統計配置字號
布局: 顏色環境尺寸
配置對象參數w = wordcloud.WordCloud(<參數>)
參數 | 描述 | 例子 |
---|---|---|
width | 指定詞云對象生成圖片的寬度,默認400像素 | >>>w=wordcloud.WordCloud(width=600) |
height | 指定詞云對象生成圖片的高度,默認200像素 | >>>w=wordcloud.WordCloud(height=400) |
min_font_size | 指定詞云中字體的最小字號,默認4號 | >>>w=wordcloud.WordCloud(min_font_size=10) |
max_font_size | 指定詞云中字體的最大字號,根據高度自動調節 | >>>w=wordcloud.WordCloud(max_font_size=20) |
font_step | 指定詞云中字體字號的步進間隔,默認為1 | >>>w=wordcloud.WordCloud(font_step=2) |
font_path | 指定文件字體的路徑,默認None | >>>w=wordcloud.WordCloud(font_path="msyh.ttc") |
max_words | 指定詞云顯示的最大單詞數量,默認200 | >>>w=wordcloud.WordCloud(font_step=2) |
stop_words | 指定詞云的排除詞列表,即不顯示的單詞列表 | >>>w=wordcloud.WordCloud(stop_words={"Python"}) |
mask | 指定詞云形狀,默認為長方形,需要應用imread()函數 |
>>>from scipy.misc import imread >>>mk=imread("pic.png") >>>w=wordcloud.WordCloud(mask=mk) |
background_color | 指定詞云圖片的背景顏色,默認為黑色 | >>>w=wordcloud.WordCloud(background_color="white") |
英文(以空格分隔單詞)
import wordcloud txt = "life is short, you need python" w = wordcloud.WordCloud(background_color = "white") w.generate(txt) w.to_file("pywcloud.png")
中文(中文需要先分詞并組成空格分隔字符串)
import jieba import wordcloud txt = "程序設計語言是計算機能夠理解和識別用戶操作意圖的一種交互體系,它按照特定規則組織計算機指令,使計算機能夠自動進行各種運算處理。 " w = wordcloud.WordCloud( width=1000, font_path="msyh.ttc",height=700) w.generate(" ".join(jieba.lcut(txt))) w.to_file("pywcloud.png")
文章版權歸作者所有,未經允許請勿轉載,若此文章存在違規行為,您可以聯系管理員刪除。
轉載請注明本文地址:http://m.specialneedsforspecialkids.com/yun/41724.html
摘要:用實現微信好友性別及位置信息統計這里使用的庫開發。使用圖靈機器人自動與指定好友聊天讓室友幫忙測試發現發送表情發送文字還能回應,但是發送圖片可能不會回復,猜應該是我們申請的圖靈機器人是最初級的沒有加圖片識別功能。 1.用 Python 實現微信好友性別及位置信息統計 這里使用的python3+wxpy庫+Anaconda(Spyder)開發。如果你想對wxpy有更深的了解請查看:wxpy...
摘要:前者對中文進行分詞后者圖形化展示詞語的出現頻率。眾所周知,中文系的語言處理恐怕是最難的自然語言處理的語種。研究中文自然語言處理將是一個長久而大的工程,對于分析數據我們不是要研究自然語言處理 接上篇,這一篇將從技術層面講講是如何實現的。閱讀本文您將會了解如何用python爬取微博的評論以及如何用python word_cloud庫進行數據可視化。 上一篇:程序員代碼下的許豪杰 準備工作 ...
摘要:前言今天教大家用模塊來生成詞云,我讀取了一篇小說并生成了詞云,先看一下效果圖效果圖一效果圖二根據效果圖分析的還是比較準確的,小說中的主人公就是程理,所以出現次數最多。 前言 今天教大家用wrodcloud模塊來生成詞云,我讀取了一篇小說并生成了詞云,先看一下效果圖: 效果圖一: showImg(https://segmentfault.com/img/remote/1460000015...
摘要:上面是生成詞云的方法封裝,還有一些其他方法根據詞頻生成詞云根據文本生成詞云根據詞頻生成詞云根據文本生成詞云將長文本分詞并去除屏蔽詞此處指英語,中文分詞還是需要自己用別的庫先行實現,使用上面的對現有輸出重新著色。 對于數據展示這一塊有時候會用到詞云,python中提供的wordcloud模塊可以很靈活的完成生成詞云除了使用python提供的wordcloud模塊以為還有在線的生成方式ht...
閱讀 1446·2021-11-11 16:54
閱讀 9418·2021-11-02 14:44
閱讀 2383·2021-10-22 09:53
閱讀 3269·2019-08-30 11:18
閱讀 1958·2019-08-29 13:29
閱讀 2014·2019-08-27 10:58
閱讀 1633·2019-08-26 11:38
閱讀 3526·2019-08-26 10:31