用python对市长信箱的回复选登进行分析,需要作词云图,选择wordcloud包来实现。
网上很多都介绍了生成中文词云需要指定中文字体的路径,但我在使用中还遇到了utf8编码与unicode编码的转换问题。即utf8编码的字符串需要先转换为unicode编码,然后再送入wordcloud的fit_words方法才能正确显示中文词云。
示例代码如下:
rec=records for i in range(0,len(records)): rec[i]=(unicode(records[i][0]),records[i][1]) tags=dict(rec) wordcloud=WordCloud(font_path="/Users/wangliangxu/Desktop/SimSun.ttf",width=1200,height=600,max_words=400).fit_words(tags)
发表回复