2022-11-11
来源:华纳网
责任编辑:谷雨老师
人气:
核心提示:本课内容: 大家好,欢迎来到谷雨课堂 本节,我们换个话题, 今天我们实现一个数据分析领域常用的功能, 词频统计并画出词云图, 以上词云图的来源是《论语》中的文本节选 子曰:学而时习之,不亦说乎?有朋自远方来,不亦乐乎?人不知而不愠,不亦君子乎?
本课内容:
大家好,欢迎来到谷雨课堂
子曰:“学而时习之,不亦说乎?有朋自远方来,不亦乐乎?人不知而不愠,不亦君子乎?”
有子曰:“其为人也孝弟,而好犯上者,鲜矣;不好犯上而好作乱者,未之有也。君子务本,本立而道生。孝弟也者,其为仁之本与!”
子曰:“巧言令色,鲜矣仁!”
曾子曰:“吾日三省吾身:为人谋而不忠乎?与朋友交而不信乎?传不习乎?”
子曰:“道千乘之国,敬事而信,节用而爱人,使民以时。”
子曰:“弟子入则孝,出则弟,谨而信,泛爱众,而亲仁,行有余力,则以学文。”
子夏曰:“贤贤易色;事父母,能竭其力;事君,能致其身;与朋友交,言而有信。虽曰未学,吾必谓之学矣。”
子曰:“君子不重则不威,学则不固。主忠信,无友不如己者,过,则勿惮改。”
import jieba # 中文分词包
from wordcloud import WordCloud, STOPWORDS, ImageColorGenerator
from PIL import Image
import numpy as np
import matplotlib.pyplot as plt
from os import path
chtext = ''
with open(path.join(d, str(i)+'.txt'), encoding='utf8') as fin:
for line in fin.readlines():
line = line.strip('\n')
chtext += ' '.join(jieba.cut(line))
# 调用包PIL中的open方法,读取图片文件,通过numpy中的array方法生成数组
backgroud_Image = np.array(Image.open("bg.jpg"))
# 绘制词云图
wc = WordCloud(
background_color='white', # 设置背景颜色,与图片的背景色相关
mask=backgroud_Image, # 设置背景图片
font_path='simfang.ttf', # 显示中文,可以更换字体
max_words=200, # 设置最大显示的字数
max_font_size=150, # 设置字体最大值
random_state=1, # 设置有多少种随机生成状态,即有多少种配色方案
scale=1 # 设置生成的词云图的大小
)
# 传入需画词云图的文本
wc.generate(chtext)
image_colors = ImageColorGenerator(backgroud_Image)
plt.imshow(wc.recolor(color_func=image_colors))
# 隐藏图像坐标轴
plt.axis("off")
# 展示图片
plt.show()
# 按递增顺序保存生成
# 的词云图
wc.to_file('1.jpg')
完整的源代码可以登录【华纳网】下载。
https://www.worldwarner.com/
免责声明:本文仅代表作者个人观点,与华纳网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。