怎么使用python生成词云图

 更新时间:2023年06月15日 08:46:07   作者:夜之王。  
这篇文章主要给大家介绍了关于怎么使用python生成词云图的相关资料,词云图主要用途是将文本数据中出现频率较高的关键词以可视化的形式展现出来,使人一眼就可以领略文本数据的主要表达意思,需要的朋友可以参考下

词云图是什么?

词云图又称文字云,是信息可视化的表现形式之一。词云是把文本中出现频率较高的关键词进行视觉上的突出显示,形成关键词云层或关键词渲染,从而过滤掉大量的文本信息。读者可以快速领略文本的主旨。

相对柱状图、折线图、饼图等用来显示数据的图表,词云图可以展示大量文本数据。每个词的重要性(出现的频率)以字号大小表示:字号越大,该关键词越重要。如果想快速了解一段文本的重点,就可以构建一张词云图,从高频词汇去粗略了解。词云图以不同文字的杂乱组合,形成一定形状的图片,不仅能够以很直观的方式展示出重点内容,而且形式炫酷,颜色多变,给人眼前一亮的感觉。

怎么使用python制作词云图?

制作词云图很简单,首先需要导入3个库:

import jieba
import wordcloud
import imageio

其中,jieba和wordcloud为第三方库,需要自行安装。而imageio为python自带的库,不需要自行安装。

然后导入一个背景模板,以及需要制作词云图的底图。注意:模板的背景一定要是白色的,不可以是其他颜色或者透明

bg=imageio.v2.imread('D:\kgr1.jpg')
with open('D:/111.txt',encoding='utf-8') as f:
    t=f.read()

提取关键字

ls=jieba.lcut(t)
txt=" ".join(ls)

生成词云

w=wordcloud.WordCloud(width=1000,height=700,#词云比例
font_path="msyh.ttc",colormap='pink',#字体&颜色
background_color='white',mask=bg)#背景色&模板
w.generate(txt)
w.to_file(r'D:\pic.png')

效果图如下:

背景模板图片:

生成的词云图:

引用的文字为melt歌词,由此可见ryo写melt的高频词为:"了".如果用这首歌鬼畜,那么在te的发音出现时加速会有很好的鬼畜效果。

wordcloud还有其他功能,可以根据以下内容适度选择喜欢的功能添加:

wordcloud = WordCloud(font_path='simhei.ttf',  # 字体
                              prefer_horizontal=  ,#大部分都是横向排放
                              background_color='  ',  # 背景色
                              max_words=  ,  # 显示单词数
                              max_font_size=  ,  #最大字号
                              stopwords=   ,  # 过滤噪声词
                              mask=  ,#背景轮廓
                              colormap=   ,#使用自定义颜色
                              collocations=False
                              ).generate(txt)
    image = wordcloud.to_image()
    image.show()  # 展示图片
    wordcloud.to_file(' ')  # 保存图片

遇到的坑

做词云图会遇到第三方库安装失败的情况。

试了很多的方法,最后发现以下的方法是可行的:

wordcloud:

安装wordcloud库可以到以下链接下载对应自己的python版本、系统版本的.whl文件:

https://www.lfd.uci.edu/~gohlke/pythonlibs/

这是按首字母排序的。比如我下的是wordcloud‑1.8.1‑cp38‑cp38‑win32.whl,其中cp38就是指我的python版本号是3.8,如果是3.8.1等等也视为3.8;win32就是系统是32位的。如果你的python也没有numpy等等的话也需要安装,如果没有这些那么wordcloud也可能运行不了。

下好了以后,打开cmd,输入pip install 文件所在路径,比如pip install D:\wordcloud‑1.8.1‑cp38‑cp38‑win32.whl,等待提示安装完成即可。如果在pycharm中还是不能运行,可以试试在pycharm中点文件→设置→项目→python解释器→+号搜索,或者直接把第三方库的文件添加到项目/venv/Lib/sitepackages直到不报错为止。

jieba:

同理,但可以试试到这个链接下下载:

https://pypi.tuna.tsinghua.edu.cn/simple/jieba/

总结

到此这篇关于怎么使用python生成词云图的文章就介绍到这了,更多相关python生成词云图内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python自动化运维和部署项目工具Fabric使用实例

    Python自动化运维和部署项目工具Fabric使用实例

    Fabric是一个Python库,只要目标机器支持ssh访问,就可以借助fabric来进行远程操作(如在host1上对host2远程运行shell命令),显然,由于fabric是个Python package,故其它Python package都可以被import到fabric特有的fabfile.py脚本中
    2016-09-09
  • 在pytorch中计算准确率,召回率和F1值的操作

    在pytorch中计算准确率,召回率和F1值的操作

    这篇文章主要介绍了在pytorch中计算准确率,召回率和F1值的操作,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-05-05
  • 用tensorflow实现弹性网络回归算法

    用tensorflow实现弹性网络回归算法

    这篇文章主要介绍了用tensorflow实现弹性网络回归算法
    2018-01-01
  • Python上下文管理器和with块详解

    Python上下文管理器和with块详解

    这篇文章主要为大家详细介绍了Python上下文管理器和with块的相关资料,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-09-09
  • 详解如何使用Python隐藏图像中的数据

    详解如何使用Python隐藏图像中的数据

    隐写术是在任何文件中隐藏秘密数据的艺术。隐写术的主要目的是隐藏任何文件中的预期信息,而不实际改变文件的外观,即文件外观看起来和以前一样。本文将利用Python实现隐藏图像中的数据,需要的可以参考一下
    2022-02-02
  • python的staticmethod与classmethod实现实例代码

    python的staticmethod与classmethod实现实例代码

    这篇文章主要介绍了python的staticmethod与classmethod实现实例代码,分享了相关代码示例,小编觉得还是挺不错的,具有一定借鉴价值,需要的朋友可以参考下
    2018-02-02
  • Python中ImportError错误的详细解决方法

    Python中ImportError错误的详细解决方法

    最近辛辛苦苦安装完了python,最后再运行的时候会出现错误,所以这篇文章主要给大家介绍了关于Python中ImportError错误的详细解决方法,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-07-07
  • Python IDE环境之 新版Pycharm安装详细教程

    Python IDE环境之 新版Pycharm安装详细教程

    这篇文章主要介绍了Python IDE环境之 新版Pycharm安装教程,本文教程给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-03-03
  • Python批量加密Excel文件的实现示例

    Python批量加密Excel文件的实现示例

    在日常工作中,保护敏感数据是至关重要的,本文主要介绍了Python批量加密Excel文件的实现示例,具有一定的参考价值,感兴趣的可以了解一下
    2023-12-12
  • 浅谈python中np.array的shape( ,)与( ,1)的区别

    浅谈python中np.array的shape( ,)与( ,1)的区别

    今天小编就为大家分享一篇python中np.array的shape ( ,)与( ,1)的区别,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-06-06

最新评论