怎么使用python生成词云图

 更新时间:2023年06月15日 08:46:07   作者:夜之王。  
这篇文章主要给大家介绍了关于怎么使用python生成词云图的相关资料,词云图主要用途是将文本数据中出现频率较高的关键词以可视化的形式展现出来,使人一眼就可以领略文本数据的主要表达意思,需要的朋友可以参考下

词云图是什么?

词云图又称文字云,是信息可视化的表现形式之一。词云是把文本中出现频率较高的关键词进行视觉上的突出显示,形成关键词云层或关键词渲染,从而过滤掉大量的文本信息。读者可以快速领略文本的主旨。

相对柱状图、折线图、饼图等用来显示数据的图表,词云图可以展示大量文本数据。每个词的重要性(出现的频率)以字号大小表示:字号越大,该关键词越重要。如果想快速了解一段文本的重点,就可以构建一张词云图,从高频词汇去粗略了解。词云图以不同文字的杂乱组合,形成一定形状的图片,不仅能够以很直观的方式展示出重点内容,而且形式炫酷,颜色多变,给人眼前一亮的感觉。

怎么使用python制作词云图?

制作词云图很简单,首先需要导入3个库:

import jieba
import wordcloud
import imageio

其中,jieba和wordcloud为第三方库,需要自行安装。而imageio为python自带的库,不需要自行安装。

然后导入一个背景模板,以及需要制作词云图的底图。注意:模板的背景一定要是白色的,不可以是其他颜色或者透明

bg=imageio.v2.imread('D:\kgr1.jpg')
with open('D:/111.txt',encoding='utf-8') as f:
    t=f.read()

提取关键字

ls=jieba.lcut(t)
txt=" ".join(ls)

生成词云

w=wordcloud.WordCloud(width=1000,height=700,#词云比例
font_path="msyh.ttc",colormap='pink',#字体&颜色
background_color='white',mask=bg)#背景色&模板
w.generate(txt)
w.to_file(r'D:\pic.png')

效果图如下:

背景模板图片:

生成的词云图:

引用的文字为melt歌词,由此可见ryo写melt的高频词为:"了".如果用这首歌鬼畜,那么在te的发音出现时加速会有很好的鬼畜效果。

wordcloud还有其他功能,可以根据以下内容适度选择喜欢的功能添加:

wordcloud = WordCloud(font_path='simhei.ttf',  # 字体
                              prefer_horizontal=  ,#大部分都是横向排放
                              background_color='  ',  # 背景色
                              max_words=  ,  # 显示单词数
                              max_font_size=  ,  #最大字号
                              stopwords=   ,  # 过滤噪声词
                              mask=  ,#背景轮廓
                              colormap=   ,#使用自定义颜色
                              collocations=False
                              ).generate(txt)
    image = wordcloud.to_image()
    image.show()  # 展示图片
    wordcloud.to_file(' ')  # 保存图片

遇到的坑

做词云图会遇到第三方库安装失败的情况。

试了很多的方法,最后发现以下的方法是可行的:

wordcloud:

安装wordcloud库可以到以下链接下载对应自己的python版本、系统版本的.whl文件:

https://www.lfd.uci.edu/~gohlke/pythonlibs/

这是按首字母排序的。比如我下的是wordcloud‑1.8.1‑cp38‑cp38‑win32.whl,其中cp38就是指我的python版本号是3.8,如果是3.8.1等等也视为3.8;win32就是系统是32位的。如果你的python也没有numpy等等的话也需要安装,如果没有这些那么wordcloud也可能运行不了。

下好了以后,打开cmd,输入pip install 文件所在路径,比如pip install D:\wordcloud‑1.8.1‑cp38‑cp38‑win32.whl,等待提示安装完成即可。如果在pycharm中还是不能运行,可以试试在pycharm中点文件→设置→项目→python解释器→+号搜索,或者直接把第三方库的文件添加到项目/venv/Lib/sitepackages直到不报错为止。

jieba:

同理,但可以试试到这个链接下下载:

https://pypi.tuna.tsinghua.edu.cn/simple/jieba/

总结

到此这篇关于怎么使用python生成词云图的文章就介绍到这了,更多相关python生成词云图内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 使用Docker制作Python环境连接Oracle镜像

    使用Docker制作Python环境连接Oracle镜像

    这篇文章主要为大家介绍了使用Docker制作Python环境连接Oracle镜像示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-06-06
  • python 矩阵增加一行或一列的实例

    python 矩阵增加一行或一列的实例

    下面小编就为大家分享一篇python 矩阵增加一行或一列的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04
  • python3中的函数与参数及空值问题

    python3中的函数与参数及空值问题

    这篇文章主要介绍了python3-函数与参数以及空值,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-11-11
  • conda创建环境、安装包、删除环境步骤详细记录

    conda创建环境、安装包、删除环境步骤详细记录

    对于生信工作者,有一个方便可用的环境可以极大地方便我们开展分析,conda可以让我们在非root的情况下较为方便地切换不同的工作环境,下面这篇文章主要给大家介绍了关于conda创建环境、安装包、删除环境步骤的相关资料,需要的朋友可以参考下
    2022-08-08
  • python查看矩阵的行列号以及维数方式

    python查看矩阵的行列号以及维数方式

    这篇文章主要介绍了python查看矩阵的行列号以及维数方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-05-05
  • python对DICOM图像的读取方法详解

    python对DICOM图像的读取方法详解

    DICOM(Digital Imaging and Communications in Medicine)即医学数字成像和通信,是医学图像和相关信息的国际标准(ISO 12052)。下面这篇文章主要给大家介绍了关于python对DICOM图像读取的相关资料,需要的朋友可以参考借鉴,下面来一起看看吧。
    2017-07-07
  • tensorflow 1.0用CNN进行图像分类

    tensorflow 1.0用CNN进行图像分类

    这篇文章主要为大家详细介绍了tensorflow 1.0用CNN进行图像分类,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-04-04
  • Python基于Webhook实现github自动化部署

    Python基于Webhook实现github自动化部署

    这篇文章主要介绍了Python基于Webhook实现github自动化部署,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-11-11
  • Python实现单例模式的四种方式详解

    Python实现单例模式的四种方式详解

    单例模式可以保证一个类仅有一个实例,并提供一个访问它的全局访问点。本文为大家介绍了Python实现单例模式的四种方式,需要的可以参考一下
    2022-05-05
  • Flask教程之重定向与错误处理实例分析

    Flask教程之重定向与错误处理实例分析

    这篇文章主要介绍了Flask教程之重定向与错误处理,结合实例形式分析了flask框架重定向、状态码判断及错误处理相关操作技巧,需要的朋友可以参考下
    2019-08-08

最新评论