怎么使用python生成词云图

 更新时间:2023年06月15日 08:46:07   作者:夜之王。  
这篇文章主要给大家介绍了关于怎么使用python生成词云图的相关资料,词云图主要用途是将文本数据中出现频率较高的关键词以可视化的形式展现出来,使人一眼就可以领略文本数据的主要表达意思,需要的朋友可以参考下

词云图是什么?

词云图又称文字云,是信息可视化的表现形式之一。词云是把文本中出现频率较高的关键词进行视觉上的突出显示,形成关键词云层或关键词渲染,从而过滤掉大量的文本信息。读者可以快速领略文本的主旨。

相对柱状图、折线图、饼图等用来显示数据的图表,词云图可以展示大量文本数据。每个词的重要性(出现的频率)以字号大小表示:字号越大,该关键词越重要。如果想快速了解一段文本的重点,就可以构建一张词云图,从高频词汇去粗略了解。词云图以不同文字的杂乱组合,形成一定形状的图片,不仅能够以很直观的方式展示出重点内容,而且形式炫酷,颜色多变,给人眼前一亮的感觉。

怎么使用python制作词云图?

制作词云图很简单,首先需要导入3个库:

import jieba
import wordcloud
import imageio

其中,jieba和wordcloud为第三方库,需要自行安装。而imageio为python自带的库,不需要自行安装。

然后导入一个背景模板,以及需要制作词云图的底图。注意:模板的背景一定要是白色的,不可以是其他颜色或者透明

bg=imageio.v2.imread('D:\kgr1.jpg')
with open('D:/111.txt',encoding='utf-8') as f:
    t=f.read()

提取关键字

ls=jieba.lcut(t)
txt=" ".join(ls)

生成词云

w=wordcloud.WordCloud(width=1000,height=700,#词云比例
font_path="msyh.ttc",colormap='pink',#字体&颜色
background_color='white',mask=bg)#背景色&模板
w.generate(txt)
w.to_file(r'D:\pic.png')

效果图如下:

背景模板图片:

生成的词云图:

引用的文字为melt歌词,由此可见ryo写melt的高频词为:"了".如果用这首歌鬼畜,那么在te的发音出现时加速会有很好的鬼畜效果。

wordcloud还有其他功能,可以根据以下内容适度选择喜欢的功能添加:

wordcloud = WordCloud(font_path='simhei.ttf',  # 字体
                              prefer_horizontal=  ,#大部分都是横向排放
                              background_color='  ',  # 背景色
                              max_words=  ,  # 显示单词数
                              max_font_size=  ,  #最大字号
                              stopwords=   ,  # 过滤噪声词
                              mask=  ,#背景轮廓
                              colormap=   ,#使用自定义颜色
                              collocations=False
                              ).generate(txt)
    image = wordcloud.to_image()
    image.show()  # 展示图片
    wordcloud.to_file(' ')  # 保存图片

遇到的坑

做词云图会遇到第三方库安装失败的情况。

试了很多的方法,最后发现以下的方法是可行的:

wordcloud:

安装wordcloud库可以到以下链接下载对应自己的python版本、系统版本的.whl文件:

https://www.lfd.uci.edu/~gohlke/pythonlibs/

这是按首字母排序的。比如我下的是wordcloud‑1.8.1‑cp38‑cp38‑win32.whl,其中cp38就是指我的python版本号是3.8,如果是3.8.1等等也视为3.8;win32就是系统是32位的。如果你的python也没有numpy等等的话也需要安装,如果没有这些那么wordcloud也可能运行不了。

下好了以后,打开cmd,输入pip install 文件所在路径,比如pip install D:\wordcloud‑1.8.1‑cp38‑cp38‑win32.whl,等待提示安装完成即可。如果在pycharm中还是不能运行,可以试试在pycharm中点文件→设置→项目→python解释器→+号搜索,或者直接把第三方库的文件添加到项目/venv/Lib/sitepackages直到不报错为止。

jieba:

同理,但可以试试到这个链接下下载:

https://pypi.tuna.tsinghua.edu.cn/simple/jieba/

总结

到此这篇关于怎么使用python生成词云图的文章就介绍到这了,更多相关python生成词云图内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python中实现循环遍历的完全指南

    Python中实现循环遍历的完全指南

    循环是编程中最核心的概念之一,它允许我们重复执行代码块,Python提供了两种主要的循环结构,即for循环和while循环,下面小编就和大家详细介绍一下吧
    2026-02-02
  • Python实现破解猜数游戏算法示例

    Python实现破解猜数游戏算法示例

    这篇文章主要介绍了Python实现破解猜数游戏算法,简单描述了猜数游戏的原理,并结合具体实例形式分析了Python破解猜数游戏的相关实现技巧,需要的朋友可以参考下
    2017-09-09
  • Python中zip函数如何使用

    Python中zip函数如何使用

    在本篇文章里小编给大家分享的是关于Python中的zip函数用法,需要的朋友们可以学习参考下。
    2020-06-06
  • Python中Word文件自动化操作小结

    Python中Word文件自动化操作小结

    Python-docx是一个Python库,提供了对Microsoft Word(.docx文件)的读写和修改功能,本文主要介绍了如何使用Python-docx实现Word文件自动化操作,需要的可以参考下
    2024-04-04
  • 浅谈一下四则运算和二叉树

    浅谈一下四则运算和二叉树

    这篇文章主要浅谈一下四则运算和二叉树,因为总是见到把 四则运算表达式 用 树 的形式来展示,所以就想着给定一颗表达式树,计算它的结果出来,需要的朋友可以参考下
    2023-04-04
  • 使用Python在Excel文件中创建下拉列表

    使用Python在Excel文件中创建下拉列表

    在日常办公和数据处理工作中,Excel 表格是数据收集和管理的重要工具,然而,当需要多人协作填写表格或进行大量数据录入时,手动输入往往会出现格式不统一,因此本文将演示如何使用 Python 在 Excel 工作表中创建下拉列表,需要的朋友可以参考下
    2026-03-03
  • 使用Python调用天地图接口

    使用Python调用天地图接口

    天地图是中国国家测绘地理信息局推出的一款权威、全面的在线地理信息系统,本文将详细介绍如何使用Python调用天地图接口,感兴趣的可以了解下
    2024-12-12
  • PyTorch搭建LSTM实现时间序列负荷预测

    PyTorch搭建LSTM实现时间序列负荷预测

    这篇文章主要为大家介绍了PyTorch搭建LSTM实现时间序列负荷预测,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • Python3.9.1中使用split()的处理方法(推荐)

    Python3.9.1中使用split()的处理方法(推荐)

    这篇文章主要介绍了Python3.9.1中使用split()的处理方法(推荐),本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-02-02
  • 零基础写python爬虫之爬虫的定义及URL构成

    零基础写python爬虫之爬虫的定义及URL构成

    俗话说工欲善其事必先利其器,作为本系列文章的第一篇,我们同样也需要先利其器,先把爬虫的定义以及写爬虫所需要的基础知识先介绍给大家。
    2014-11-11

最新评论