基于Python编写一个词云制作程序

 更新时间:2023年10月19日 09:11:46   作者:微小冷  
这篇文章主要为大家详细介绍了如何基于Python编写一个简单的词云制作程序,文中的示例代码讲解详细,具有一定的学习价值,感兴趣的小伙伴可以了解一下

参数字典

自从做了热榜的词云之后,就越来越觉得词云的表达力真的很强,所以合计是不是可以为WordCloud做一个界面,来更加直观地操作。

既然以WordCloud为核心,那么界面的组件自然要和WordCloud的参数意义绑定,每个参数在界面中都对应一个提示组件,比如Lable,和一个输入组件,比如Entry。此外,这些参数都是可设的,那么在对应一个组件的同时,也应该对应一个StringVar。

简单起见,现在只挑选几个必备的参数,来演示这个逻辑的实现方法

参数说明适用组件参数
width词云宽度Spinbox100-2000, 10
height词云高度Spinbox100-2000, 10
scale缩放Spinbox0.5-10, 0.1
输入文本路径对话框
输出词云路径对话框
font_path字体文件路径路径对话框

将这些参数封装成一个字典,内容如下

wcDct = {
    "词云宽度" : {
        "Ctrl": ttk.Spinbox, 
        "paras" : {"from_":100, "to":2000, "increment":10},
        "default":800,
        "call" : "width"},
    "词云宽度" : {
        "Ctrl": ttk.Spinbox, 
        "paras" : {"from_":100, "to":2000, "increment":10},
        "default":450,
        "call" : "height"},
    "图像缩放" : {
        "Ctrl": ttk.Spinbox, 
        "paras" : {"from_":0.5, "to":10, "increment":0.1},
        "default":1,
        "call" : "scale"},
    "输入路径" : {"Ctrl": DialogButton},
    "输出路径" : {"Ctrl": DialogButton},
    "字体路径" : {"Ctrl": DialogButton, "call" : "font_path"},
}

其中,DialogButton是自定义的一个组件,主要包括一个按钮和一个输入框,点击按钮可以弹出文件对话框。

布局

有了这个字典,就可以据此来布局了

class DrawWords(ttk.Frame):
    def __init__(self, master, **options):
        super().__init__(master, **options)
        self.pack()
        self.words = None
        self.initWidgets()
    
    def initWidgets(self):
        frm = ttk.Frame(self)
        frm.pack(side=tk.LEFT, fill=tk.Y)
        self.initPara(frm)

    def setOneSpinBox(self, frm, key):
        ttk.Label(frm, width=8, text=key).pack(side=tk.LEFT)
        v = wcDct[key]      # 组件参数
        n = v["call"]       # 调用名
        self.spins[n] = v["ctrl"](frm, **v["paras"])
        self.spins[n].set(v["default"])
        self.spins[n].pack(side=tk.LEFT)
    
    def setOneDiaButton(self, frmPara, key):
        frm = ttk.Frame(frmPara)
        frm.pack(side=tk.TOP, fill=tk.X)
        ttk.Label(frm, width=8, text=key).pack(side=tk.LEFT)
        v = wcDct[key]
        n = v["call"] if 'call' in v else key
        self.paths[n] = v["ctrl"](frm, **v['paras'])
        self.paths[n].pack(side=tk.LEFT)
        if 'default' in v:
            self.paths[n].set(v['default'])

    def initPara(self, frmPara):
        self.spins = {}
        frm = ttk.Frame(frmPara)
        frm.pack(side=tk.TOP, fill=tk.X)
        for key in ["词云宽度", "词云高度"]:
            self.setOneSpinBox(frm, key)

        self.paths = {}
        for key in ["输入路径", "输出路径", "字体路径"]:
            self.setOneDiaButton(frmPara, key)
                
        frm = ttk.Frame(frmPara)
        frm.pack(side=tk.TOP, fill=tk.X)
        ttk.Button(frm, text="输出词云", 
            command=self.genWordCloud).pack(side=tk.LEFT)

在布局过程中,对SpinBox类型的变量和DialogButton型的变量分别做了不同的处理,并且为它们分别设计了全局变量字典self.spins和self.paths,以便于调用。

布局结果如下

其中,genWordCloud用于词云输出,考虑到分词的准确性,这里仍然采用jieba进行分词,并为分词专门设计一个函数,其最终实现如下。

    def splitWords(self):
        p = self.paths["输入路径"].get()
        with open(p, encoding='utf8') as f:
            text = f.read()
        words = jieba.lcut(text)
        self.words = [w for w in words if len(w)>1] # 取出长度大于1的词

    def genWordCloud(self):
        dct = {}
        for key in ['width', 'height', 'font_path']:
            if key in self.spins:
                dct[key] = int(self.spins[key].get())
            if key in self.paths:
                dct[key] = self.paths[key].get()        
        cloud = WordCloud(**dct)
        self.splitWords()
        cloud.generate(" ".join(self.words))
        p = self.paths["输出路径"].get()
        if not (p.endswith('.png') or p.endswith('.svg')):
            p = p+".png"
        cloud.to_file(p)

测试结果

最后,按照惯例,做一下测试

if __name__ == "__main__":
    root = tk.Tk()
    DrawWords(root).pack(side=tk.TOP, fill=tk.BOTH)
    root.mainloop()

效果如下

到此这篇关于基于Python编写一个词云制作程序的文章就介绍到这了,更多相关python词云内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python的scipy实现插值的示例代码

    python的scipy实现插值的示例代码

    这篇文章主要介绍了python的scipy实现插值的示例代码,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-11-11
  • Android+OpenCv4实现边缘检测及轮廓绘制出图像最大边缘

    Android+OpenCv4实现边缘检测及轮廓绘制出图像最大边缘

    最近工作需求,需要用opencv来先做一个demo,扫描照片进行边缘检测和最大边缘,就整理出来介绍一下,感兴趣的小伙伴们可以参考一下
    2021-05-05
  • Python和JS反爬之解决反爬参数 signKey

    Python和JS反爬之解决反爬参数 signKey

    这篇文章主要介绍了Python和JS反爬之解决反爬参数 signKey,Python 反爬中有一大类,叫做字体反爬,核心的理论就是通过字体文件或者 CSS 偏移,接下来文章的详细介绍,需要的小伙伴可以参考一下
    2022-05-05
  • python多维数组分位数的求取方式

    python多维数组分位数的求取方式

    这篇文章主要介绍了python多维数组分位数的求取方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • Python中的QPixmap用法详解

    Python中的QPixmap用法详解

    QPixmap主要用于绘图,针对图像显示而最佳化设计,这篇文章主要介绍了Python中的QPixmap用法,对QPixmap使相关知识感兴趣的朋友一起看看吧
    2023-03-03
  • Python爬虫后获取重定向url的两种方法

    Python爬虫后获取重定向url的两种方法

    这篇文章主要介绍了Python爬虫后获取重定向url的两种方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-01-01
  • Python判断列表是否已排序的各种方法及其性能分析

    Python判断列表是否已排序的各种方法及其性能分析

    这篇文章主要介绍了Python判断列表是否已排序的各种方法及其性能分析的相关资料,需要的朋友可以参考下
    2016-06-06
  • 利用Python实现绘制论文中的曲线图

    利用Python实现绘制论文中的曲线图

    这篇文章主要为大家详细介绍了如何利用Python语言实现绘制论文中需要的曲线图,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
    2023-03-03
  • django-利用session机制实现唯一登录的例子

    django-利用session机制实现唯一登录的例子

    这篇文章主要介绍了django-利用session机制实现唯一登录的例子,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • python3 图片referer防盗链的实现方法

    python3 图片referer防盗链的实现方法

    本篇文章主要介绍了python3 图片referer防盗链的实现方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-03-03

最新评论