python统计文章中单词出现次数实例

更新时间：2020年02月27日 15:30:11 作者：angryTom

在本篇文章里小编给大家整理的是关于python统计文章中单词出现次数实例，需要的朋友们参考学习下。

python统计单词出现次数

做单词词频统计，用字典无疑是最合适的数据类型，单词作为字典的key，单词出现的次数作为字典的 value，很方便地就记录好了每个单词的频率，字典很像我们的电话本，每个名字关联一个电话号码。

下面是具体的实现代码，实现了从importthis.txt文件读取单词，并统计出现次数最多的5个单词。

# -*- coding:utf-8 -*-
import io
import re
 
class Counter:
  def __init__(self, path):
    """
    :param path: 文件路径
    """
    self.mapping = dict()
    with io.open(path, encoding="utf-8") as f:
      data = f.read()
      words = [s.lower() for s in re.findall("\w+", data)]
      for word in words:
        self.mapping[word] = self.mapping.get(word, 0) + 1
 
  def most_common(self, n):
    assert n > 0, "n should be large than 0"
    return sorted(self.mapping.items(), key=lambda item: item[1], reverse=True)[:n]
 
if __name__ == '__main__':
  most_common_5 = Counter("importthis.txt").most_common(5)
  for item in most_common_5:
    print(item)

执行效果：

('is', 10)
('better', 8)
('than', 8)
('the', 6)
('to', 5)

知识点补充：

1、如何正确读写文件

2、如何对数据进行排序

3、字典数据类型的运用

4、正则表达式的运用

到此这篇关于python统计文章中单词出现次数实例的文章就介绍到这了,更多相关python统计单词出现次数内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

python AutoViz库一行代码实现可视化数据集
这篇文章主要介绍了python AutoViz库一行代码实现可视化数据集实例探索,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
2024-01-01
Python实现语音合成功能详解
这篇文章主要为大家介绍了一个通过Python制作的小工具，可以实现语音识别以及文字转语音的功能，文中的实现步骤讲解详细，感兴趣的可以动手试一试
2022-01-01
Python 中使用 argparse 解析命令行参数
这篇文章主要介绍了Python 中使用 argparse 解析命令行参数，argparse 模块是一个强大的命令行参数解析器，还有很多功能没能在这里介绍。下面文化在哪个详细介绍该内容,需要的朋友可以参考一下
2021-11-11
python实现将Word文档中的文字转换成语音的操作步骤
在Python中实现文字转语音（Text-to-Speech, TTS）功能,能够广泛应用于多种场景,如语音助手、有声读物、无障碍阅读等,本文将结合具体案例,详细介绍如何在Python中实现文字转语音功能,需要的朋友可以参考下
2024-08-08
使用 Python 实现微信消息的一键已读的思路代码
利用python可以实现微信消息的一键已读功能，怎么实现呢？你肯定会想着很复杂，但是python的好处就是很多人已经把接口打包做好了，只需要调用即可，今天通过本文给大家分享使用 Python 实现微信消息的一键已读的思路代码，一起看看吧
2021-06-06
python获取服务器响应cookie的实例
今天小编就为大家分享一篇python获取服务器响应cookie的实例，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2018-12-12
在Python中使用sort()方法进行排序的简单教程
这篇文章主要介绍了在Python中使用sort()方法进行排序的简单教程,是Python学习中的基础知识,需要的朋友可以参考下
2015-05-05
pycharm 快速解决python代码冲突的问题
这篇文章主要介绍了pycharm 快速解决python代码冲突的问题，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2021-01-01
Python实现输入二叉树的先序和中序遍历，再输出后序遍历操作示例
这篇文章主要介绍了Python实现输入二叉树的先序和中序遍历，再输出后序遍历操作,涉及Python基于先序遍历和中序遍历构造二叉树,再后序遍历输出相关操作技巧,需要的朋友可以参考下
2018-07-07
Python实现Mysql全量数据同步的脚本分享
这篇文章主要为大家详细介绍了基于Python如何实现Mysql全量数据同步的功能，文中的示例代码讲解详细，感兴趣的小伙伴可以跟随小编一起了解一下
2023-06-06

python统计文章中单词出现次数实例

相关文章

最新评论

大家感兴趣的内容

最近更新的内容

常用在线小工具