Python3实现统计单词表中每个字母出现频率的方法示例

 更新时间:2019年01月28日 11:55:28   作者:苏奇  
这篇文章主要介绍了Python3实现统计单词表中每个字母出现频率的方法,涉及Python针对文件的读取、遍历、统计等相关操作技巧,需要的朋友可以参考下

本文实例讲述了Python3实现统计单词表中每个字母出现频率的方法。分享给大家供大家参考,具体如下:

作为python字典与数组概念的运用,统计字母表中每个字母出现的频率,作为练习再合适不过。

解决问题过程中需要用到的知识点包括:字典的创建、增添元素,数组的创建、增添元素,数组的遍历等

这个问题解决的思路为:首先从文件中按行依次读入单词,去除换行符后添加到数组 new_list 中。依次遍历数组 new_list 的每一个字符串,将每个字符串连同上一次循环中的频率统计结果 old_d (old_d在遍历new_list之前进行初始化)一起作为实参传递给频率统计函数 histogram()。histogram()函数在上一轮频率统计基础上得出本轮频率统计结果,结果通过字典 d 传回,将值赋给 old_d 。直到遍历完new_list,再将 old_d 统计结果打印。

'''transform string into dictionary
s is input string
d is dictionary to restore every bit in string
'''
def histogram(s, old_d):
  d = old_d
  for c in s:
    d[c] = d.get(c, 0) + 1
  return d
'''This function can calculate the frequency of every letter in alphabet
'''
fin = open("words.txt")
new_list = []
for line in fin:
  rs = line.rstrip('\n') #delete the '\n' after every letter
  new_list.append(rs) # new_list is used to restore letters
old_d = dict() # initialize the dictionary
for i in range(len(new_list)): #calculate the letter
#frequency of every word
  old_d = histogram(new_list[i], old_d) #old_d is used to
  #restore letter frequency before new_list[i]
print(old_d)

这里words.txt文档内容如下:

But soft what light through yonder window breaks
It is the east and Juliet is the sun
Arise fair sun and kill the envious moon
Who is already sick and pale with grief

代码运行结果:

{'B': 1, 'u': 6, 't': 12, ' ': 29, 's': 11, 'o': 8, 'f': 3, 'w': 4, 'h': 9, 'a': 10, 'l': 6, 'i': 13, 'g': 3, 'r': 7, 'y': 2, 'n': 9, 'd': 6, 'e': 12, 'b': 1, 'k': 3, 'I': 1, 'J': 1, 'A': 1, 'v': 1, 'm': 1, 'W': 1, 'c': 1, 'p': 1}

PS:这里再为大家推荐2款相关统计工具供大家参考:

在线字数统计工具:
http://tools.jb51.net/code/zishutongji

在线字符统计与编辑工具:
http://tools.jb51.net/code/char_tongji

更多关于Python相关内容感兴趣的读者可查看本站专题:《Python文件与目录操作技巧汇总》、《Python文本文件操作技巧汇总》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》及《Python入门与进阶经典教程

希望本文所述对大家Python程序设计有所帮助。

相关文章

  • Python图像处理之图像金字塔的向上和向下取样

    Python图像处理之图像金字塔的向上和向下取样

    图像金字塔是指由一组图像且不同分别率的子图集合,它是图像多尺度表达的一种,以多分辨率来解释图像的结构,主要用于图像的分割或压缩。本文主要介绍了图像金字塔的图像向下取样和向上取样,感兴趣的可以了解一下
    2022-09-09
  • tensorflow获取预训练模型某层参数并赋值到当前网络指定层方式

    tensorflow获取预训练模型某层参数并赋值到当前网络指定层方式

    今天小编就为大家分享一篇tensorflow获取预训练模型某层参数并赋值到当前网络指定层方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-01-01
  • Django配置Mysql数据库连接的实现

    Django配置Mysql数据库连接的实现

    本文主要介绍了Django配置Mysql数据库连接的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-03-03
  • python GUI库图形界面开发之PyQt5输入对话框QInputDialog详细使用方法与实例

    python GUI库图形界面开发之PyQt5输入对话框QInputDialog详细使用方法与实例

    这篇文章主要介绍了python GUI库图形界面开发之PyQt5输入对话框QInputDialog详细使用方法与实例,需要的朋友可以参考下
    2020-02-02
  • 基于Python 的进程管理工具supervisor使用指南

    基于Python 的进程管理工具supervisor使用指南

    Supervisor 是基于 Python 的进程管理工具,可以轻松管理一些需要以守护进程方式执行的程序,也就是后台任务,例如用来启动和管理基于 Tornado 写的 Web 程序。
    2016-09-09
  • Python中NumPy的线性代数子模块linalg详解

    Python中NumPy的线性代数子模块linalg详解

    这篇文章主要介绍了Python中NumPy的线性代数子模块linalg详解,NumPy 的线性代数子模块linalg提供了 20 余个函数,用于求解行列式、逆矩阵、特征值、特征向量,以及矩阵分解等,需要的朋友可以参考下
    2023-08-08
  • Python实现LSTM学习的三维轨迹

    Python实现LSTM学习的三维轨迹

    这篇文章主要为大家详细介绍了如何使用LSTM来学习和预测三维轨迹,并提供详细的Python实现示例,感兴趣的小伙伴可以跟随小编一起学习一下
    2024-12-12
  • 详解Python字符串切片

    详解Python字符串切片

    这篇文章主要介绍了Python字符串切片,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-05-05
  • 在python中修改.properties文件的操作

    在python中修改.properties文件的操作

    这篇文章主要介绍了在python中修改.properties文件的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • python时间序列按频率生成日期的方法

    python时间序列按频率生成日期的方法

    这篇文章主要介绍了python时间序列按频率生成日期的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-05-05

最新评论