python统计文本字符串里单词出现频率的方法

 更新时间:2015年05月26日 16:45:49   作者:依山带水  
这篇文章主要介绍了python统计文本字符串里单词出现频率的方法,涉及Python字符串操作的相关技巧,需要的朋友可以参考下

本文实例讲述了python统计文本字符串里单词出现频率的方法。分享给大家供大家参考。具体实现方法如下:

# word frequency in a text
# tested with Python24  vegaseat  25aug2005
# Chinese wisdom ...
str1 = """Man who run in front of car, get tired.
Man who run behind car, get exhausted."""
print "Original string:"
print str1
print
# create a list of words separated at whitespaces
wordList1 = str1.split(None)
# strip any punctuation marks and build modified word list
# start with an empty list
wordList2 = []
for word1 in wordList1:
  # last character of each word
  lastchar = word1[-1:]
  # use a list of punctuation marks
  if lastchar in [",", ".", "!", "?", ";"]:
    word2 = word1.rstrip(lastchar)
  else:
    word2 = word1
  # build a wordList of lower case modified words
  wordList2.append(word2.lower())
print "Word list created from modified string:"
print wordList2
print
# create a wordfrequency dictionary
# start with an empty dictionary
freqD2 = {}
for word2 in wordList2:
  freqD2[word2] = freqD2.get(word2, 0) + 1
# create a list of keys and sort the list
# all words are lower case already
keyList = freqD2.keys()
keyList.sort()
print "Frequency of each word in the word list (sorted):"
for key2 in keyList:
 print "%-10s %d" % (key2, freqD2[key2])

希望本文所述对大家的Python程序设计有所帮助。

相关文章

  • python常用request库与lxml库操作方法整理总结

    python常用request库与lxml库操作方法整理总结

    一路学习,一路总结,技术就是这样,应用之后,在进行整理,才可以加深印象。本篇文字为小节篇,核心总结 requests 库与 lxml 库常用的操作
    2021-08-08
  • python使用opencv驱动摄像头的方法

    python使用opencv驱动摄像头的方法

    今天小编就为大家分享一篇python使用opencv驱动摄像头的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-08-08
  • Python基于内置函数type创建新类型

    Python基于内置函数type创建新类型

    这篇文章主要介绍了Python基于内置函数type创建新类型,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-10-10
  • Python 面向对象 成员的访问约束

    Python 面向对象 成员的访问约束

    在Java,C++,以及PHP中都有对应的关键字,public,protected,private,但是在Python中却没有这些关键字来声明类成员的访问作用域。
    2008-12-12
  • Python实现的爬取百度文库功能示例

    Python实现的爬取百度文库功能示例

    这篇文章主要介绍了Python实现的爬取百度文库功能,结合实例形式分析了Python针对百度文库的爬取、编码转换、文件保存等相关操作技巧,需要的朋友可以参考下
    2019-02-02
  • 176万!GPT-4发布详解如何查看OpenAI的下载量

    176万!GPT-4发布详解如何查看OpenAI的下载量

    这篇文章主要为大家介绍了GPT-4发布如何查看OpenAI的下载量详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-03-03
  • Python线性表种的单链表详解

    Python线性表种的单链表详解

    这篇文章主要介绍了Python线性表种的单链表详解,线性表是一种线性结构,它是由零个或多个数据元素构成的有限序列。线性表的特征是在一个序列中,除了头尾元素,每个元素都有且只有一个直接前驱,有且只有一个直接后继
    2022-08-08
  • Django 用户登陆访问限制实例 @login_required

    Django 用户登陆访问限制实例 @login_required

    这篇文章主要介绍了Django 用户登陆访问限制实例 @login_required,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-05-05
  • Python自动化办公之Word文档的创建与生成

    Python自动化办公之Word文档的创建与生成

    这篇文章主要为大家详细介绍了如何通过python脚本来自动生成一个 word文档,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
    2022-05-05
  • django中的HTML控件及参数传递方法

    django中的HTML控件及参数传递方法

    下面小编就为大家分享一篇django中的HTML控件及参数传递方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-03-03

最新评论