Python3处理文件中每个词的方法

 更新时间:2015年05月22日 12:24:46   作者:皮蛋  
这篇文章主要介绍了Python3处理文件中每个词的方法,可实现逐个处理文件中每个词的功能,需要的朋友可以参考下

本文实例讲述了Python3处理文件中每个词的方法。分享给大家供大家参考。具体实现方法如下:

''''' 
Created on Dec 21, 2012 
处理文件中的每个词 
@author: liury_lab 
''' 
import codecs 
the_file = codecs.open('d:/text.txt', 'rU', 'UTF-8') 
for line in the_file: 
  for word in line.split(): 
    print(word, end = "|") 
the_file.close() 
# 若词的定义有变,可使用正则表达式 
# 如词被定义为数字字母,连字符或单引号构成的序列 
import re 
the_file = codecs.open('d:/text.txt', 'rU', 'UTF-8') 
print() 
print('************************************************************************') 
re_word = re.compile('[\w\'-]+') 
for line in the_file: 
  for word in re_word.finditer(line): 
    print(word.group(0), end = "|") 
the_file.close() 
# 封装成迭代器 
def words_of_file(file_path, line_to_words = str.split): 
  the_file = codecs.open('d:/text.txt', 'rU', 'UTF-8') 
  for line in the_file: 
    for word in line_to_words(line): 
      yield word 
  the_file.close() 
print() 
print('************************************************************************') 
for word in words_of_file('d:/text.txt'): 
  print(word, end = '|') 
def words_by_re(file_path, repattern = '[\w\'-]+'): 
  the_file = codecs.open('d:/text.txt', 'rU', 'UTF-8') 
  re_word = re.compile('[\w\'-]+') 
 
  def line_to_words(line): 
    for mo in re_word.finditer(line): 
      yield mo.group(0) # 原书为return,发现结果不对,改为yield 
  return words_of_file(file_path, line_to_words) 
print() 
print('************************************************************************') 
for word in words_by_re('d:/text.txt'): 
  print(word, end = '|')

希望本文所述对大家的Python程序设计有所帮助。

相关文章

  • 手把手教你jupyter notebook更换环境的方法

    手把手教你jupyter notebook更换环境的方法

    在日常使用jupyter-notebook时,可能会碰到需要切换不同虚拟环境的场景,下面这篇文章主要给大家介绍了关于jupyter notebook更换环境的方法,需要的朋友可以参考下
    2023-05-05
  • 删除PyCharm解释器的方法步骤

    删除PyCharm解释器的方法步骤

    这篇文章主要给大家介绍了关于删除PyCharm解释器的方法步骤,PyCharm解释器是指在PyCharm集成开发环境中用于运行和调试Python代码的解释器,需要的朋友可以参考下
    2023-09-09
  • 基于Python实现本地音乐播放器的制作

    基于Python实现本地音乐播放器的制作

    这篇文章主要介绍了如何利用Python实现本地音乐播放器的制作,并且可以选择需要播放的音乐的路径,选择播放方式,感兴趣的小伙伴可以了解一下
    2022-06-06
  • 基于Python log 的正确打开方式

    基于Python log 的正确打开方式

    下面小编就为大家分享一篇基于Python log 的正确打开方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04
  • Python apscheduler实现定时任务的方法详解

    Python apscheduler实现定时任务的方法详解

    apscheduler(Advanced Python Scheduler)是一个用于Python的灵活、强大的定时任务调度库,它允许您以各种方式安排函数或方法的执行,下面就跟随小编一起学习一下它的具体使用吧
    2023-10-10
  • Python线性拟合实现函数与用法示例

    Python线性拟合实现函数与用法示例

    这篇文章主要介绍了Python线性拟合实现函数与用法,结合实例形式分析了Python使用线性拟合算法与不使用线性拟合算法的相关算法操作技巧,需要的朋友可以参考下
    2018-12-12
  • pytorch中torch.max和Tensor.view函数用法详解

    pytorch中torch.max和Tensor.view函数用法详解

    今天小编就为大家分享一篇pytorch中torch.max和Tensor.view函数用法详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-01-01
  • 如何使用 Python 中的功能和库创建 n-gram

    如何使用 Python 中的功能和库创建 n-gram

    在计算语言学中,n-gram 对于语言处理、上下文和语义分析非常重要,它们是从令牌字符串中相邻的连续单词序列,本文将讨论如何使用 Python 中的功能和库创建 n-gram,感兴趣的朋友一起看看吧
    2023-09-09
  • 详解python的内存分配机制

    详解python的内存分配机制

    Python的内存分配机制是小白们最需要理解的概念之一。创建对象(变量、函数、对象等)后,CPython会在内存中为其分配地址。Python有一个id()函数,它可以返回对象的“身份”,也就是内存地址。它实际上是一个唯一的整数。
    2021-05-05
  • 浅谈flask截获所有访问及before/after_request修饰器

    浅谈flask截获所有访问及before/after_request修饰器

    这篇文章主要介绍了浅谈flask截获所有访问及before/after_request修饰器,具有一定借鉴价值,需要的朋友可以参考下
    2018-01-01

最新评论