Python实现简单文本字符串处理的方法

 更新时间:2018年01月22日 10:21:26   作者:Lovephysics  
这篇文章主要介绍了Python实现简单文本字符串处理的方法,涉及Python针对文本字符串的切割、计算、转换等相关操作技巧,需要的朋友可以参考下

本文实例讲述了Python实现简单文本字符串处理的方法。分享给大家供大家参考,具体如下:

对于一个文本字符串,可以使用Python的string.split()方法将其切割。下面看看实际运行效果。

mySent = 'This book is the best book on python!'
print mySent.split()

输出:

['This', 'book', 'is', 'the', 'best', 'book', 'on', 'python!']

可以看到,切分的效果不错,但是标点符号也被当成了词,可以使用正则表达式来处理,其中分隔符是除单词、数字外的任意字符串。

import re
reg = re.compile('\\W*')
mySent = 'This book is the best book on python!'
listof = reg.split(mySent)
print listof

输出为:

['This', 'book', 'is', 'the', 'best', 'book', 'on', 'python', '']

现在得到了一系列词组成的词表,但是里面的空字符串需要去掉。

可以计算每个字符串的长度,只返回大于0的字符串。

import re
reg = re.compile('\\W*')
mySent = 'This book is the best book on python!'
listof = reg.split(mySent)
new_list = [tok for tok in listof if len(tok)>0]
print new_list

输出为:

['This', 'book', 'is', 'the', 'best', 'book', 'on', 'python']

最后,发现句子中的第一个字母是大写的。我们需要同一形式,把大写转化为小写。Python内嵌的方法,可以将字符串全部转化为小写(.lower())或大写(.upper())

import re
reg = re.compile('\\W*')
mySent = 'This book is the best book on python!'
listof = reg.split(mySent)
new_list = [tok.lower() for tok in listof if len(tok)>0]
print new_list

输出为:

['this', 'book', 'is', 'the', 'best', 'book', 'on', 'python']

下面来看一封完整的电子邮件:

内容

Hi Peter,

With Jose out of town, do you want to
meet once in a while to keep things
going and do some interesting stuff?

Let me know
Eugene

import re
reg = re.compile('\\W*')
email = open('email.txt').read()
list = reg.split(email)
new_txt = [tok.lower() for tok in list if len(tok)>0]
print new_txt

输出:

复制代码 代码如下:
['hi', 'peter', 'with', 'jose', 'out', 'of', 'town', 'do', 'you', 'want', 'to', 'meet', 'once', 'in', 'a', 'while', 'to', 'keep', 'things', 'going', 'and', 'do', 'some', 'interesting', 'stuff', 'let', 'me', 'know', 'eugene']

更多关于Python相关内容可查看本站专题:《Python字符串操作技巧汇总》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总

希望本文所述对大家Python程序设计有所帮助。

相关文章

  • python 如何通过执行脚本安装库或卸载库

    python 如何通过执行脚本安装库或卸载库

    通过执行Python脚本,用户可以轻松地安装或卸载所需的库,本文介绍了该过程的具体步骤,包括如何编写用于安装或卸载库的脚本,无论是需要添加新功能还是清理环境,通过这种方式,开发者都能有效管理其工作环境中的库
    2024-11-11
  • python3获取url文件大小示例代码

    python3获取url文件大小示例代码

    这篇文章主要介绍了python3获取url文件大小,本文通过示例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-09-09
  • pycharm 终端部启用虚拟环境详情

    pycharm 终端部启用虚拟环境详情

    这篇文章主要介绍了pycharm 终端部启用虚拟环境详情,文章围绕pycharm 终端部启用虚拟环境商务相关资料展开全文章的详细内容,需要的小伙伴可以参考一下
    2021-12-12
  • Python全栈之线程详解

    Python全栈之线程详解

    这篇文章主要为大家介绍了Python全栈之线程,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2021-12-12
  • python保留小数函数的几种使用总结

    python保留小数函数的几种使用总结

    本文主要介绍了python保留小数函数的几种使用总结,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-02-02
  • 如何在mac下配置python虚拟环境

    如何在mac下配置python虚拟环境

    这篇文章主要介绍了如何mac下配置python虚拟环境,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-07-07
  • 详解Python如何通过文件后缀整理文件夹

    详解Python如何通过文件后缀整理文件夹

    这篇文章主要为大家详细介绍了Python如何通过文件后缀实现整理文件夹功能,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
    2024-02-02
  • Python return函数返回值类型和帮助函数使用教程

    Python return函数返回值类型和帮助函数使用教程

    这篇文章主要为大家介绍了Python return函数返回值类型和帮助函数使用教程详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-06-06
  • Python如何生成随机高斯模糊图片详解

    Python如何生成随机高斯模糊图片详解

    这篇文章主要给大家介绍了关于高斯模糊的原理以及python实现的相关资料,Python使用opencv库生成模糊图像还是很方便的,需要的朋友可以参考下
    2021-05-05
  • Python脚本实现自动删除C盘临时文件夹

    Python脚本实现自动删除C盘临时文件夹

    在日常使用电脑的过程中,临时文件夹往往会积累大量的无用数据,占用宝贵的磁盘空间,下面我们就来看看Python如何通过脚本实现自动删除C盘临时文件夹吧
    2025-01-01

最新评论