使用Python提取文本中含有特定字符串的方法示例

 更新时间:2020年12月09日 10:20:13   作者:zkw_1998  
这篇文章主要给大家介绍了关于如何使用Python提取文本中含有特定字符串的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

今天搞了一天的文本处理,发现python真的太适合做数据处理了。废话不多说,一起学习吧!

1.我的原始数据是这样的,如图

2.如果要提取每行含有pass的字符串,代码如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
print(result)

3.执行上面代码,可以取出每行含有pass的文本,如图:

4.其实我真正要提取的是每行类似上图红色框内的字符串,代码实现如下:

import re

filepath = "E:/untitled1/analyze_log/test.log"
txt = open(filepath, "r").read()

result=""
test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
result = result +'\n'.join(test_text)#换行输出
del_num = re.sub("\d+ ", "", result)#去掉每行行首的数字
del_awake = del_num.replace("awake", "")#去掉awake
del_commd = del_awake.replace("commd", "")#去掉commd
del_string1 = re.sub("-a+\d\d\d\d-\d.wav", "", del_commd)#去掉-a0023-1.wav类型的字符串
del_string2 = re.sub("-a+\d\d\d\d.wav", "", del_string1)#去掉-a0016.wav类型的字符串
print(del_string2)

5.执行上面代码,可以取出最后我需要的文本,如图:

6.拓展

7.示例代码

import re

str = 'Hello123/World 45_?6bye'
result1 = re.findall('\d',str)#\d匹配任何十进制数
result2 = re.findall('\d+',str)#\d+可匹配一位或多位数字使用
result3 = re.findall('\D',str)#\d匹配非数字字符任何十进制数
result4 = re.findall('\w',str)#\w匹配任何字母数字字符,包括下划线在内
result5 = re.findall('\W',str)#\W匹配非任何字母数字字符,包括下划线在内
result6 = re.findall('\s',str)#\s匹配任何空白字符
result7 = re.findall('\S',str)#\S匹配非任何空白字符
result8 = re.findall('\AHello',str)#\A仅匹配字符串开头
result9 = re.findall('bye\Z',str)#\Z仅匹配字符串结尾
print(result1)
print(result2)
print(result3)
print(result4)
print(result5)
print(result6)
print(result7)
print(result8)
print(result9)

接下来会更几篇关于文本处理的博客,一边学习一边记笔记。加油!

到此这篇关于使用Python提取文本中含有特定字符串的文章就介绍到这了,更多相关Python提取文本特定字符串内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python预测2020高考分数和录取情况

    Python预测2020高考分数和录取情况

    这篇文章主要介绍了Python预测2020高考分数和录取情况可能是这样,本文通过示例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-07-07
  • 6个Python办公黑科技,助你提升工作效率

    6个Python办公黑科技,助你提升工作效率

    这篇文章主要介绍了Python办公黑科技,文中有非常详细的代码示例,对正在学习python的小伙伴们有非常好的帮助,需要的朋友可以参考下
    2021-08-08
  • python得到一个excel的全部sheet标签值方法

    python得到一个excel的全部sheet标签值方法

    今天小编就为大家分享一篇python得到一个excel的全部sheet标签值方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • Django使用paginator插件实现翻页功能的实例

    Django使用paginator插件实现翻页功能的实例

    今天小编就为大家分享一篇关于Django使用paginator插件实现翻页功能的实例,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2018-10-10
  • PYTHON绘制雷达图代码实例

    PYTHON绘制雷达图代码实例

    这篇文章主要介绍了PYTHON绘制雷达图代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-10-10
  • Python 获取今天任意时刻的时间戳的方法

    Python 获取今天任意时刻的时间戳的方法

    本文主要介绍了Python 获取今天任意时刻的时间戳的方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧<BR>
    2022-06-06
  • Python数据报表之Excel操作模块用法分析

    Python数据报表之Excel操作模块用法分析

    这篇文章主要介绍了Python数据报表之Excel操作模块用法,结合实例形式分析了XlsxWriter模块的功能及简单使用方法,需要的朋友可以参考下
    2019-03-03
  • python浅析守护线程与非守护线程的区别与使用

    python浅析守护线程与非守护线程的区别与使用

    守护线程,又称后台线程,它是在后台运行的,如果所有前台线程都死亡,那么后台线程就会自动死亡,本章我们来了解守护线程与非守护线程,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习吧
    2022-08-08
  • Python3转换html到pdf的不同解决方案

    Python3转换html到pdf的不同解决方案

    今天小编就为大家分享一篇关于Python3转换html到pdf的不同解决方案,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2019-03-03
  • 打印出python 当前全局变量和入口参数的所有属性

    打印出python 当前全局变量和入口参数的所有属性

    打印出python 当前全局变量和入口参数的所有属性的实现代码。
    2009-07-07

最新评论