Python如何从txt文件中提取特定数据

 更新时间:2023年08月17日 08:38:56   作者:六和七  
这篇文章主要给大家介绍了关于Python如何从txt文件中提取特定数据的相关资料,有时我们会遇到需要按行读取文本的情况,我们要读取txt文件获得数据,需要的朋友可以参考下

本段代码用于,想要从一段txt文件中只提取目标数据的情况。

代码:

def get_data(txt_path: str = '', epoch: int = 100, target: str = '', target_data_len: int = 5):
    num_list = []  # 将提取出来的数据保存到列表,并在最后返回
    data = open(txt_path, encoding="utf-8")  # 打开文件
    str1 = data.read()  # 将文件中读取到的内容转化为字符串
    data.close()  # 关闭文件
    for i in range(0, epoch):
        index = str1.find(target)  # 查找字符串str1中str2字符串的位置
        num_list.append(float(str1[index+len(target):index+len(target)+target_data_len]))  # 将需要的数据提取到列表中
        str1 = str1.replace(target, 'xxxx', 1)  # 替换掉已经查阅过的地方,' xxxx '表示替换后的内容,1表示在字符串中的替换次数为1
    return num_list

函数参数解释:

  • txt_path 文件路径
  • epoch 这份文本文件中要提取出的数据个数,默认100
  • target 目标数据的前缀
  • target_data_len 目标数据的长度,默认为5
    返回值,列表数据

使用举例:

txt文档内容:

x1:273   test3:477    y4:38489   y1:149   x2:423
x1:274   test3:475    y4:37956   y1:152   x2:422
x1:269   test3:473    y4:38156   y1:152   x2:421
x1:271   test3:471    y4:38156   y1:155   x2:418
x1:272   test3:467    y4:38056   y1:158   x2:416
x1:275   test3:466    y4:37956   y1:161   x2:415

使用:

data_path = "D:/program/test/double_camera_data/x_data.txt"
# 提取x1的数据
list_x1  = get_data(data_path, 6, target="x1:", target_data_len=3)
# 提取test3的数据
list_test3  = get_data(data_path, 6, target="test3:", target_data_len=3)
# 提取y4的数据
list_y4  = get_data(data_path, 6, target="y4:", target_data_len=6)
print(list_x1)
print(list_test3)
print(list_y4)

输出:

[273.0, 274.0, 269.0, 271.0, 272.0, 275.0]
[477.0, 475.0, 473.0, 471.0, 467.0, 466.0]
[38489.0, 37956.0, 38156.0, 38156.0, 38056.0, 37956.0]

附:Python 从不规则文本中提取有效信息

背景:从一个混有文字和多个表格的word文档里,提取表格中有效信息

代码:

from docx import Document
import numpy as np
import pandas as pd
#读取文件
doc = Document("文件名.docx")
#读取表格
tables = doc.tables
#print(len(tables))
rlt = []
flag = 0
for t in tables: #每一个表格
    rows = t.rows
    for r in rows: #每一行
        cols = r.cells
        for c in cols: #每一个单元格
            if flag != 0:
                rlt.append(c.text)
                flag = 0
                continue
            if c.text == "不动产所有权人" or c.text == "不动产权属证明" or c.text == "项目名称" or  c.text == "项目地址":
                flag = 1
nums = len(rlt)
rlt = np.array(rlt).reshape((nums//4,4))
#print(rlt)            
df = pd.DataFrame(rlt,columns= ["不动产所有权人" ,"不动产权属证明" ,"项目名称","项目地址"])
#print(df)
df.to_excel('rlt.xlsx')

总结

到此这篇关于Python如何从txt文件中提取特定数据的文章就介绍到这了,更多相关Python从txt文件提取数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 简单了解Python字典copy与赋值的区别

    简单了解Python字典copy与赋值的区别

    这篇文章主要介绍了简单了解Python字典copy与赋值区别,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-09-09
  • 使用python求斐波那契数列中第n个数的值示例代码

    使用python求斐波那契数列中第n个数的值示例代码

    这篇文章主要给大家介绍了关于使用python求斐波那契数列中第n个数的值的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者使用python具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2020-07-07
  • 详解pycharm连接不上mysql数据库的解决办法

    详解pycharm连接不上mysql数据库的解决办法

    这篇文章主要介绍了详解pycharm连接不上mysql数据库的解决办法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-01-01
  • 详解pytest实现mark标记功能详细介绍

    详解pytest实现mark标记功能详细介绍

    这篇文章主要介绍了详解pytest实现mark标记功能详细介绍,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-04-04
  • 浅谈PyQt5 的帮助文档查找方法,可以查看每个类的方法

    浅谈PyQt5 的帮助文档查找方法,可以查看每个类的方法

    今天小编就为大家分享一篇浅谈PyQt5 的帮助文档查找方法,可以查看每个类的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-06-06
  • Python中如何使用Matplotlib库绘制图形

    Python中如何使用Matplotlib库绘制图形

    Matplotlib是一个Python的2D绘图库,通过Matplotlib开发者可以仅需要几行代码,便可以生成绘图,直方图,功率谱,条形图,错误图,散点图等,这篇文章主要给大家介绍了Python中如何使用Matplotlib库绘制图形的相关资料
    2022-07-07
  • Python+Tkinter创建一个简单的闹钟程序

    Python+Tkinter创建一个简单的闹钟程序

    这篇文章主要为大家详细介绍了如何使用 Python 的 Tkinter 库创建一个简单的闹钟程序,它可以在指定的时间播放一个声音来提醒你,感兴趣的可以学习一下
    2023-04-04
  • 基于Python实现配置热加载的方法详解

    基于Python实现配置热加载的方法详解

    所谓的配置热加载,也就是说当服务收到配置更新消息之后,我们不用重启服务就可以使用最新的配置去执行任务。本文将介绍如何用Python实现配置热加载,需要的可以参考一下
    2022-07-07
  • Python入门教程(四十一)Python的NumPy数组索引

    Python入门教程(四十一)Python的NumPy数组索引

    这篇文章主要介绍了Python入门教程(四十一)Python的NumPy数组索引,数组索引是指使用方括号([])来索引数组值,numpy提供了比常规的python序列更多的索引工具,除了按整数和切片索引之外,数组可以由整数数组索引、布尔索引及花式索引,需要的朋友可以参考下
    2023-05-05
  • python执行shell并获取结果的详细示例

    python执行shell并获取结果的详细示例

    在Python中执行Shell命令并获取其结果,通常可以使用subprocess模块,这个模块允许我们启动新的进程,连接到它们的输入/输出/错误管道,并获取它们的返回码,下面是一个详细的示例,展示了如何使用subprocess.run()函数来执行Shell命令并获取其输出,需要的朋友可以参考下
    2024-07-07

最新评论