python 删除大文件中的某一行(最有效率的方法)

 更新时间:2017年08月19日 09:33:15   投稿:jingxian  
下面小编就为大家带来一篇python 删除大文件中的某一行(最有效率的方法)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧

用 python 处理一个文本时,想要删除其中中某一行,常规的思路是先把文件读入内存,在内存中修改后再写入源文件。

但如果要处理一个很大的文本,比如GB级别的文本时,这种方法不仅需要占用很大内存,而且一次性读入内存时耗费时间,还有可能导致内存溢出。

所以,需要用另外一个思路去处理。

我们可以使用 open() 方法把需要修改的文件打开为两个文件,然后逐行读入内存,找到需要删除的行时,用后面的行逐一覆盖。实现方式见以下代码。

with open('file.txt', 'r') as old_file:
  with open('file.txt', 'r+') as new_file:

    current_line = 0

    # 定位到需要删除的行
    while current_line < (del_line - 1):
      old_file.readline()
      current_line += 1

    # 当前光标在被删除行的行首,记录该位置
    seek_point = old_file.tell()

    # 设置光标位置
    new_file.seek(seek_point, 0)

    # 读需要删除的行,光标移到下一行行首
    old_file.readline()
    
    # 被删除行的下一行读给 next_line
    next_line = old_file.readline()

    # 连续覆盖剩余行,后面所有行上移一行
    while next_line:
      new_file.write(next_line)
      next_line = old_file.readline()

    # 写完最后一行后截断文件,因为删除操作,文件整体少了一行,原文件最后一行需要去掉
    new_file.truncate()

以上这篇python 删除大文件里的某一行(最有效率的方法)就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • PyTorch上实现卷积神经网络CNN的方法

    PyTorch上实现卷积神经网络CNN的方法

    本篇文章主要介绍了PyTorch上实现卷积神经网络CNN的方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-04-04
  • 基于Python爬虫采集天气网实时信息

    基于Python爬虫采集天气网实时信息

    这篇文章主要介绍了基于Python爬虫采集天气网实时信息,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-06-06
  • Python Selenium弹窗处理操作指南

    Python Selenium弹窗处理操作指南

    我们做项目经常会遇到弹出框,下面这篇文章主要给大家介绍了关于Python Selenium弹窗处理的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-06-06
  • Python获取指定字符前面的所有字符方法

    Python获取指定字符前面的所有字符方法

    下面小编就为大家分享一篇Python获取指定字符前面的所有字符方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-05-05
  • Paddle模型性能分析工具Profiler定位瓶颈点优化程序详解

    Paddle模型性能分析工具Profiler定位瓶颈点优化程序详解

    这篇文章主要为大家介绍了Paddle模型性能分析工具Profiler定位瓶颈点优化程序详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-03-03
  • python实现根据ip地址反向查找主机名称的方法

    python实现根据ip地址反向查找主机名称的方法

    这篇文章主要介绍了python实现根据ip地址反向查找主机名称的方法,涉及Python使用socket解析IP的相关技巧,非常具有实用价值,需要的朋友可以参考下
    2015-04-04
  • python实现KNN分类算法

    python实现KNN分类算法

    这篇文章主要为大家详细介绍了python实现KNN分类算法,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-10-10
  • 使用gunicorn部署django项目的问题

    使用gunicorn部署django项目的问题

    这篇文章主要介绍了使用gunicorn部署django项目,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-12-12
  • 浅谈Python中的可变对象和不可变对象

    浅谈Python中的可变对象和不可变对象

    下面小编就为大家带来一篇浅谈Python中的可变对象和不可变对象。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-07-07
  • Python+radar实现随机日期时间的生成

    Python+radar实现随机日期时间的生成

    Python有广泛丰富的第三方库,在没有特殊定制下,避免了重复造轮子。本文将利用radar库实现生成随机的日期或时间,文中的示例代码讲解详细,感兴趣的可以了解一下
    2022-05-05

最新评论