Python如何查找文件夹中含有指定关键字的文件

 更新时间:2023年08月22日 10:27:39   作者:进阶的小幺  
这篇文章主要介绍了Python如何查找文件夹中含有指定关键字的文件问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

Python查找文件夹中含有指定关键字的文件

查找文件夹中含有指定关键字的文件,并将该文件复制到另一个文件夹中

'''
查找文件夹中含有指定关键字的文件,并将该文件复制到另一个文件夹中
'''
import os
import shutil
def copyfile_base_keyword_in_file(file_pathname):
    # 遍历该目录下的所有图片文件
    for filename in os.listdir(file_pathname):
        #path = os.path.join(r'D:/copykeywordw/notations', filename)    
        path = os.path.join(file_pathname, filename)
        f = open(path, 'r')
        lines = f.readlines()
        for lines in lines:
            if 'face_with_mask' in lines:  # 此处关键词为'face_with_mask',根据自己需求更改
                shutil.copy(src_dir_path + '/' + filename, to_dir_path + '/' + filename)
copyfile_base_keyword_in_file(r'D:/copykeywordw/notations')     # 文件夹目录

Python查找文件夹下含有特定关键字的文档word 查找word中的关键词等

应用场景

我们学校搞综测会发放一个压缩包,里面含有各种活动的加分证明,想要快速且不遗漏的找到自己的名字的话,就可以来跑一下这个py啦!

环境:jupyter

要求:事先安装 pip install python-docx

代码修改处:文件存放根目录和要搜索的关键词

#coding=utf-8
from docx import Document
import os,sys
def search_word(filename,word):
    #打开文档
    document = Document(filename)
    #读取每段资料
    pa=document.paragraphs
    #拼接每一段的内容
    para_list = []
    for para in pa:
        para_list.append(para.text)
    #合并字符串
    file_text = ''.join(para_list)
    if word in file_text:
        print("find file for {}:".format(word))
        print(filename)
process_list=[]
def get_process_files(root_dir):
    """process all files in directory"""
    cur_dir=os.path.abspath(root_dir)
    file_list=os.listdir(cur_dir)
    for file in file_list:
        fullfile=cur_dir+"\\"+file
        if os.path.isfile(fullfile):
            process_list.append(fullfile)
        elif os.path.isdir(fullfile):
            dir_extra_list=get_process_files(fullfile)
    return process_list
def find_files(root_dir,word):
    get_process_files(root_dir)
    print("总计文件数:{}".format(len(process_list)))
    for files in process_list:
        search_word(files, word)
    return
if __name__=='__main__':
    #此处修改自己存放文件位置和名字
    #文件根目录
    root_dir=r'D:\beizhai\study\大四\综测\【2021】XX学院综测公示文件'
    #要搜索的关键字
    word="beizhai"
    count=0
    try:
        find_files(root_dir,word)
    except:
        pass

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • 用Python Flask创建简洁高效的URL短链接服务

    用Python Flask创建简洁高效的URL短链接服务

    本文介绍了如何使用Python Flask框架创建URL短链接服务。通过详细的步骤和代码示例,读者将学会如何搭建一个高效的URL缩短服务,包括生成短链接、重定向、还原长链接等功能。本文还介绍了如何使用Redis数据库实现短链接的存储和管理和如何优化短链接的访问速度和可靠性
    2023-04-04
  • Python3内置模块pprint让打印比print更美观详解

    Python3内置模块pprint让打印比print更美观详解

    这篇文章主要给大家介绍了关于Python3内置模块pprint让打印比print更美观的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用Python3具有一定的参考学习价值,需要的朋友们下面来一起学习学习吧
    2019-06-06
  • Python中的单下划线和双下划线使用场景详解

    Python中的单下划线和双下划线使用场景详解

    这篇文章主要介绍了Python中的单下划线和双下划线使用场景详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-09-09
  • Numpy np.array()函数使用方法指南

    Numpy np.array()函数使用方法指南

    numpy是一个在Python中做科学计算的基础库,重在数值计算,也是大部分Python科学计算库的基础库,多用于大型、多维数据上执行数值计算,下面这篇文章主要给大家介绍了关于Numpy np.array()函数使用方法指南的相关资料,需要的朋友可以参考下
    2022-12-12
  • Python从Excel中读取日期一列的方法

    Python从Excel中读取日期一列的方法

    今天小编就为大家分享一篇Python从Excel中读取日期一列的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-11-11
  • 解决TensorFlow GPU版出现OOM错误的问题

    解决TensorFlow GPU版出现OOM错误的问题

    今天小编就为大家分享一篇解决TensorFlow GPU版出现OOM错误的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02
  • python基础_文件操作实现全文或单行替换的方法

    python基础_文件操作实现全文或单行替换的方法

    下面小编就为大家带来一篇python基础_文件操作实现全文或单行替换的方法。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-09-09
  • Python虚拟环境迁移的实现

    Python虚拟环境迁移的实现

    本文主要介绍了Python虚拟环境迁移的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-03-03
  • python字典多键值及重复键值的使用方法(详解)

    python字典多键值及重复键值的使用方法(详解)

    下面小编就为大家带来一篇python字典多键值及重复键值的使用方法(详解)。小编觉得挺不错的,现在就分享给大家,也给大家做个才参考。一起跟随小编过来看看吧
    2016-10-10
  • 利用Python如何实现一个小说网站雏形

    利用Python如何实现一个小说网站雏形

    这篇文章主要给大家介绍了关于利用Python如何实现一个小说网站雏形的相关资料,文中通过示例代码介绍的非常详细,对大家学习或者使用python具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2018-11-11

最新评论