Java如何获取文件夹下所有压缩包下指定文件

 更新时间:2024年09月26日 08:52:23   作者:java李杨勇  
在Java中,通过遍历文件夹并对压缩包进行解析,可以实现提取指定文件的功能,如文档、PDF等,该过程中可增加过滤条件来适应不同需求,例如文件类型或文件名过滤,该方法适用于处理大量数据时的文件管理和数据提取

Java获取文件夹下所有压缩包下指定文件

 
import java.io.*;
import java.nio.charset.Charset;
import java.util.Enumeration;
import java.util.zip.*;
 
/**
 * Created by LiYangYong on 2023/6/8
 */
public class WordDocExtractor {
    public static void main(String[] args) {
        String sourceDir = "D:\\李阳勇个人java相关\\安卓"; // 压缩包所在目录
        String targetDir = "D:\\李阳勇个人java相关\\directory"; // 目标目录
 
        File dir = new File(sourceDir);
        if (!dir.isDirectory()) {
            System.out.println("Invalid source directory.");
            return;
        }
 
        File[] files = dir.listFiles(new FilenameFilter() {
            @Override
            public boolean accept(File dir, String name) {
                return name.toLowerCase().endsWith(".zip") || name.toLowerCase().endsWith(".rar");
            }
        });
 
        for (File file : files) {
            String archiveName = file.getName();
            String archivePath = file.getAbsolutePath();
            System.out.println("Processing archive: " + archiveName);
 
            // 使用指定的字符集打开压缩文件
            try (ZipFile zipFile = new ZipFile(file, Charset.forName("GBK"))) {
                // 获取压缩文件中的所有条目
                Enumeration<? extends ZipEntry> entries = zipFile.entries();
                // 遍历所有条目
                while (entries.hasMoreElements()) {
                    ZipEntry entry = entries.nextElement();
                    String entryName = entry.getName();
                    // 如果条目是以 .doc 或 .docx 结尾的文档文件
                    if ((entryName.toLowerCase().endsWith(".doc") || entryName.toLowerCase().endsWith(".docx"))) {
                        // 如果文件名不包含 "数据库文档"、"开发文档"、"开放文档",且包含 "论文"
                        if (!entryName.contains("数据库文档") && !entryName.contains("开发文档") && !entryName.contains("开放文档") && entryName.contains("论文")) {
                            // 获取文档文件名
                            String docName = entryName.substring(entryName.lastIndexOf('/') + 1);
                            // 拼接目标路径
                            String targetPath = targetDir + "/" + archiveName + "_" + docName;
                            // 去掉文件名中的 .zip 后缀
                            targetPath = targetPath.replace(".zip", "");
                            // 输出拷贝信息
                            System.out.println("Copying " + entryName + " to " + targetPath);
                            // 从压缩文件中读取文档文件内容,并写入目标文件
                            try (InputStream inputStream = zipFile.getInputStream(entry);
                                 OutputStream outputStream = new FileOutputStream(targetPath)) {
                                byte[] buffer = new byte[1024];
                                int length;
                                while ((length = inputStream.read(buffer)) > 0) {
                                    outputStream.write(buffer, 0, length);
                                }
                            }
                        }
                    }
                }
            } catch (IOException e) {
                e.printStackTrace();
            }
        }
    }
}

实现效果

中间可以自己加一些过滤条件来满足各种需求。

不管是文档或其他pdf等

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • 使用Java编写一个字符脱敏工具类

    使用Java编写一个字符脱敏工具类

    这篇文章主要为大家详细介绍了如何使用Java编写一个字符脱敏工具类,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
    2025-05-05
  • SpringBoot项目的logback日志配置(包括打印mybatis的sql语句)

    SpringBoot项目的logback日志配置(包括打印mybatis的sql语句)

    这篇文章主要介绍了SpringBoot项目的logback日志配置(包括打印mybatis的sql语句),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-09-09
  • 一文带你学习Java多维数组的使用技巧

    一文带你学习Java多维数组的使用技巧

    Java作为一门广泛应用于各行各业的开发语言,具有丰富的数据类型支持,其中多维数组是其重要的一种,多维数组可以更加方便地组织数据,提高Java应用程序的效率,本文将为大家介绍Java中多维数组的基本概念和常用操作,助力读者更好地掌握多维数组的使用技巧
    2023-11-11
  • spring boot使用sonarqube来检查技术债务

    spring boot使用sonarqube来检查技术债务

    今天小编就为大家分享一篇关于spring boot使用sonarqube来检查技术债务,小编觉得内容挺不错的,现在分享给大家,具有很好的参考价值,需要的朋友一起跟随小编来看看吧
    2018-12-12
  • 详解SpringBoot如何统一后端返回格式

    详解SpringBoot如何统一后端返回格式

    今天我们来聊一聊在基于SpringBoot前后端分离开发模式下,如何友好的返回统一的标准格式以及如何优雅的处理全局异常,感兴趣的可以了解一下
    2021-07-07
  • Java构建乘积数组的方法

    Java构建乘积数组的方法

    这篇文章主要为大家详细介绍了Java构建乘积数组的方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-03-03
  • 最长重复子数组 findLength示例详解

    最长重复子数组 findLength示例详解

    今天给大家分享一道比较常问的算法面试题,最长重复子数组 findLength,文中给大家分享解题思路,结合示例代码介绍的非常详细,需要的朋友参考下吧
    2023-08-08
  • SpringBoot底层注解超详细介绍

    SpringBoot底层注解超详细介绍

    这篇文章主要介绍了SpringBoot底层注解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习吧
    2022-09-09
  • Java实战之用Spring开发条形码和验证码

    Java实战之用Spring开发条形码和验证码

    这篇文章主要介绍了Java实战之用Spring开发条形码和验证码,文中有非常详细的代码示例,对正在学习java的小伙伴们有非常好的帮助,需要的朋友可以参考下
    2021-04-04
  • java获得mysql和oracle链接的类

    java获得mysql和oracle链接的类

    这篇文章主要介绍了java获得mysql和oracle链接的类,可实现基于jdbc的mysql与oracle数据库连接,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-07-07

最新评论