基于Java实现遍历文件目录并去除中文文件名

 更新时间:2024年03月18日 09:01:23   作者:爱码少年  
这篇文章主要为大家详细介绍了如何使用Java实现遍历文件目录并去除中文文件名,文中的示例代码讲解详细,有需要的小伙伴可以参考一下

一、原始需求

需要遍历文件目录及其子目录,找出包含中文字符的文件名,将中文字符去除。

二、maven依赖

pom.xml

		<dependency>
			<groupId>org.apache.commons</groupId>
			<artifactId>commons-lang3</artifactId>
			<version>3.10</version>
		</dependency>
		<dependency>
			<groupId>commons-io</groupId>
			<artifactId>commons-io</artifactId>
			<version>2.5</version>
		</dependency>
		
        <!--Test-->
		<dependency>
			<groupId>org.junit.jupiter</groupId>
			<artifactId>junit-jupiter-api</artifactId>
			<version>5.5.2</version>
			<scope>test</scope>
		</dependency>

三、核心代码

注意处理:

  • 中文路径(如:E:/test/a/测试/b)
  • 全中文文件(如:E:/test/a/测试文本.txt)
  • 无后缀文件(如:E:/test/a/b/测试文件)
import java.io.File;
import java.util.List;
import java.util.stream.Collectors;

import org.apache.commons.io.FileUtils;
import org.apache.commons.lang3.RegExUtils;
import org.apache.commons.lang3.StringUtils;
import org.apache.commons.lang3.time.DateFormatUtils;
import org.junit.jupiter.api.Test;

import lombok.extern.slf4j.Slf4j;

@Slf4j
public class FileTest
{
    /**
     * 中文正则
     */
    private String REGEX_CHINESE = "[\u4e00-\u9fa5]";
    
    /**
     * 移除中文文件名
     */
    @Test
    public void removeChineseTest()
    {
        File dir = new File("E:\\test");
        List<File> files = FileUtils.listFiles(dir, null, true).stream().filter(f -> f.isFile()).collect(Collectors.toList());
        files.stream().forEach(file -> {
            String srcName = file.getName();
            String destName = RegExUtils.removePattern(srcName, REGEX_CHINESE);
            if (!StringUtils.equals(srcName, destName))
            {
                // 处理全中文和无后缀文件
                if (StringUtils.startsWith(destName, ".") || StringUtils.isBlank(destName))
                {
                    destName = DateFormatUtils.format(System.currentTimeMillis(), "yyyyMMdd") + destName;
                }
                
                // 文件前后缀
                String prefix = StringUtils.substringBeforeLast(destName, ".");
                String suffix = StringUtils.substring(destName, prefix.length());
                
                // 处理重名
                int index = 1;
                File destFile = new File(file.getParent() + File.separator + destName);
                while (destFile.exists())
                {
                    destName = String.format("%s_%s%s", prefix, index++, suffix);
                    destFile = new File(file.getParent() + File.separator + destName);
                }
                Boolean result = file.renameTo(destFile);
                log.info("{} ---> {}, ====== result: {}", file.getAbsolutePath(), destFile.getAbsolutePath(), result);
            }
        });
    }
}

四、运行结果

2024-03-15 19:13:37.983 [main] INFO  com.fly.files.FileTest - E:\test\a\b\_内容20230676190031.jpg ---> E:\test\a\b\_20230676190031.jpg, ====== result: true
2024-03-15 19:13:37.986 [main] INFO  com.fly.files.FileTest - E:\test\a\文件_20230676190035.jpg ---> E:\test\a\_20230676190035.jpg, ====== result: true
2024-03-15 19:13:37.987 [main] INFO  com.fly.files.FileTest - E:\test\中文_20230676154641.jpg ---> E:\test\_20230676154641.jpg, ====== result: true
2024-03-15 19:13:37.988 [main] INFO  com.fly.files.FileTest - E:\test\哈哈_20230676154717.png ---> E:\test\_20230676154717.png, ====== result: true
2024-03-15 19:13:37.988 [main] INFO  com.fly.files.FileTest - E:\test\嗯嗯_20230676190039.jpg ---> E:\test\_20230676190039.jpg, ====== result: true
2024-03-15 19:13:37.989 [main] INFO  com.fly.files.FileTest - E:\test\测试_20230676154623.jpg ---> E:\test\_20230676154623.jpg, ====== result: true
2024-03-15 19:13:37.989 [main] INFO  com.fly.files.FileTest - E:\test\维修_20230676155003.jpg ---> E:\test\_20230676155003.jpg, ====== result: true

到此这篇关于基于Java实现遍历文件目录并去除中文文件名的文章就介绍到这了,更多相关Java遍历文件目录内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • idea日志乱码和tomcat日志乱码问题的解决方法

    idea日志乱码和tomcat日志乱码问题的解决方法

    这篇文章主要介绍了idea日志乱码和tomcat日志乱码问题的解决方法,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-08-08
  • java批量下载将多个文件(minio中存储)压缩成一个zip包代码示例

    java批量下载将多个文件(minio中存储)压缩成一个zip包代码示例

    在Java应用程序中有时我们需要从多个URL地址下载文件,并将这些文件打包成一个Zip文件进行批量处理或传输,这篇文章主要给大家介绍了关于java批量下载将多个文件(minio中存储)压缩成一个zip包的相关资料,需要的朋友可以参考下
    2023-11-11
  • 如何将eclipse项目导入到idea的方法步骤(图文)

    如何将eclipse项目导入到idea的方法步骤(图文)

    这篇文章主要介绍了如何将eclipse项目导入到idea的方法步骤,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-03-03
  • SpringBoot通过token实现用户互踢功能(具体实现)

    SpringBoot通过token实现用户互踢功能(具体实现)

    所谓token,既用户能够在一定时间内证明自己身份的一长串字符串,这篇文章主要介绍了SpringBoot通过token实现用户互踢功能,需要的朋友可以参考下
    2024-04-04
  • 解决JMap抓取heap使用统计信息报错的问题

    解决JMap抓取heap使用统计信息报错的问题

    这篇文章主要介绍了解决JMap抓取heap使用统计信息报错的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-12-12
  • Java解析使用JSON的多种方法

    Java解析使用JSON的多种方法

    使用JSON作为数据传输,在浏览器端非常方便。JSON去除了所有JavaScript执行代码,只保留对象格式,而且JSON天生适合JavaScript处理,所以,绝大多数REST API都选择JSON作为数据传输格式。现在问题来了:使用Java如何对JSON进行读写?
    2022-12-12
  • 一次Spring无法启动的问题排查实战之字节码篇

    一次Spring无法启动的问题排查实战之字节码篇

    最近学习了spring相关知识,公司项目也用到了spring,下面这篇文章主要给大家介绍了一次Spring无法启动的问题排查实战之字节码篇的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
    2022-04-04
  • Java消息队列中的Kafka如何保证幂等性

    Java消息队列中的Kafka如何保证幂等性

    这篇文章主要介绍了Java消息队列中的Kafka如何保证幂等性,Kafka是一种消息队列,主要用来处理大量数据状态下的消息队列,一般用来做日志的处理,既然是消息队列,那么Kafka也就拥有消息队列的相应的特性了,需要的朋友可以参考下
    2023-07-07
  • 5分钟让你快速掌握java8 stream常用开发技巧

    5分钟让你快速掌握java8 stream常用开发技巧

    这篇文章主要给大家介绍了关于java8 stream常用开发技巧的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-12-12
  • 浅谈java中BigDecimal类的简单用法

    浅谈java中BigDecimal类的简单用法

    这篇文章主要介绍了浅谈java中BigDecimal类的简单用法,在开发时,如果我们需要精确计算的结果,必须使用BigDecimal类来操作。感兴趣的话可以了解一下
    2020-07-07

最新评论