Java分批将List数据导入数据库的解决过程

 更新时间:2023年08月24日 08:35:15   作者:Dream_飞翔  
这篇文章主要给大家介绍了关于Java分批将List数据导入数据库的解决过程,文中通过代码示例介绍的非常详细,对大家学习或者使用java具有一定的参考学习价值,需要的朋友可以参考下

一、项目场景:

在工作中的一个需求中,需要创建一张新的表,表格的初始数据需要从之前的多张表格中联查出来并且添加到当前表格中。由于在生产环境中数据量级达到了百万级别,因此在插入数据到MySQL中时需要分批次进行导入,我写了三种方法进行数据的导入,最后采用了第三种方法来进行数据导入,将实现过程在此进行记录。

在文章中,我将使用User来作为示例对象用于演示

二、解决方案:

1. MyBatisPlus原生方法导入

// 获取到要插入数据库的集合,数据量很大
List<User> list = new ArrayList<>();
// 插入数据到MySQL中
userService.saveBatch(list);

2. List分组导入

(1)UserServiceImpl类中导入方法

@Service
public class UserServiceImpl extends ServiceImpl<UserMapper, User> implements IUserService {
	@Autowired
	private UserMapper userMapper;
	@Override
	public void insert() {
    	// 通过一系列操作获取到要插入的集合,在此使用list代替
    	List<User> list = new ArrayList<>();
    	// 每次插入的数量
    	int batchSize = 1000;
    	// 计算需要分多少批插入数据库
    	int batch = list.size() / batchSize;
    	// 计算最后一批的大小
    	int lastSize = list.size() % batchSize;
    	// 将筛选出的结果分批次添加到表中
    	for (int i = batchSize; i <= batch * batchSize; i = i + batchSize) {
        	// 截取本次要添加的数据
        	List<User> insertList = list.subList(i - batchSize, i);
        	// 添加本批次数据到数据库中
        	userMapper.batchInsert(insertList);
    	}
    	// 最后一批元素的大小是否为0
    	if (lastSize != 0) {
        	// 如果元素有剩余则将所有元素作为一个子列表一次性插入
        	List<User> lastList = list.subList(batchSize * batch, list.size());
        	// 添加集合到数据库中
        	userMapper.batchInsert(lastList);
    	}
	}
}

代码解析:

先将列表分成每个1000个元素一批的子列表,然后使用自定义的 batchInsert() 方法对子列表进行批量插入操作。如果列表大小不是 1000 的倍数,则将剩余元素全部一次性插入。具体实现细节如下:

  • 首先定义每一批次的插入数量 batchSize ,算出需要分几批插入变量 batch ,以及最后一批插入数量(集合中元素总量如果不是1000倍数时最后一批的剩余数量)的大小 lastSize 。
  • 通过 for 循环,将列表分成每个 1000 个元素一批的子列表,随后使用 subList() 方法来获取当前批次要插入的元素
  • 对于每一批要插入的子列表,使用自定义的 batchInsert() 方法进行批量插入操作。
  • 判断最后一批的大小 lastSize 是否为 0,如果不为 0,则使用 subList() 方法将剩余所有元素作为一个子列表进行一次性插入。

在这里对最后一批插入元素时,下标为什么要使用 batchSize(每一批次的大小) * batch(批次数量) 来作为起始变量进行解析:

解析: 使用 batchSize * batch 作为集合的起始位置,是因为在 for 循环中已经将前 a 个元素作为起始位置插入到数据库中了,因此下一个起始位置应该是 batchSize 的倍数,即 batchSize * batch 。这样可以避免重复插入已经插入过的元素

(2)UserMapper数据持久化接口

将集合作为参数传递到Mapper层中

/**
 * 用户数据持久化接口
 *
 * @author Dream_飞翔
 * @since 2023/5/16
 */
public interface UserMapper extends BaseMapper<User> {
	/**
     * 添加指定集合内的数据到数据库中
     *
     * @param insertList 要添加的内容
     * @return 受影响的行数
     */
    Integer batchInsert(@Param("insertList") List<User> insertList);
}

(3)UserMapper.xml映射文件

<?xml version="1.0" encoding="utf-8" ?>
<!DOCTYPE mapper PUBLIC "-//mybatis.org//DTD Mapper 3.0//EN"
        "http://mybatis.org/dtd/mybatis-3-mapper.dtd" >
<mapper namespace="com.zrkizzy.data.mapper.UserMapper">
	<!-- 批量添加数据到数据库中 -->
	<insert id="batchInsert">
        INSERT INTO tb_user (id, username, password)
        VALUES
        <foreach collection ="userList" item="user" separator =",">
            (#{user.id}, #{user.username}, #{user.password})
        </foreach>
    </insert>
</mapper>

3. 多线程分批次插入

在第二种方法中,使用了分批次处理的数据导入方式,但是在数据量特别大的情况下,单线程的压力还是很大,因此使用多线程是比较好的一种方式。

(1)UserServiceImpl类中导入方法

@Service
public class UserServiceImpl extends ServiceImpl<UserMapper, User> implements IUserService {
	@Autowired
	private UserMapper userMapper;
	@Override
	public void insert() {
    	// 通过一系列操作获取到要插入的集合,在此使用list代替
    	List<User> list = new ArrayList<>();
        // 获取虚拟机可用的最大处理器数量
        int availableProcessors = Runtime.getRuntime().availableProcessors();
        // 获取要添加的数据集合大小
        int total = list.size();
        // 每次插入的数量
        int batchSize = 1000;
        // 计算需要分多少批插入数据库(向上取整)
        int totalBatch = (total + batchSize - 1) / batchSize;
        // 手动创建线程池
        ExecutorService executor = new ThreadPoolExecutor(
                // 线程池核心线程数量
                availableProcessors,
                // 线程池最大数量
                availableProcessors + 1000,
                // 空闲线程存活时间
                1000,
                // 时间单位
                TimeUnit.MILLISECONDS,
                // 线程池所使用的缓冲队列
                new ArrayBlockingQueue<>(100),
                // 线程池对拒绝任务的处理策略
                new ThreadPoolExecutor.CallerRunsPolicy());
        // 将筛选出的结果分批次添加到表中
        for (int batchIndex = 0; batchIndex < totalBatch; batchIndex++) {
            // 当前插入批次的起始索引
            int startIndex = batchIndex * batchSize;
            // 当前插入批次的结束索引
            int endIndex = Math.min((batchIndex + 1) * batchSize, total);
            // 截取本次要添加的数据
            List<LuckyDrawHistory> insertList = list.subList(startIndex, endIndex);
            // 将每个批次的插入逻辑封装成一个Runnable对象
            Runnable task = () -> {
                // 添加本批次数据到数据库中
                userMapper.batchInsert(insertList);
            };
            // 提交添加任务
            executor.submit(task);
        }
        // 关闭线程池释放资源
        executor.shutdown();
    }
}

总结 

到此这篇关于Java分批将List数据导入数据库的文章就介绍到这了,更多相关Java List数据导入数据库内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Spring P标签的使用详解

    Spring P标签的使用详解

    这篇文章主要介绍了Spring P标签的使用详解,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2021-08-08
  • mybatis-plus动态数据源读写分离方式

    mybatis-plus动态数据源读写分离方式

    在分布式项目开发中,动态数据源的配置与使用至关重要,通过创建DynamicDatasourceService,实现数据源的动态添加与调用,有效管理主从库操作,减轻数据库压力,此外,通过配置类与@DS注解,实现了灵活的分库查询功能,为高效处理数据提供了强有力的支持
    2024-10-10
  • IDEA如何搭建Struts2项目

    IDEA如何搭建Struts2项目

    这篇文章主要介绍了IDEA如何搭建Struts2项目,文中通过图文介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2018-02-02
  • SpringBoot超详细讲解自动配置原理

    SpringBoot超详细讲解自动配置原理

    在进行项目编写前,我们还需要知道一个东西,就是SpringBoot对我们的SpringMVC还做了哪些配置,包括如何扩展,如何定制,只有把这些都搞清楚了,我们在之后使用才会更加得心应手
    2022-06-06
  • Spring Boot 使用WebAsyncTask异步返回结果

    Spring Boot 使用WebAsyncTask异步返回结果

    这篇文章主要介绍了Spring Boot 使用WebAsyncTask异步返回结果的相关资料,需要的朋友可以参考下
    2018-02-02
  • Java实现学生管理系统(控制台版本)

    Java实现学生管理系统(控制台版本)

    这篇文章主要为大家详细介绍了如何利用Java语言实现控制台版本的学生管理系统,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-06-06
  • Java 守护线程_动力节点Java学院整理

    Java 守护线程_动力节点Java学院整理

    Java语言机制是构建在JVM的基础之上的,意思是Java平台把操作系统的底层给屏蔽起来,所以它可以在它自己的虚拟的平台里面构造出对自己有利的机制,而语言或者说平台的设计者多多少少是收到Unix思想的影响,而守护线程机制又是对JVM这样的平台凑合,于是守护线程应运而生
    2017-05-05
  • IDEA新建JAVA项目简单图文教程

    IDEA新建JAVA项目简单图文教程

    这篇文章主要给大家介绍了关于IDEA新建JAVA项目的相关资料,IDEA是现在java中最为常用的编译器,所以如何使用IDEA来创建java项目呢,这里给大家总结下,需要的朋友可以参考下
    2023-08-08
  • IDEA 使用 SpotBugs 找出你代码中的bug问题

    IDEA 使用 SpotBugs 找出你代码中的bug问题

    这篇文章主要介绍了IDEA 使用 SpotBugs 找出你代码中的bug问题,重点给大家介绍SpotBugs 在 idea 中的安装和使用,感兴趣的朋友跟随小编一起看看吧
    2021-07-07
  • 详解springboot+aop+Lua分布式限流的最佳实践

    详解springboot+aop+Lua分布式限流的最佳实践

    这篇文章主要介绍了详解springboot+aop+Lua分布式限流的最佳实践,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-06-06

最新评论