mysql中迅速插入百万条测试数据的方法

 更新时间:2012年04月14日 02:17:48   作者:  
最近想到创建一个大量数据的测试环境,于是找了一下怎么插入100W条数据,我用的是20个字段
对比一下,首先是用 mysql 的存储过程弄的:
复制代码 代码如下:

mysql>delimiter $
mysql>SET AUTOCOMMIT = 0$$
mysql> create procedure test()
begin
declare i decimal (10) default 0 ;
dd:loop
INSERT INTO `million` (`categ_id`, `categ_fid`, `SortPath`, `address`, `p_identifier`, `pro_specification`, `name`, `add_date`, `picture_url`, `thumb_url`, `is_display_front`, `create_html_time`, `hit`, `buy_sum`, `athor`, `templete _style`, `is_hot`, `is_new`, `is_best`) VALUES
(268, 2, '0,262,268,', 0, '2342', '423423', '123123', '2012-01-09 09:55:43', 'upload/product/20111205153432_53211.jpg', 'upload/product/thumb_20111205153432_53211.jpg', 1, 0, 0, 0, 'admin', '0', 0, 0, 0);
commit;
set i = i+1;
if i= 1000000 then leave dd;
end if;
end loop dd ;
end;$
mysql>delimiter ;
mysql> call test;

结果
mysql> call test; Query OK, 0 rows affected (58 min 30.83 sec)
非常耗时。
于是我又找了一个方法
先用PHP代码生成数据,再导入:
复制代码 代码如下:

<?php
$t=mktime();
set_time_limit(1000);
$myFile="e:/insert.sql";
$fhandler=fopen($myFile,'wb');
if($fhandler){
$sql="268\t2\t'0,262,268,'\t0\t '2342'\t'423423'\t'123123'\t'23423423'\t'2012-01-09 09:55:43'\t'upload/product/20111205153432_53211.jpg'\t'upload/product/thumb_20111205153432_53211.jpg'\tNULL\tNULL\t38\t'件'\t''\t123\t123\t0";
$i=0;
while($i<1000000)//1,000,000
{
$i++;
fwrite($fhandler,$sql."\r\n");
}
echo"写入成功,耗时:",mktime()-$t;
}

然后再导入
复制代码 代码如下:

LOAD DATA local INFILE 'e:/insert.sql' INTO TABLE tenmillion(`categ_id`, `categ_fid`, `SortPath`, `address`, `p_identifier`, `pro_specification`, `name`, `description`, `add_date`, `picture_url`, `thumb_url`, `shop_url`, `shop_thumb_url`, `brand_id`, `unit`, `square_meters_unit`, `market_price`, `true_price`, `square_meters_price`);

注意字段不再以逗号分割,以\t分割,条记录以\r\n分割。结果我插入10次数据,100W平均只要1分钟搞定。
第二种方式mysql中间省略了很多中间步骤,导致插入速度远胜于第一种,具体的没有研究。

快速生成mysql上百万条测试数据
由于测试需要,原表中只有1万条数据,现在随机复制插入记录,快速达到100万条。

itemid是主键。

运行几次下面代码。随机取1000条插入,

insert into downitems (chid,catid,softid,....)
SELECT chid,catid,softid... FROM `downitems` WHERE itemid >= (SELECT floor(RAND() * (SELECT MAX(itemid) FROM `downitems`))) ORDER BY itemid LIMIT 1000;

然后可以修改1000的数字了。改为5000或者1万。很快可以达到100万的数据量了。

相关文章

  • MySQL数据库INSERT、UPDATE、DELETE以及REPLACE语句的用法详解

    MySQL数据库INSERT、UPDATE、DELETE以及REPLACE语句的用法详解

    本篇文章是对MySQL数据库INSERT、UPDATE、DELETE以及REPLACE语句的用法进行了详细的分析介绍,需要的朋友参考下
    2013-06-06
  • MySQL 8.0用户和角色管理原理与用法详解

    MySQL 8.0用户和角色管理原理与用法详解

    这篇文章主要介绍了MySQL 8.0用户和角色管理,结合实例形式分析了MySQL 8.0用户和角色管理相关概念、功能、原理、用法及操作注意事项,需要的朋友可以参考下
    2020-04-04
  • MySQL 选择合适的存储引擎

    MySQL 选择合适的存储引擎

    这篇文章主要介绍了MySQL如何选择合适的存储引擎,帮助大家更好的理解和使用MySQL数据库,感兴趣的朋友可以了解下
    2020-09-09
  • 关于@NotNull注解失效的原因之一

    关于@NotNull注解失效的原因之一

    这篇文章主要介绍了关于@NotNull注解失效的原因之一,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-01-01
  • 解析Mysql Profiling的使用

    解析Mysql Profiling的使用

    本篇文章是对Mysql Profiling的使用进行了详细的分析介绍,需要的朋友参考下
    2013-06-06
  • MySQL学习第二天 安装和配置mysql winx64

    MySQL学习第二天 安装和配置mysql winx64

    MySQL学习第二天,主要为大家详细介绍了在Windows 64位操作系统下安装和配置MySQL的具体步骤,整理一份mysql winx64安装配置方法教程,感兴趣的小伙伴们可以参考一下
    2016-05-05
  • 解决ERROR 2003 (HY000): Can‘t connect to MySQL server on ‘localhost‘ (111)的问题

    解决ERROR 2003 (HY000): Can‘t connect to MySQL server 

    在Windows系统上使用Django连接Ubuntu虚拟机中的MySQL数据库时,遇到无法连接的问题,排查后发现是由于MySQL绑定的IP地址改变导致的,下面就来介绍一下问题解决,感兴趣的可以了解一下
    2024-09-09
  • Mysql提升大数据表拷贝效率的解决方案

    Mysql提升大数据表拷贝效率的解决方案

    这篇文章主要给大家介绍了关于Mysql提升大数据表拷贝效率的解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2018-09-09
  • Mysql大小写敏感的问题

    Mysql大小写敏感的问题

    这篇文章主要介绍了Mysql大小写敏感的问题的相关资料,需要的朋友可以参考下
    2015-03-03
  • MySQL分布式事务xa的介绍与使用小结

    MySQL分布式事务xa的介绍与使用小结

    xa指的是分布式事务,传统的事务针对的是单机MySQL,本文主要介绍了MySQL分布式事务xa的介绍与使用小结,有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助
    2024-07-07

最新评论