基于PHP读取TXT文件向数据库导入海量数据的方法

 更新时间:2013年04月23日 17:09:38   作者:  
本篇文章小编为大家介绍,基于PHP读取TXT文件向数据库导入海量数据的方法。需要的朋友参考下

有一个TXT文件,包含了10万条记录,格式如下:

列1       列2       列3   列4   列5
a    00003131    0    0    adductive#1 adducting#1 adducent#1
a    00003356    0    0    nascent#1
a    00003553    0    0    emerging#2 emergent#2
a    00003700    0.25    0    dissilient#1

……………………后面有10万条………………

需求是要导入数据库中,数据表的结构为

word_id   自动增量
word     【adductive#1 adducting#1 adducent#1】这一个TXT记录要转换为3个SQL记录
value     =第三列-第四列;如果=0,则此条记录略过不插入数据表

复制代码 代码如下:

<?php
    $file = 'words.txt';//10W条记录的TXT源文件
    $lines = file_get_contents($file);
    ini_set('memory_limit', '-1');//不要限制Mem大小,否则会报错
    $line=explode("\n",$lines);
    $i=0;
    $sql="INSERT INTO words_sentiment (word,senti_type,senti_value,word_type) VALUES ";

    foreach($line as $key =>$li)
    {
        $arr=explode(" ",$li);
        $senti_value=$arr[2]-$arr[3];
        if($senti_value!=0)
        {
            if($i>=20000&&$i<25000)//分批次导入,避免失败
            {
             $mm=explode(" ",$arr[4]);               
                 foreach($mm as $m)   //【adductive#1 adducting#1 adducent#1】这一个TXT记录要转换为3个SQL记录                 {
                     $nn=explode("#",$m);
                     $word=$nn[0];
                     $sql.="(\"$word\",1,$senti_value,2),";//这个地方要注意到是 word有可能包含单引号(如jack's),因此我们要用双引号来包含word(注意转义)                      
                 }
            }
   $i++;
        }        
    }
    //echo $i;
    $sql=substr($sql,0,-1);//去掉最后一个逗号
    //echo $sql;
    file_put_contents('20000-25000.txt', $sql);  //批量导入数据库,5000条一次,大概需要40秒的样子;一次导入太多max_execution_time会不够,导致失败    
?>

1,海量数据导入到时候,要注意PHP的一些限制,可以临时调整一下,否则会报错

Allowed memory size of 33554432 bytes exhausted (tried to allocate 16 bytes)

2,PHP操作TXT文件

file_get_contents()

file_put_contents()

3,海量导入的时候,最好分批次导入,失败的几率小一些

4,海量导入之前,脚本一定要多次测试无误再使用,比如用100条数据来测试

5,导入之后,如果PHP的mem_limit还是不够的话,程序仍然跑不起来

(建议用修改php.ini的方式来提高mem_limit,而不是用临时的语句)

相关文章

  • php 三维饼图的实现代码

    php 三维饼图的实现代码

    一直想发表点东西。最近刚把php4中的php_gd.dll搞定,就迫不及待的想做点图形程序玩玩。看到有许多php做饼图的例子,看了一下都是2维的,于是就想做个3维的。
    2008-09-09
  • php实现数组筛选奇数和偶数示例

    php实现数组筛选奇数和偶数示例

    这篇文章主要介绍了php实现数组筛选奇数和偶数示例,需要的朋友可以参考下
    2014-04-04
  • PHP批量生成静态HTML的简单原理和方法

    PHP批量生成静态HTML的简单原理和方法

    PHP生成HTML的技术要比ASP的技术相对来说要简单一点,下面简要说一下怎样用PHP批量生成HTML技术吧
    2014-04-04
  • php多文件上传下载示例分享

    php多文件上传下载示例分享

    这篇文章主要介绍了php多文件上传下载示例,需要的朋友可以参考下
    2014-02-02
  • PHP实现留言板功能的详细代码

    PHP实现留言板功能的详细代码

    这篇文章主要为大家详细介绍了PHP实现留言板功能的相关资料,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2017-03-03
  • 基于JQuery+PHP编写砸金蛋中奖程序

    基于JQuery+PHP编写砸金蛋中奖程序

    砸金蛋被广泛应用于庆典活动、商家促销、电视娱乐等场合,它的趣味、悬念能迅速活跃现场气氛,同样,我们也可以将砸金蛋应用到WEB网站上,用于开展线上活动,本文将使用jQuery+PHP讲解如何实现一个WEB砸金蛋程序,需要的朋友一起来学习吧
    2015-09-09
  • php的hash算法介绍

    php的hash算法介绍

    PHP的Hash采用的是目前最为普遍的DJBX33A (Daniel J. Bernstein, Times 33 with Addition), 这个算法被广泛运用与多个软件项目,Apache, Perl和Berkeley DB等。对于字符串而言这是目前所知道的最好的哈希算法,原因在于该算法的速度非常快,而且分类非常好(冲突小,分布均匀)
    2014-02-02
  • thinkphp5框架实现数据库读取的数据转换成json格式示例

    thinkphp5框架实现数据库读取的数据转换成json格式示例

    这篇文章主要介绍了thinkphp5框架实现数据库读取的数据转换成json格式,涉及thinkPHP5数据库读取数据与json格式转换相关操作技巧,需要的朋友可以参考下
    2019-10-10
  • php实现的任意进制互转类分享

    php实现的任意进制互转类分享

    这篇文章主要介绍了php实现的任意进制互转类分享,本文直接给出了实现代码,需要的朋友可以参考下
    2015-07-07
  • Yii框架 session 数据库存储操作方法示例

    Yii框架 session 数据库存储操作方法示例

    这篇文章主要介绍了Yii框架 session 数据库存储操作方法,结合实例形式分析了使用Yii框架session组件配置与数据库存储相关操作技巧,需要的朋友可以参考下
    2019-11-11

最新评论