对python数据切割归并算法的实例讲解

 更新时间:2018年12月12日 08:43:07   作者:body_builder  
今天小编就为大家分享一篇对python数据切割归并算法的实例讲解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

当一个 .txt 文件的数据过于庞大,此时想要对数据进行排序就需要先将数据进行切割,然后通过归并排序,最终实现对整体数据的排序。要实现这个过程我们需要进行以下几步:获取总数据行数;根据行数按照自己的需要对数据进行切割;对每组数据进行排序 最后对所有数据进行归并排序。

下面我们就来实现这整个过程:

一:获取总数据的行

def get_file_lines(file_path):
 # 目标文件的路径
 file_path = str(file_path)
 with open(file_path, 'rb') as file:
  # 定义行数
  i = 0
  while True:
   # 一次读取一行数据
   line = file.readline()
   if not line :
    break
   else:
    # 每读一行,行数加一
    i += 1
   #设置进度条,每当i读取1000000行时打印一次i
   # 每当读取1000000的整数倍行时,打印行数(进度条)
   if i % 1000000 == 0:
    print(i)
  # 打印总行数
  print(i)
  return i

二:对数据进行切割

# 定义均等切割函数,num是待切割的文件的行数的值,n为切割份数,file_path是待切割的文件,file_dir是切割好的文件写入的目录
def evg_split(num, n, file_path, file_dir):
 last_list = []
 # 如果样本刚好可以整除为n份
 if num % n == 0:
  for i in range(n):
   # 则直接将样本分为n分没份对应num/n个
   last_list.append(num / n)
 # 如果不能整除
 if num % n != 0:
  # 如果不能整除,则先将num整除n-1并取n-1份,余下的单独做一份
  evg = (num - num % n) // (n - 1)
  for i in range(n):
   last_list.append(evg)
  last_list.append(num % (n - 1))
 print(last_list)
 # return last_list
 # 对应于切割后的每一份数据
 with open(file_path, 'rb') as path:
  for i in range(n):
   # 创建临时文件
   tmp_file = file_dir + str(i) + '.txt'
   # 打开临时文件,将内容一条一条的写入
   file = open(tmp_file, 'wb')
   for j in range(int(last_list[i])):
    line = path.readline()
    file.write(line)
    print(line)
   print('------------')
   file.close()

三:对每组数据进行排序的内容由读者根据自身数据需要进行排序,下面直接介绍归并排序

四:归并排序

def merge( mylist1, mylist2, file1):
 while len(mylist1) > 0 and len(mylist2) > 0:
  if mylist1[0]<mylist2[0]:
   with open(file1,'a') as file:
    file.write(str(mylist1[0]))
    del mylist1[0]
  elif mylist1[0] > mylist2[0]:
   with open(file1,'a') as file:
    file.write(str(mylist2[0]))
    del mylist2[0]
  else:
   with open(file1,'a') as file:
    file.write(str(mylist1[0]))
    file.write(str(mylist2[0]))
    del mylist1[0]
    del mylist2[0]
 with open(file1, 'a') as file:
  for i in mylist1:
   file.write(str(i))
  for i in mylist2:
   file.write(str(i))

总结:对于一个大型数据文件,我们可以将其切割成若干个小型的数据文件,然后分别的这些小型的数据文件进行排序,最后使用归并排序将这些数据文件写入到一个总体文件中,从而实现了对这个大型数据文件的排序。

以上这篇对python数据切割归并算法的实例讲解就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python字典遍历操作实例小结

    Python字典遍历操作实例小结

    这篇文章主要介绍了Python字典遍历操作,结合实例形式总结分析了Python遍历字典键值对、遍历键、遍历值等相关操作技巧,需要的朋友可以参考下
    2019-03-03
  • Python可变参数*args和**kwargs用法实例小结

    Python可变参数*args和**kwargs用法实例小结

    这篇文章主要介绍了Python可变参数*args和**kwargs用法,结合实例形式总结分析了Python中可变参数*args和**kwargs的功能、区别与具体使用技巧,需要的朋友可以参考下
    2018-04-04
  • TensorFlow神经网络创建多层感知机MNIST数据集

    TensorFlow神经网络创建多层感知机MNIST数据集

    这篇文章主要为大家介绍了TensorFlow神经网络如何创建多层感知机MNIST数据集的实现过程示例,有需要的朋友可以借鉴参考下,希望能够有所帮助
    2021-11-11
  • python取余运算符知识点详解

    python取余运算符知识点详解

    在本篇文章中我们给大家整理了关于python取余运算符的写法以及相关知识点,有兴趣的朋友们可以参考学习下。
    2019-06-06
  • Python 列表的基本操作介绍

    Python 列表的基本操作介绍

    这篇文章主要介绍了Python 列表的基本操作,下面文章围绕Python 列表的相关资料展开文章的详细内容,,需要的朋友可以参考一下,希望对大家有所帮助
    2021-11-11
  • Python写一个简单的api接口的实现

    Python写一个简单的api接口的实现

    本文主要介绍了Python写一个简单的api接口的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-02-02
  • 通过实例了解Python异常处理机制底层实现

    通过实例了解Python异常处理机制底层实现

    这篇文章主要介绍了通过实例了解Python异常处理机制底层实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-07-07
  • 基于Python实现商场抽奖小系统

    基于Python实现商场抽奖小系统

    这篇文章主要为大家详细介绍了如何利用Python语言实现一个简单的商场抽奖小系统,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
    2022-08-08
  • python networkx 根据图的权重画图实现

    python networkx 根据图的权重画图实现

    这篇文章主要介绍了python networkx 根据图的权重画图实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-07-07
  • 在Python编程过程中用单元测试法调试代码的介绍

    在Python编程过程中用单元测试法调试代码的介绍

    这篇文章主要介绍了在Python编程过程中用单元测试法调试代码的介绍,包括使用断言等,有助于debug时的效率提升,需要的朋友可以参考下
    2015-04-04

最新评论