python使用pandas按照行数分割表格

 更新时间:2021年08月13日 10:00:14   作者:羊草  
本文主要介绍了python使用pandas按照行数分割表格,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下

问题

  • 一张excel表格,大概1万行,需要录入系统
  • 系统每次最多只能录入500行表格数据,一旦超过500行,就会录入失败
  • 需要把1万行的数据按照500行分割,形成20个表格,这样才能录入系统

思路

  • 使用pandas得到总行数,比如10002行,分割表格的时候,要保留一行表头
  • 第一张表,是1-500行,第二张表是 501-1000,以此类推
  • 最后一张表应该是1000-10002行,生成的表格数量是10000/500+1,21张
  • 生成的表格按照顺序保存到一个目录中
  • 写一个函数,可以按照任意指定的分割数量进行分割。

代码实现

#按行数分割表格函数
#问题
#1.如果有有一个十万行表格,要录入系统,但是系统每次最多只能录入500行?
#解决问题:
#1.按照指定的行数分割表格
#2.分割出来的表格按照序号命名
import pandas as pd
import os
def SplitExcel(file,num):
    file_dir='result'   #创建目录
    if os.path.isdir(file_dir):
        os.rmdir(file_dir)
    else:
        os.mkdir(file_dir)
    n = 1
    row_list = []
    df = pd.DataFrame(pd.read_excel(file, sheet_name=0))
    row_num = int(df.shape[0])  # 获取行数
    if num >= row_num:  #如果分割行数大于总行数,报错
        raise Exception('too much!!')
    try:
        for i in list(range(num,row_num,num)):
            row_list.append(i)
        row_list.append(row_num)  # 得到完整列表
    except Exception as e:
        print (e)

    (name,ext)=os.path.splitext(file)  #获取文件名

    for m in row_list:

        filename=os.path.join(file_dir,name+'-' + str(n) + '.xlsx')
        if m <row_num:
            df_handle=df.iloc[m-num:m] #获取n行之前
            print (df_handle)
            df_handle.to_excel(filename , sheet_name='sheet1',index=False)
        elif m == int(row_num):
            remainder=int(int(row_num)%num) #余数
            df_handle=df.iloc[m-remainder:m] #获取最后不能整除的行
            df_handle.to_excel(filename , sheet_name='sheet1', index=False)
        n = n + 1

if __name__=='__main__':
    file= 'result.xls'
    SplitExcel(file,num=10)

测试效果

一张83行的表格,去除表头,一共82行,按照10行分割,一共要获得9张表格,最后一张表格,应该只有两行,中间的表格,数据必须是连续的,

分割前

分割后

到此这篇关于python使用pandas按照行数分割表格的文章就介绍到这了,更多相关pandas按行分割表格内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python利用matplotlib库绘制饼图的方法示例

    python利用matplotlib库绘制饼图的方法示例

    Python强大的原因之一就在于其开源,有很多优秀的程序员为其提供了丰富的类库。Matplotlib就是其中之一,下面这篇文章主要介绍了python如何利用matplotlib库绘制饼图的方法示例,有需要的朋友们可以参考借鉴,下面来一起看看吧。
    2016-12-12
  • 如何编写python的daemon程序

    如何编写python的daemon程序

    这篇文章主要介绍了如何编写python的daemon程序,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
    2021-01-01
  • python Pandas时序数据处理

    python Pandas时序数据处理

    这篇文章主要介绍了python Pandas时序数据处理,文章围绕主题展开详细的内容介绍,具有一定的参考价值,需要的小伙伴可以参考一下
    2022-06-06
  • python 机器学习之支持向量机非线性回归SVR模型

    python 机器学习之支持向量机非线性回归SVR模型

    这篇文章主要介绍了python 机器学习之支持向量机非线性回归SVR模型,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-06-06
  • Python使用pymssql连接SQL SEVER数据库全流程

    Python使用pymssql连接SQL SEVER数据库全流程

    SQL Server是微软推出的重量级的数据库,目前有多个版本,如2000、2008、2012等,下面这篇文章主要给大家介绍了关于Python使用pymssql连接SQL SEVER数据库的相关资料,需要的朋友可以参考下
    2023-12-12
  • python进度条显示之tqmd模块

    python进度条显示之tqmd模块

    这篇文章主要介绍了python进度条显示之tqmd模块,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-08-08
  • anaconda打开闪退的解决过程

    anaconda打开闪退的解决过程

    这篇文章主要给大家介绍了关于anaconda打开闪退的解决过程,文中通过实例代码介绍的非常详细,对大家学习或者使用anaconda具有一定的参考学习价值,需要的朋友可以参考下
    2022-09-09
  • 基于Django用户认证系统详解

    基于Django用户认证系统详解

    下面小编就为大家分享一篇基于Django用户认证系统详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-02-02
  • python实现五子棋程序

    python实现五子棋程序

    这篇文章主要为大家详细介绍了python实现五子棋程序,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2020-04-04
  • python数据结构学习之实现线性表的顺序

    python数据结构学习之实现线性表的顺序

    这篇文章主要为大家详细介绍了python数据结构学习之实现线性表的顺序,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-09-09

最新评论