Python 等分切分数据及规则命名的实例代码

 更新时间:2019年08月16日 16:20:58   作者:Mr-Lin  
这篇文章主要介绍了Python 等分切分数据及规则命名的实例代码,代码简单易懂,非常不错,具有一定的参考借鉴价值,需要的朋友可以参考下

 将一份一亿多条数据的csv文件等分为10份,代码如下所示:

import pandas as pd
data = pd.read_csv('C:\\Users\\PycharmProjects\\SplitData\\data\\UserBehavior.csv') # 路径则根据个人存放项目文件的习惯
num = 0
for i in range(1, 11):
start = num
num = num + int(data.shape[0] / 10)
file = data.iloc[start:num,]
file.to_csv("C:\\Users\\PycharmProjects\\SplitData\\newData\\" + str(i) + "_data.csv", index=False) # index=False是不想切分后的文件出现序号

注意:如果此时文件的路径包含有中文,则必须改成以下的代码:

import pandas as pd
f = open('C:\\Users\\PycharmProjects\\数据切分\\data\\UserBehavior.csv')
data = pd.read_csv(f)
num = 0
for i in range(1, 11):
start = num
num = num + int(data.shape[0] / 10)
file = data.iloc[start:num,]
file.to_csv("C:\\Users\\PycharmProjects\\SplitData\\newData\\" + str(i) + "_data.csv", index=False)

但是使用这种方法调用文件进内存,加重了内存的负担,两次赋值相当于内存占用乘2,此方法不建议使用,还是将路径改为英文名。

总结

以上所述是小编给大家介绍的Python 等分切分数据及规则命名的实例代码,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对脚本之家网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

相关文章

  • Python3实现监控新型冠状病毒肺炎疫情的示例代码

    Python3实现监控新型冠状病毒肺炎疫情的示例代码

    这篇文章主要介绍了Python3实现监控新型冠状病毒肺炎疫情的示例代码,代码简单易懂,非常不错,具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-02-02
  • Python学习之字符串常用方法总结

    Python学习之字符串常用方法总结

    这篇文章主要为大家介绍了Python中字符串的几个常用方法总结,文中的示例代码讲解详细,对我们学习Python字符串有一定帮助,需要的可以参考一下
    2022-03-03
  • python 返回一个列表中第二大的数方法

    python 返回一个列表中第二大的数方法

    今天小编就为大家分享一篇python 返回一个列表中第二大的数方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-07-07
  • Python提取JSON格式数据实战案例

    Python提取JSON格式数据实战案例

    这篇文章主要给大家介绍了关于Python提取JSON格式数据的相关资料, Python提供了内置的json模块,用于处理JSON数据,文中给出了详细的代码示例,需要的朋友可以参考下
    2023-07-07
  • python tkinter 设置窗口大小不可缩放实例

    python tkinter 设置窗口大小不可缩放实例

    这篇文章主要介绍了python tkinter 设置窗口大小不可缩放实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • 使用GitHub和Python实现持续部署的方法

    使用GitHub和Python实现持续部署的方法

    这篇文章主要介绍了使用GitHub和Python实现持续部署的方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-05-05
  • Python asyncio常用函数使用详解

    Python asyncio常用函数使用详解

    Asyncio在经过一段时间的发展以及获取Curio等第三方库的经验来提供更多的功能,目前高级功能也基本完善,但是相对于其他语言,Python的Asyncio高级功能还是不够的,但好在Asyncio的低级API也比较完善
    2023-03-03
  • 关于pyqt5控件自适应窗口超详细知识点汇总

    关于pyqt5控件自适应窗口超详细知识点汇总

    这篇文章主要介绍了关于pyqt5控件自适应窗口超详细知识点汇总,有了布局,再在布局中放置各种控件,我们就能让控件实现自适应的效果,需要的朋友可以参考下
    2023-03-03
  • Python使用protobuf序列化和反序列化的实现

    Python使用protobuf序列化和反序列化的实现

    protobuf是一种二进制的序列化格式,相对于json来说体积更小,传输更快,本文主要介绍了Python使用protobuf序列化和反序列化的实现,感兴趣的可以了解一下
    2021-05-05
  • python使用requests.session模拟登录

    python使用requests.session模拟登录

    最近开发一套接口,写个Python脚本,使用requests.session模拟一下登录.本文通过实例代码给大家介绍python使用requests.session模拟登录,感兴趣的朋友跟随小编一起看看吧
    2019-08-08

最新评论