Python 将 CSV 分割成多个文件的示例代码

 更新时间:2023年06月07日 09:33:08   作者:迹忆客  
在本文中,我们讨论了如何使用 Pandas 库创建 CSV 文件, 此外,我们还讨论了两种常见的数据拆分技术,行式数据拆分和列式数据拆分,需要的朋友可以参考下

在本文中,我们将学习如何在 Python 中将一个 CSV 文件拆分为多个文件。 我们将使用 Pandas 创建一个 CSV 文件并将其拆分为多个其他文件。

使用 Pandas 在 Python 中创建 CSV 文件

要使用 Pandas 在 Python 中创建 CSV,必须首先通过命令行界面 (CLI) 安装 Pandas。

pip install pandas

此命令将下载 Pandas 并将其安装到您的本地计算机中。 使用 import 关键字,您可以轻松地将其导入到您当前的 Python 程序中。

让我们验证 Pandas 是否已安装。

代码示例:

import pandas as pd
print("The Version of Pandas is: ", pd.__version__)

输出:

The Version of Pandas is: 1.3.5

现在,让我们创建一个 CSV 文件。

代码示例:

import pandas as pd
# create a data set
data_dict = {'Roll no':    [1, 2, 3, 4, 5, 6, 7, 8],
             'Gender': ["Male", "Female", "Female", "Male",
                        "Male", "Female", "Male", "Female"],
             'CGPA':       [3.5, 3.3, 2.7, 3.8, 2.4, 2.1, 2.9, 3.9],
             'English':     [76, 77, 85, 91, 49, 86, 66, 98],
             'Mathematics': [78, 87, 54, 65, 90, 59, 63, 89],
             'Programming': [99, 45, 68, 85, 60, 39, 55, 88]}
# create a data frame
data = pd.DataFrame(data_dict)
# convert the data frame into a csv file
data.to_csv("studesnts.csv")
# Print the output
print(data)

输出:

Roll no Gender CGPA English Mathematics Programming
0 1 Male 3.5 76 78 99
1 2 Female 3.3 77 87 45
2 3 Female 2.7 85 54 68
3 4 Male 3.8 91 65 85
4 5 Male 2.4 49 90 60
5 6 Female 2.1 86 59 39
6 7 Male 2.9 66 63 55
7 8 Female 3.9 98 89 88

在 Python 中将 CSV 文件拆分为多个文件

我们已经成功创建了一个 CSV 文件。 让我们将其拆分为多个文件,但可以使用不同的矩阵在列或行的基础上拆分 CSV。

根据行拆分 CSV 文件

让我们在 Python 中基于行拆分 CSV 文件。

代码示例:

import pandas as pd
# read DataFrame
data = pd.read_csv("students.csv")
# number of csv files along with the row
k = 2
size = 4
for i in range(k):
    df = data[size*i:size*(i+1)]
    df.to_csv(f'students{i+1}.csv', index=False)
file1 = pd.read_csv("students1.csv")
print(file1)
print("\n")
file2 = pd.read_csv("students2.csv")
print(file2)

输出:

Roll no Gender CGPA English Mathematics Programming
0 1 Male 3.5 76 78 99
1 2 Female 3.3 77 87 45
2 3 Female 2.7 85 54 68
3 4 Male 3.8 91 65 85

Roll no Gender CGPA English Mathematics Programming
4 5 Male 2.4 49 90 60
5 6 Female 2.1 86 59 39
6 7 Male 2.9 66 63 55
7 8 Female 3.9 98 89 88

上面的代码将 students.csv 文件拆分为两个多文件,student1.csv 和 student2.csv。 文件按行分隔; 第 0 到 3 行存储在 student.csv 中,第 4 到 7 行存储在 student2.csv 文件中。

根据列拆分 CSV 文件

借助 groupby() 函数,我们可以根据列矩阵拆分任何 CSV 文件。 groupby() 函数属于 Pandas 库,使用分组数据。

在这种情况下,我们根据性别对学生数据进行分组。

代码示例:

import pandas as pd
# read DataFrame
data = pd.read_csv("students.csv")
for (gender), group in data.groupby(['Gender']):
     group.to_csv(f'{gender} students.csv', index=False)
print(pd.read_csv("Male students.csv"))
print("\n")
print(pd.read_csv("Female students.csv"))

输出:

Roll no Gender CGPA English Mathematics Programming
0 1 Male 3.5 76 78 99
1 4 Male 3.8 91 65 85
2 5 Male 2.4 49 90 60
3 7 Male 2.9 66 63 55

Roll no Gender CGPA English Mathematics Programming
0 2 Female 3.3 77 87 45
1 3 Female 2.7 85 54 68
2 6 Female 2.1 86 59 39
3 8 Female 3.9 98 89 88

总结

拆分数据是一种有用的数据分析技术,有助于理解和有效地排序数据。

在本文中,我们讨论了如何使用 Pandas 库创建 CSV 文件。 此外,我们还讨论了两种常见的数据拆分技术,行式数据拆分和列式数据拆分。

到此这篇关于Python 将 CSV 分割成多个文件的文章就介绍到这了,更多相关Python CSV 分割成多个文件内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 浅谈python中的getattr函数 hasattr函数

    浅谈python中的getattr函数 hasattr函数

    下面小编就为大家带来一篇浅谈python中的getattr函数 hasattr函数。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2016-06-06
  • 多个版本的python共存时使用pip的正确做法

    多个版本的python共存时使用pip的正确做法

    这篇文章主要介绍了多版本python共存时使用pip的正确做法,帮助有多个python版本需求的人可以正确的导包,感兴趣的朋友可以了解下
    2020-10-10
  • TensorFlow梯度求解tf.gradients实例

    TensorFlow梯度求解tf.gradients实例

    今天小编就为大家分享一篇TensorFlow梯度求解tf.gradients实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02
  • Python生成器实现简单

    Python生成器实现简单"生产者消费者"模型代码实例

    这篇文章主要介绍了Python生成器实现简单"生产者消费者"模型代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-03-03
  • pycharm 复制代码出现空格的解决方式

    pycharm 复制代码出现空格的解决方式

    这篇文章主要介绍了pycharm 复制代码出现空格的解决方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-01-01
  • Python 私有化操作实例分析

    Python 私有化操作实例分析

    这篇文章主要介绍了Python 私有化操作,结合实例形式分析了Python私有属性、私有方法相关使用技巧,需要的朋友可以参考下
    2019-11-11
  • 详谈Numpy中数组重塑、合并与拆分方法

    详谈Numpy中数组重塑、合并与拆分方法

    下面小编就为大家分享一篇详谈Numpy中数组重塑、合并与拆分方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04
  • python保存log日志,实现用log日志画图

    python保存log日志,实现用log日志画图

    今天小编就为大家分享一篇python保存log日志,实现用log日志来画图,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • python实现泊松图像融合

    python实现泊松图像融合

    这篇文章主要为大家详细介绍了python实现泊松图像融合,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-07-07
  • 基于Python编写PDF转EPUB以及MOBI工具

    基于Python编写PDF转EPUB以及MOBI工具

    当我们需要在电子阅读器上阅读这些文档时,转换为EPUB或MOBI格式会提供更好的阅读体验,所以本文将使用Python编写一个PDF转EPUB以及MOBI工具,需要的可以参考下
    2025-03-03

最新评论