Pandas之pandas DataFrame iterrows详解

 更新时间:2025年04月16日 09:09:11   作者:liuweidong0802  
这篇文章主要介绍了Pandas之pandas DataFrame iterrows,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

Pandas2.2 DataFrame

Indexing, iteration

方法描述
DataFrame.head([n])用于返回 DataFrame 的前几行
DataFrame.at快速访问和修改 DataFrame 中单个值的方法
DataFrame.iat快速访问和修改 DataFrame 中单个值的方法
DataFrame.loc用于基于标签(行标签和列标签)来访问和修改 DataFrame 中的数据
DataFrame.iloc用于基于整数位置(行号和列号)来访问和修改 DataFrame 中的数据
DataFrame.insert(loc, column, value[, …])用于在 DataFrame 的指定位置插入一个新的列
DataFrame.iter()用于迭代 DataFrame 的列名
DataFrame.items()用于迭代 DataFrame 的列名和列数据
DataFrame.keys()返回 DataFrame 的列名
DataFrame.iterrows()用于逐行迭代 DataFrame

pandas.DataFrame.iterrows()

pandas.DataFrame.iterrows() 方法用于逐行迭代 DataFrame,每次迭代返回一个包含行索引和行数据的元组。

行数据以 Series 对象的形式返回,其中索引是列名,值是该行对应列的值。

  • 语法:
for index, row in DataFrame.iterrows():
    # 处理行索引和行数据
  • 示例:

假设我们有一个 DataFrame 如下:

import pandas as pd

data = {
    'A': [1, 2, 3],
    'B': [4, 5, 6],
    'C': [7, 8, 9]
}

df = pd.DataFrame(data, index=['row1', 'row2', 'row3'])
print(df)

输出:

       A  B  C
row1   1  4  7
row2   2  5  8
row3   3  6  9

迭代行索引和行数据

使用 iterrows() 方法逐行迭代 DataFrame:

for index, row in df.iterrows():
    print(f"Index: {index}")
    print(f"Row: {row}")
    print()

输出:

Index: row1
Row: A    1
B    4
C    7
Name: row1, dtype: int64

Index: row2
Row: A    2
B    5
C    8
Name: row2, dtype: int64

Index: row3
Row: A    3
B    6
C    9
Name: row3, dtype: int64

访问特定列的值

在迭代行数据时,访问特定列的值:

for index, row in df.iterrows():
    print(f"Index: {index}, A: {row['A']}, B: {row['B']}, C: {row['C']}")

输出:

Index: row1, A: 1, B: 4, C: 7
Index: row2, A: 2, B: 5, C: 8
Index: row3, A: 3, B: 6, C: 9

注意事项:

  1. 性能问题: iterrows() 在处理大型 DataFrame 时性能较差,因为它会将每一行转换为 Series 对象,这会导致额外的开销。对于性能敏感的操作,建议使用 itertuples() 或向量化操作。
  2. 修改数据: 在迭代过程中修改 DataFrame 的数据可能会导致不可预测的结果。如果需要修改数据,建议先创建一个副本或使用其他方法。

总结

pandas.DataFrame.iterrows() 方法提供了一种逐行迭代 DataFrame 的方式,每次迭代返回一个包含行索引和行数据的元组。

虽然使用方便,但在处理大型数据集时需要注意性能问题。对于需要逐行处理数据的场景,iterrows() 是一个有用的工具。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python格式化输出详情

    Python格式化输出详情

    这篇文章介绍了Python格式化输出,主要讲解Python格式化输出的三种方式:%格式化、format格式化、f-String格式化,需要的朋友可以参考下面文章的具体内容
    2021-09-09
  • python控制结构的条件判断与循环示例详解

    python控制结构的条件判断与循环示例详解

    这篇文章主要为大家介绍了python控制结构的条件判断与循环示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-06-06
  • pyqt添加启动等待界面的操作

    pyqt添加启动等待界面的操作

    这篇文章主要介绍了pyqt添加启动等待界面的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-03-03
  • Django ModelSerializer实现自定义验证的使用示例

    Django ModelSerializer实现自定义验证的使用示例

    本文主要介绍了Django ModelSerializer实现自定义验证的使用示例,多种字段验证器帮助开发者确保数据的完整性和准确性,具有一定的参考价值,感兴趣的可以了解一下
    2023-11-11
  • Python爬虫实例_利用百度地图API批量获取城市所有的POI点

    Python爬虫实例_利用百度地图API批量获取城市所有的POI点

    下面小编就为大家分享一篇Python爬虫实例_利用百度地图API批量获取城市所有的POI点,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-01-01
  • 深入理解 Python 中的 pip 虚拟环境(最佳实践)

    深入理解 Python 中的 pip 虚拟环境(最佳实践)

    本文深入讲解了Python中pip虚拟环境的概念及其重要性,并详细介绍了如何创建、激活和管理虚拟环境,以及如何使用requirements.txt文件记录和管理项目依赖,文章指出,使用虚拟环境可以有效避免依赖冲突,为每个项目提供一个干净的开发环境,使得项目更易于维护和部署
    2024-10-10
  • Python IDE Pycharm中的快捷键列表用法

    Python IDE Pycharm中的快捷键列表用法

    在本篇文章里小编给大家整理的是关于Python IDE Pycharm中的快捷键列表用法,需要的朋友们收藏下
    2019-08-08
  • pycharm中使用pyplot时报错MatplotlibDeprecationWarning

    pycharm中使用pyplot时报错MatplotlibDeprecationWarning

    最近在使用Pycharm中matplotlib作图处理时报错,所以这篇文章主要给大家介绍了关于pycharm中使用pyplot时报错MatplotlibDeprecationWarning的相关资料,需要的朋友可以参考下
    2023-12-12
  • 使用Python将PDF表格提取到文本,CSV和Excel文件中

    使用Python将PDF表格提取到文本,CSV和Excel文件中

    本文将介绍如何使用简单的Python代码从PDF文档中提取表格数据并将其写入文本、CSV和Excel文件,从而轻松实现PDF表格的自动化提取,有需要的可以参考下
    2024-11-11
  • 使用Python提取PDF大纲(书签)的完整指南

    使用Python提取PDF大纲(书签)的完整指南

    PDF大纲(Outline)​​ 是PDF文档中的导航结构,通常显示在阅读器的侧边栏中,方便用户快速跳转到文档的不同部分,大纲通常以层级结构组织,包含标题和对应的页面位置,本文给大家介绍了使用Python提取PDF大纲(书签)的完整指南,需要的朋友可以参考下
    2025-08-08

最新评论