如何利用itertuples对DataFrame进行遍历

 更新时间:2023年06月13日 10:54:21   作者:幸运的Alina  
这篇文章主要介绍了如何利用itertuples对DataFrame进行遍历问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

用itertuples对DataFrame进行遍历

最近在做推荐系统实践的时候需要生成物品同现矩阵和用户物品矩阵,发现了对DataFrame对象进行遍历很方便的函数itertuples

与此相关的有如下:

  • iterrows() : 将DataFrame迭代成(index ,series)
  • iteritems():将DataFrame迭代成(列名,series)
  • itertuples():将DataFrame迭代成元组 

示例如下:

通过getattr()函数可以直接获取元组内指定的值

这里通过列明索引访问对应的值

这里通过Index 索引获取对应的值

Pandas——Dataframe行遍历几种常用方法性能分析

pandas作为python数据分析的一大利器,为广大数据分析人员使用。无意中,听到美女同事吐槽:dataframe好慢啊!嗯哼,瞬间引起了我这个数据人的注意,过去一看,原来是用的方法本身效率低。

日常工作中,按照行遍历数据是我们一个非常常见的场景!尤其是从sql boy转到数据分析的我,动不动就想

 select * from table1;

一下,看看数据的大概情况。这一操作在pandas中的实现主要有一下几种:

1、iterrows()

原理是将Dataframe迭代为Series,再返回结果。这一过程中需要进行类型检查,所以,会花费很长的时间。(不建议使用)

for index, row in df.iterrows():
     #字典方式访问
     print(index, row['c1'], row['c2'])

2、itertuples()

原理是将Dataframe迭代为tuple,再进行返回,由于元组不可变的特性,此过程不需要进行类型检查。(效率高,推荐使用)

for row in student.itertuples():
    # print(row)
    print(row.Index, row.name, row.account, row.pwd)
    print(row.Index, getattr(row,'name'), getattr(row,'account'), getattr(row,'pwd'))

3、for + zip 

这种方法是直接手动构造原生tuple,无需关心index数据。(效率高,推荐使用)

for A, B in zip(df['A'], df['B']):
    print(A, B)

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • python使用递归实现斐波那契数列的示例详解

    python使用递归实现斐波那契数列的示例详解

    这篇文章主要给大家介绍了python使用递归实现斐波那契数列的示例,文中通过示例代码介绍的非常详细,对大家的学习或者使用Python具有一定的参考学习价值,需要的朋友们下面来一起来学习吧
    2024-01-01
  • python requests实现上传excel数据流

    python requests实现上传excel数据流

    这篇文章主要介绍了python requests实现上传excel数据流,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-02-02
  • 手把手教你实现Python连接数据库并快速取数的工具

    手把手教你实现Python连接数据库并快速取数的工具

    在数据生产应用部门,取数分析是一个很常见的需求,实际上业务人员需求时刻变化,最高效的方式是让业务部门自己来取。本文就来手把手教大家搭建一个 Python 连接数据库,快速取数工具,需要的可以参考一下
    2022-11-11
  • python图像处理模块Pillow的学习详解

    python图像处理模块Pillow的学习详解

    这篇文章主要介绍了python图像处理模块Pillow的学习详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-10-10
  • python绘制子图技巧之plt.subplot、plt.subplots及坐标轴修改

    python绘制子图技巧之plt.subplot、plt.subplots及坐标轴修改

    一个图片里边绘制多个图像是绘图中的常见需求,下面这篇文章主要给大家介绍了关于python绘制子图技巧之plt.subplot、plt.subplots及坐标轴修改的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-05-05
  • Python中使用摄像头实现简单的延时摄影技术

    Python中使用摄像头实现简单的延时摄影技术

    这篇文章主要介绍了Python中使用摄像头实现简单的延时摄影技术,本文只是一个简单的小示例,讲解了实现过程并给出实现代码,需要的朋友可以参考下
    2015-03-03
  • python使用tkinter调整label背景颜色的测试

    python使用tkinter调整label背景颜色的测试

    这篇文章主要介绍了python使用tkinter调整label背景颜色的测试方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-09-09
  • Python正则表达中re模块的使用

    Python正则表达中re模块的使用

    这篇文章主要介绍了Python正则表达中re模块的使用,文章围绕主题展开详细的内容介绍,具有一定的参考价值,需要的朋友可以参考一下
    2022-09-09
  • python批量修改文件名的三种方法实例

    python批量修改文件名的三种方法实例

    同事最近有个需求,需要批量修改文件的名称,这篇文章主要给大家介绍了关于python批量修改文件名的三种方法,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-05-05
  • pandas基础 Series与Dataframe与numpy对二进制文件输入输出

    pandas基础 Series与Dataframe与numpy对二进制文件输入输出

    这篇文章主要介绍了pandas基础Series与Dataframe与numpy对二进制文件输入输出,series是一种一维的数组型对象,它包含了一个值序列和一个数据标签
    2022-07-07

最新评论