如何利用itertuples对DataFrame进行遍历

 更新时间:2023年06月13日 10:54:21   作者:幸运的Alina  
这篇文章主要介绍了如何利用itertuples对DataFrame进行遍历问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

用itertuples对DataFrame进行遍历

最近在做推荐系统实践的时候需要生成物品同现矩阵和用户物品矩阵,发现了对DataFrame对象进行遍历很方便的函数itertuples

与此相关的有如下:

  • iterrows() : 将DataFrame迭代成(index ,series)
  • iteritems():将DataFrame迭代成(列名,series)
  • itertuples():将DataFrame迭代成元组 

示例如下:

通过getattr()函数可以直接获取元组内指定的值

这里通过列明索引访问对应的值

这里通过Index 索引获取对应的值

Pandas——Dataframe行遍历几种常用方法性能分析

pandas作为python数据分析的一大利器,为广大数据分析人员使用。无意中,听到美女同事吐槽:dataframe好慢啊!嗯哼,瞬间引起了我这个数据人的注意,过去一看,原来是用的方法本身效率低。

日常工作中,按照行遍历数据是我们一个非常常见的场景!尤其是从sql boy转到数据分析的我,动不动就想

 select * from table1;

一下,看看数据的大概情况。这一操作在pandas中的实现主要有一下几种:

1、iterrows()

原理是将Dataframe迭代为Series,再返回结果。这一过程中需要进行类型检查,所以,会花费很长的时间。(不建议使用)

for index, row in df.iterrows():
     #字典方式访问
     print(index, row['c1'], row['c2'])

2、itertuples()

原理是将Dataframe迭代为tuple,再进行返回,由于元组不可变的特性,此过程不需要进行类型检查。(效率高,推荐使用)

for row in student.itertuples():
    # print(row)
    print(row.Index, row.name, row.account, row.pwd)
    print(row.Index, getattr(row,'name'), getattr(row,'account'), getattr(row,'pwd'))

3、for + zip 

这种方法是直接手动构造原生tuple,无需关心index数据。(效率高,推荐使用)

for A, B in zip(df['A'], df['B']):
    print(A, B)

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • FastApi如何快速构建一个web项目的实现

    FastApi如何快速构建一个web项目的实现

    本文主要介绍了FastApi如何快速构建一个web项目的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-03-03
  • Pandas提高数据分析效率的13个技巧汇总

    Pandas提高数据分析效率的13个技巧汇总

    这篇文章主要是为大家归纳整理了13个工作中常用到的pandas使用技巧,方便更高效地实现数据分析,感兴趣的小伙伴可以跟随小编一起学习一下
    2022-05-05
  • 安装PyInstaller失败问题解决

    安装PyInstaller失败问题解决

    这篇文章主要介绍了安装PyInstaller失败问题解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-12-12
  • Python字典高级用法深入分析讲解

    Python字典高级用法深入分析讲解

    字典作为Python的一个内置数据结构,和列表一样都是可变序列的,但是它是无序的,以键值对的方式存储数据。本文将详解一下Python中字典的高级使用,需要的可以参考一下
    2022-10-10
  • python中opencv Canny边缘检测

    python中opencv Canny边缘检测

    这篇文章主要介绍了python中opencv Canny边缘检测,Canny边缘检测是一种使用多级边缘检测算法检测边缘的方法。OpenCV提供了函数cv2.Canny()实现Canny边缘检测。更多相关内容需要的小伙伴可以参考下面文章内容
    2022-06-06
  • Python中文分词库jieba,pkusegwg性能准确度比较

    Python中文分词库jieba,pkusegwg性能准确度比较

    这篇文章主要介绍了Python中文分词库jieba,pkusegwg性能准确度比较,需要的朋友可以参考下
    2020-02-02
  • django 实现celery动态设置周期任务执行时间

    django 实现celery动态设置周期任务执行时间

    今天小编就为大家分享一篇django 实现celery动态设置周期任务执行时间,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-11-11
  • pandas将Series转成DataFrame的实现

    pandas将Series转成DataFrame的实现

    本文主要介绍了pandas将Series转成DataFrame的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-01-01
  • 在cmd中查看python的安装路径方法

    在cmd中查看python的安装路径方法

    在本篇文章里小编给大家整理的是关于怎样在cmd中查看python的安装路径的相关内容,有兴趣的朋友们学习参考下。
    2019-07-07
  • 详解Python 正则表达式模块

    详解Python 正则表达式模块

    这篇文章主要介绍了Python 正则表达式模块详解,分为两部分,包括基础语法总结,re模块的相关知识,需要的朋友可以参考下
    2018-11-11

最新评论