pandas筛选数值列和非数值列方式

 更新时间:2024年02月22日 08:38:18   作者:Kevin Davis  
这篇文章主要介绍了pandas筛选数值列和非数值列方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

pandas筛选数值列和非数值列

筛选数值类型的列

numeric_columns = df.select_dtypes(include=['number']).columns

df为dataframe类型的数据。

筛选非数值类型的列

non_numeric_columns = df.select_dtypes(exclude=['number']).columns.to_list()

含数值列就用include,不要数值列就用exclude。

Pandas常见筛选数据的五种方法其一逻辑筛选

Pandas的数据操作中,最基本的就是操作的筛选了,但是对新学员来说的这又是一个难点,因为方法比较多,不容易记。聊聊pandas中的一些常用的数据筛选操作。 

逻辑筛选数据

切片([ ]),loc,iloc,这三种都是支持逻辑表达式的,选其中一种比较常用的,逻辑运算符 与或非(& | ~)any,all

展示使用的数据结构

import pandas as pd
PATH = '/tmp/MSD0921.xlsx'
dataframe = pd.read_excel(PATH,engine='openpyxl', nrows=50)
SD1SD2SD3SD4SD5SD6SD7SD8
047212676
155555555
217111666
366322222
444444444
...........................
25815211776
25917742171
26013545556
26113555532
26217777777

1、筛选出某一列大于某一个数的所有数据,例如:SD1>=7

"""筛选出SD1列中大于等于7的数据"""
dataframe[dataframe['SD1'] >= 7]

2、筛选出某一列大于或者小于另一列的输有数据,例如:SD1 < SD2

"""筛选出SD1列小于SD2列所有数据"""
dataframe.loc[dataframe['SD1'] < dataframe['SD2']]

3、筛选出某些列的值大于或小于某些值的所有数据,例如:SD1 >6并且SD1<3,使用 &

"""筛选出SD1大于6,并且SD2小于3的所有数据"""
dataframe.loc[(dataframe['SD1'] > 6) & ( dataframe['SD2'] < 3)]

 4、筛选出某些列的值大于或小于某些值的所有数据,例如:SD1 >6或者SD1<3,使用 |

"""筛选出SD1小于6,或者SD2小于3的所有数据,并集"""
dataframe.loc[(dataframe['SD1'] > 6) | ( dataframe['SD2'] < 3)]

注意:需要注意的是在进行或(|)、与(&)、非(~)运算时,各个独立逻辑表达式需要用括号括起来

除了上边的与或之外,pandas还提供了 all,any,对逻辑计算后的布尔值在进行判断,所有都为True,all才返回True,反之亦然,any满足其中之一即可。all,any可传参数axis,1为行方向,0为列方向。利用此方法可对整体数据逻辑判断。

5、筛选出某些列的值同时大于或同时小于某值的所有数据,例如SD1>6 SD2>6

"""筛选出SD1, SD2同时大于6的所有数据"""
dataframe[(dataframe.loc[:,['SD1', 'SD2']] > 6).all(1)]

 

逻辑解读: dataframe.loc[:,['SD1', 'SD2']] > 6,这个逻辑计算的是SD1,SD2同时大于6返回的布尔值,逗号前的冒号表示所有行,返回的是False或者True的一个dataframe数据,整体在进行.all(1),操作返回的是SD1,SD2都为True的为True,否者为False所有行数。在使用切片 [ ],进行取数据。

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python使用urllib2模块实现断点续传下载的方法

    Python使用urllib2模块实现断点续传下载的方法

    这篇文章主要介绍了Python使用urllib2模块实现断点续传下载的方法,实例分析了urllib2模块的使用及断点续传下载的实现技巧,需要的朋友可以参考下
    2015-06-06
  • 切换路径在Jupyter里调用本地文件的操作

    切换路径在Jupyter里调用本地文件的操作

    这篇文章主要介绍了切换路径在Jupyter里调用本地文件的操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-03-03
  • pandas使用apply多列生成一列数据的实例

    pandas使用apply多列生成一列数据的实例

    今天小编就为大家分享一篇pandas使用apply多列生成一列数据的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-11-11
  • 用python写测试数据文件过程解析

    用python写测试数据文件过程解析

    这篇文章主要介绍了用python写测试数据文件过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-09-09
  • 用Python画圣诞树代码示例

    用Python画圣诞树代码示例

    大家好,本篇文章主要讲的是用Python画圣诞树代码示例,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下,方便下次浏览
    2021-12-12
  • python函数局部变量、全局变量、递归知识点总结

    python函数局部变量、全局变量、递归知识点总结

    在本篇文章里小编给大家整理了关于python函数局部变量、全局变量、递归知识点,有兴趣的朋友们学习参考下。
    2019-11-11
  • tensorflow与numpy的版本兼容性问题的解决

    tensorflow与numpy的版本兼容性问题的解决

    这篇文章主要介绍了tensorflow与numpy的版本兼容性问题的解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01
  • 使用Pytorch Geometric进行链接预测的实现代码

    使用Pytorch Geometric进行链接预测的实现代码

    PyTorch Geometric (PyG)是构建图神经网络模型和实验各种图卷积的主要工具,在本文中我们将通过链接预测来对其进行介绍,文中有详细的代码示例供大家参考,需要的朋友可以参考下
    2023-10-10
  • python json.dumps() json.dump()的区别详解

    python json.dumps() json.dump()的区别详解

    这篇文章主要介绍了python json.dumps() json.dump()的区别详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-07-07
  • Python学习工具jupyter notebook安装及用法解析

    Python学习工具jupyter notebook安装及用法解析

    这篇文章主要介绍了Python学习工具jupyter notebook安装及用法解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-10-10

最新评论