Python pandas如何根据指定条件筛选数据

 更新时间:2024年02月22日 09:07:35   作者:永远在减肥永远110的的小潘  
这篇文章主要介绍了Python pandas如何根据指定条件筛选数据问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

pandas根据指定条件筛选数据

import pandas as pd
import numpy as np
df=pd.DataFrame(np.arange(16).reshape(4,4),columns=["sh","bj","sz","gz"],index=["one","two","three","four"])

1、筛选出"sh"列大于5的数据

法一:直接筛选

适用于一些比较简单直接的筛选,这种方式方便快捷。

df[df["sh"]>5]

法二:函数筛选

适用于比较复杂的条件筛选,函数除了可以使用lambda匿名函数以外,也可以使用其他逻辑更复杂的自定义函数。

df[df["sh"].map(lambda x:x>5)]

2、筛选出"sh"列为2或7的数据

法一:同上

df[df["sh"]==5]

法二:同上

df[df["sh"].map(lambda x:x==5)]

法三:使用isin()函数,支持多值筛选

df[df["sh"].isin([5])]

3、模糊筛选

1)str.contains()函数

province = pd.DataFrame(['广东', '广西', '福建', '福建省'], columns=['省份'])
province.loc[province["省份"].str.contains("福")]#筛选出福建省数据

2)正则匹配

import re
province = pd.DataFrame(['广东', '广西', '福建', '福建省'], columns=['省份'])
#自定义函数,如果包含“广”字,则返回True,否则返回False
def func(x):
    if re.search(".*广.*",x):
        return(True)
    else:
        return(False)
province[province["省份"].apply(func)]

3)切片

df=pd.DataFrame({"date":["2020efgdh0228","2021hijik0228","2019hokh0201"],"value":[9999,777,4]})

#筛选出2019年的数据
df[df["date"].map(lambda x:x[0:4])=="2019"]

4、筛选重复值

df[df.duplicated(subset=["one"],keep="last")]#返回除最后一次出现的重复值

df[df.duplicated(subset=["one"],keep=False)]#返回所有重复值

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • 一文教会你用Python获取网页指定内容

    一文教会你用Python获取网页指定内容

    Python用做数据处理还是相当不错的,如果你想要做爬虫,Python是很好的选择,它有很多已经写好的类包,只要调用即可完成很多复杂的功能,下面这篇文章主要给大家介绍了关于Python获取网页指定内容的相关资料,需要的朋友可以参考下
    2022-03-03
  • Tensorflow实现酸奶销量预测分析

    Tensorflow实现酸奶销量预测分析

    这篇文章主要为大家详细介绍了Tensorflow酸奶销量预测分析,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-07-07
  • python3读取excel文件只提取某些行某些列的值方法

    python3读取excel文件只提取某些行某些列的值方法

    今天小编就为大家分享一篇python3读取excel文件只提取某些行某些列的值方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-07-07
  • python 三元运算符使用解析

    python 三元运算符使用解析

    这篇文章主要介绍了python 三元运算符使用解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-09-09
  • Python 字符串操作详情

    Python 字符串操作详情

    这篇文章主要介绍了Python 字符串操作,所谓字符串,就是由0个或者多个字符组成的有限序列,字符串的字符可以是特殊符号、英文字母、中文字符、日文的平假名或片假名、希腊字母、Emoji字符等等。下面我们大家一起来学习文章详细内容吧
    2021-11-11
  • python根据字典的键来删除元素的方法

    python根据字典的键来删除元素的方法

    在本篇文章里小编给大家整理的是一篇关于python根据字典的键来删除元素的方法,有兴趣的朋友们可以参考下。
    2020-08-08
  • python机器学习实现神经网络示例解析

    python机器学习实现神经网络示例解析

    这篇文章主要为大家介绍了python机器学习python实现神经网络的示例解析,在同样在进行python机器学习的同学可以借鉴参考下,希望能够有所帮助
    2021-10-10
  • Python中True(真)和False(假)判断详解

    Python中True(真)和False(假)判断详解

    众所周知True和False是一个布尔变量可取的值,下面这篇文章主要给大家介绍了关于Python中True(真)和False(假)判断的相关资料,本文通过示例代码介绍的非常详细,需要的朋友可以参考下
    2022-07-07
  • Python线程同步的实现代码

    Python线程同步的实现代码

    本文介绍了threading 模块提供的线程同步原语包括:Lock、RLock、Condition、Event、Semaphore等对象。对大家的学习具有一定的参考学习价值,需要的朋友可以参考下
    2018-10-10
  • Python正则获取、过滤或者替换HTML标签的方法

    Python正则获取、过滤或者替换HTML标签的方法

    这篇文章主要介绍了Python通过正则表达式获取、过滤或者替换HTML标签的方法,感兴趣的小伙伴们可以参考一下
    2016-01-01

最新评论