Python数据分析pandas之布尔索引使用详解

 更新时间:2023年07月17日 10:46:59   作者:YiYa_咿呀  
这篇文章主要为大家介绍了Python数据分析pandas之布尔索引使用示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪

正文

&:与
|:或

不同条件需要用()括起来

import pandas as pd
# 构造字典数据
dic = {
    "name":["shanjialan","shanyanhong","luckyapple"],
    "age":[21,23,12],
    "hobby":["sports","music","programming"]
}
# dataframe读取字典
df = pd.DataFrame(dic)

# 简单判断
print(df[df["age"]>18])
print(df[df["name"].str.len()>10])
# 复杂判断
print(df[(df["age"]>18)&(df["age"]<22)])

pandas字符串的方法

pandas 缺失数据的处理

pd.isnull(df):df每个数据是否为空的bool矩阵

pd.notnull(df):df每个数据是否不为空的bool矩阵

缺失数据包括np.nan/None

import pandas as pd
import numpy as np
# 构造字典数据
dic = {
    "name":["shanjialan","shanyanhong","luckyapple","hunvibe","chenwenhao"],
    "age":[21,23,0,np.nan,21],
    "hobby":["sports","music","programming","eating","basketball"]
}
# dataframe读取字典
df = pd.DataFrame(dic)
print(pd.isnull(df))
print(pd.notnull(df))

缺失值的处理方法:删除或者填充

  • df.dropna(how='all/any',inplace='True/False',axis=n):
  • how——以何种方式删除,all:所有数据都为nan,any表示只要有一个就可;
  • inplace:是否原地修改,TRUE为原地修改,FALSE为默认选择
  • axis:指定轴
  • df.fillna(value):填充为value值
print(df.dropna(how='any',axis=0,inplace=False))
print(df["age"].fillna(value=df['age'].mean()))

注意:在pandas中出现nan进行求均值等操作会默认为0,和在numpy中不同

处理0值

t[t==0]=np.nan

以上就是Python数据分析pandas之布尔索引使用详解的详细内容,更多关于Python pandas布尔索引的资料请关注脚本之家其它相关文章!

相关文章

最新评论