pandas 使用均值填充缺失值列的小技巧分享
更新时间:2019年07月04日 11:15:35 作者:kate-kk
今天小编就为大家分享一篇pandas 使用均值填充缺失值列的小技巧分享,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
pd.DataFrame中通常含有许多特征,有时候需要对每个含有缺失值的列,都用均值进行填充,代码实现可以这样:
for column in list(df.columns[df.isnull().sum() > 0]):
mean_val = df[column].mean()
df[column].fillna(mean_val, inplace=True)
# -------代码分解-------
# 判断哪些列有缺失值,得到series对象
df.isnull().sum() > 0
# output
contributors True
coordinates True
created_at False
display_text_range False
entities False
extended_entities True
favorite_count False
favorited False
full_text False
geo True
id False
id_str False
...
# 根据上一步结果,筛选需要填充的列
df.columns[df.isnull().sum() > 0]
# output
Index(['contributors', 'coordinates', 'extended_entities', 'geo',
'in_reply_to_screen_name', 'in_reply_to_status_id',
'in_reply_to_status_id_str', 'in_reply_to_user_id',
'in_reply_to_user_id_str', 'place', 'possibly_sensitive',
'possibly_sensitive_appealable', 'quoted_status', 'quoted_status_id',
'quoted_status_id_str', 'retweeted_status'],
dtype='object')
以上这篇pandas 使用均值填充缺失值列的小技巧分享就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
相关文章
pycharm中下载的包但是import还是无法使用/报红的解决方法
用pycharm开发时,在导入自己写的python文件时出现模块名爆红的情况,下面这篇文章主要给大家介绍了关于pycharm中下载包但是import还是无法使用/报红的解决方法,需要的朋友可以参考下2023-02-02
详解Selenium+PhantomJS+python简单实现爬虫的功能
这篇文章主要介绍了详解Selenium+PhantomJS+python简单实现爬虫的功能,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧2019-07-07
基于Python工具使用Web3.py以太坊智能合约开发的方法
智能合约是区块链技术的核心应用之一,它允许在没有中介的情况下,通过代码自动执行合同条款,以太坊是目前最流行的智能合约平台之一,而Web3.py是用于与以太坊区块链交互的Python库,本文将详细介绍如何使用Web3.py进行以太坊智能合约的开发,需要的朋友可以参考下2024-11-11


最新评论