Python Pandas处理csv文件常用示例
更新时间:2023年12月05日 11:20:29 作者:Alkali!
Pandas是一个非常强大的数据操作python包,支持各种数据格式,包括CSV文件,本文就来介绍一下Python Pandas处理csv文件常用示例,感兴趣的可以了解一下
常识
- 使用
pandas.read_csv
从csv文件中读取数据,对于csv中缺失的空值,读进dataframe
会自动补为numpy.nan
,且数据类型为float
操作
- 读取csv文件,存储为
dataframe
数据类型
df = pandas.read_csv(csv_path)
- 查看csv文件的
dataframe
的所有列字段名
print(df.columns)
- 按行遍历
dataframe
for row in df.itertuples():
可以用row.column_name
访问该行具体的列(column_name
无需加引号)
- 删除
dataframe
的指定整列数据
df = df.drop(['city', 'region', 'iso_country_code'], axis=1) # 删除列 'city', 'region', 'iso_country_code' # 这里的删除其实并没有对df本身作出任何改变,而是将df进行拷贝,将拷贝的副本进行了列删除操作,所以这里一定要赋值给一个新的df,仅仅用df.drop并不能改变df
- 根据某个字段的值的集合条件筛选出符合条件的目标行,以构成新
dataframe
# 使用isin()方法筛选匹配的行 new_df = df[df['placekey'].isin(mht_poi_list)] # 筛选出df中 placekey字段的值在列表mht_poi_list中的记录行,以构成一个新dataframe new_df new_df = new_df.reset_index(drop=True) # 经过筛选而得到的dataframe索引很乱,不连续,这里的操作是在重排索引
- 往
dataframe
指定位置插入一整列
df.insert(loc=6, column='top_category_id', value=cate1_ids) # loc 位置 # column 列名 # value 数据来源 (这里一般我习惯用list,要求list的长度要与dataframe的行数目一致)
- 将dataframe数据写入csv文件
df.to_csv(csv_path, index=False) # 不把行索引信息写入csv文件 df.to_csv(csv_path, index=True) # 把行索引信息写入csv文件
- 使用
list
构建dataframe
df = pandas.DataFrame(data, columns=['head', 'relation', 'tail']) # data是一个list,data这个list里面的元素也是一个个list,每一个list表示一行数据 # columns 表示列名 # data里面的list中的元素放置位置要与columns一致
到此这篇关于Python Pandas处理csv文件常用示例的文章就介绍到这了,更多相关Pandas处理csv内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
基于python+opencv调用电脑摄像头实现实时人脸眼睛以及微笑识别
这篇文章主要为大家详细介绍了基于python+opencv调用电脑摄像头实现实时人脸眼睛以及微笑识别,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下2021-09-09使用python+Flask实现日志在web网页实时更新显示
日志是一种可以追踪某些软件运行时所发生事件的方法,下面这篇文章主要给大家介绍了关于使用python+Flask实现日志在web网页实时更新显示的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下2022-08-08利用Selenium添加cookie实现自动登录的示例代码(fofa)
这篇文章主要介绍了利用Selenium添加cookie实现自动登录的示例代码(fofa),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧2021-05-05
最新评论