Python利用pandas计算多个CSV文件数据值的实例
更新时间:2018年04月19日 17:00:33 作者:卒迹
下面小编就为大家分享一篇Python利用pandas计算多个CSV文件数据值的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
功能:扫描当前目录下所有CSV文件并对其中文件进行统计,输出统计值到CSV文件
pip install pandas
import pandas as pd
import glob,os,sys
input_path='./'
output_fiel='pandas_union_concat.csv'
all_files=glob.glob(os.path.join(input_path,'sales_*'))
all_data_frames=[]
for file in all_files:
data_frame=pd.read_csv(file,index_col=None)
total_sales=pd.DataFrame([float(str(value).strip('$').replace(',','')) for value in data_frame.loc[:,'Sale Amount']]).sum()
average_sales=pd.DataFrame([float(str(value).strip('$').replace(',','')) for value in data_frame.loc[:,'Sale Amount']]).mean()
data={
'filename':os.path.basename(file),
'total_sales':total_sales,
'average_sales':average_sales
}
all_data_frames.append(pd.DataFrame(data,columns=['filename','total_sales','average_sales']))
data_frame_concat=pd.concat(all_data_frames,axis=0,ignore_index=True)
data_frame_concat.to_csv(output_fiel,index=False)
以上这篇Python利用pandas计算多个CSV文件数据值的实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。
您可能感兴趣的文章:
相关文章
python numpy函数中的linspace创建等差数列详解
numpy.linspace是用于创建一个一维数组,并且是等差数列构成的一维数组,下面这篇文章主要给大家介绍了关于python numpy函数中的linspace创建等差数列的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下。2017-10-10
python正则表达式之re.match()与re.search()的用法及区别
本文主要介绍了python正则表达式之re.match()与re.search()的用法及区别,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧2022-08-08
Django-simple-captcha验证码包使用方法详解
这篇文章主要介绍了Django-simple-captcha验证码包使用方法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下2020-11-11


最新评论