如何用pandas读取一个文件或某个文件夹下所有文件

 更新时间:2024年02月01日 10:25:23   作者:旺仔的算法coding笔记  
这篇文章主要介绍了如何用pandas读取一个文件或某个文件夹下所有文件问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

pandas读取一个文件或某个文件夹下所有文件

读取一个文件

直接用文件路径。

如果是读取某个文件夹下的所有文件,注意用os.path,逐个读取文件,把新读取到的Dataframe进行concate操作到总的Dataframe中去。

详细请见代码。

 
character_list =['1010011_i_u_prov',  '9010081_i_b_location']
#这是读取一个文件的,
# data=pd.read_csv('../data/10line_of_part-00000',sep='\t',header=None)
# 如果读取所有文件呢?如下
 
file_dir="../data/dt=20200807"
all_file_list=os.listdir(file_dir)
for single_file in all_file_list:
    # 逐个读取 
    single_data_frame=pd.read_csv(
            os.path.join(file_dir,single_file),sep='\t',header=None)
	if single_file ==all_file_list[0]:
		all_data_frame=single_data_frame
	else:  #进行concat操作       
         all_data_frame=pd.concat([all_data_frame,
                    single_data_frame],ignore_index=True)
 
# data.columns=character_list,给dataframe的属性重新命名。
all_data_frame.columns=character_list

备注:

data数据是从sql中select出来的结果。

注意:

分隔符要用\t,不然会报错!

pandas读取多个文件并合并到一起

先把文件位置放到一起,读取文件,再concat。

subdir=‘store'

file_names = []#存文件名
file_names.append(test1.csv')#继续添加文件名

csv_paths = []#存文件位置
for file_name in file_names:
    csv_path = join( '..','csv', subdir, file_name)#文件位置
    csv_paths.append(csv_path)
    break

df_csvs = []
for csv_path in csv_paths:
    df_tmp = pd.read_csv('%s' % csv_path, low_memory=False)
    df_csvs.append(df_tmp)
    
df_total = pd.concat(df_csvs)#合并成一个dataframe

#小技巧 非必须

#如列名为a.uid想改为uid 用以下方法操作

df_total.columns = [s[2:] for s in df_total.columns]
df_total.shape

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • 用Python监控你的朋友都在浏览哪些网站?

    用Python监控你的朋友都在浏览哪些网站?

    今天教各位小伙伴一个黑科技,用Python监控你的朋友都在浏览哪些网站,文中有非常详细的介绍,对正在学习python的小伙伴们很有帮助,需要的朋友可以参考下
    2021-05-05
  • 详解如何通过Python制作一个密码生成器

    详解如何通过Python制作一个密码生成器

    定期更换密码是一种非常重要的安全措施,这种做法可以有效地保护你的账户和个人信息不受黑客和网络攻击者的侵害。所以本文就来用Python制作一个密码生成器吧
    2023-05-05
  • Python通过内置函数和自写算法DFS实现排列组合

    Python通过内置函数和自写算法DFS实现排列组合

    这篇文章主要介绍了Python通过内置函数和自写算法DFS实现排列组合,排列组合是数学中的一种常见的计算方法,用于求出从给定的元素中选取若干个元素的所有可能的排列或组合。在Python中,有多种方式可以实现排列组合的计算,需要的朋友可以参考下
    2023-05-05
  • python使用技巧-查找文件 

    python使用技巧-查找文件 

    这篇文章主要分享的是python使用技巧查找文件,下面我们就来介绍针对python查找文件的相关内容,需要的小伙伴可以参考一下
    2022-02-02
  • python基于 Web 实现 m3u8 视频播放的实例

    python基于 Web 实现 m3u8 视频播放的实例

    这篇文章主要介绍了python基于 Web 实现 m3u8 视频播放的实例的相关资料,需要的朋友可以参考下
    2023-06-06
  • Python如何声明以管理员方式运行(附实战案例)

    Python如何声明以管理员方式运行(附实战案例)

    由于Windows的安全机制,Python写的脚本缺少了管理员权限,运行就会受到一些限制,这篇文章主要介绍了Python如何声明以管理员方式运行的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下
    2025-04-04
  • 总结Python编程中三条常用的技巧

    总结Python编程中三条常用的技巧

    这篇文章主要介绍了总结Python编程中三条常用的技巧,包括JSON格式的转换、else语句的活用和setdefault方法的使用,需要的朋友可以参考下
    2015-05-05
  • numpy中数组拼接、数组合并方法总结(append(), concatenate, hstack, vstack, column_stack, row_stack, np.r_, np.c_等)

    numpy中数组拼接、数组合并方法总结(append(), concatenate, hstack, vstack

    numpy库是一个高效处理多维数组的工具,可以在进行边写的数组计算上进行一系列的操作,下面这篇文章主要给大家介绍了关于numpy中数组拼接、数组合并方法(append(), concatenate, hstack, vstack, column_stack, row_stack, np.r_, np.c_等)的相关资料,需要的朋友可以参考下
    2022-08-08
  • Python如何查看并打印matplotlib中所有的colormap(cmap)类型

    Python如何查看并打印matplotlib中所有的colormap(cmap)类型

    这篇文章主要介绍了Python如何查看并打印matplotlib中所有的colormap(cmap)类型,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2022-11-11
  • 如何用python实现一个HTTP连接池

    如何用python实现一个HTTP连接池

    这篇文章主要介绍了如何用python实现一个HTTP连接池的步骤,帮助大家更好的理解和使用python,感兴趣的朋友可以了解下
    2021-01-01

最新评论