使用Pandas如何读取多个分隔方式的文件
用Pandas读取多个分隔方式的文件
如果你的文本文件的第一行数据是使用逗号分隔的,而其余行是使用 tab 分隔的
你需要在 Pandas 中使用 read_csv 函数,并使用正则表达式指定多个分隔符。
1,2,3,4,5,6 a b c d e f z x c v b n
以下是如何使用 Pandas 读取该文件的代码:
import pandas as pd
# 读取文本文件,使用正则表达式指定多个分隔符,并将第一行作为列名
df = pd.read_csv('data.txt', sep=r'[,\t]', engine='python', header=0)
# 打印数据框
print(df)输出结果应为:
1 2 3 4 5 6
0 a b c d e f
1 z x c v b n
这里的 sep 参数使用了正则表达式 [,\t],表示分隔符可以是逗号或者 tab。
engine 参数指定了解析器的引擎,这里我们选择了 Python 自带的解析器。
最后,header=0 参数告诉 Pandas 使用第一行作为列名。
Pandas读取TXT,txt中数据以空格间隔
可以使用pandas的read_csv函数来读取TXT文件中的数据。
在调用read_csv函数时,可以使用sep参数指定数据之间的分隔符。
例如:
如果TXT文件中的数据以空格间隔,则可以使用sep=' '调用read_csv函数。
下面是一个例子
import pandas as pd
# 读取TXT文件中的数据
df = pd.read_csv('data.txt', sep=' ')
# 显示前5行数据
df.head()总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。
相关文章
Python flask框架定时任务apscheduler应用介绍
Flask是Python社区非常流行的一个Web开发框架,本文将尝试将介绍APScheduler应用于Flask之中实现定时任务,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习吧2022-10-10
Python SQLite3 查询结果返回字典的常见错误及完整解决方案
在使用Python的sqlite3模块查询数据库时,默认情况下fetchall()返回的结果只包含值(tuple 格式),不包含字段名(键),这在实际开发中很不方便,,下面通过本文介绍Python SQLite3 查询结果返回字典的常见错误及解决方案,感兴趣的朋友一起看看吧2026-02-02
pytorch中关于distributedsampler函数的使用
这篇文章主要介绍了pytorch中关于distributedsampler函数的使用,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教2023-02-02


最新评论