使用Pandas如何读取多个分隔方式的文件
用Pandas读取多个分隔方式的文件
如果你的文本文件的第一行数据是使用逗号分隔的,而其余行是使用 tab 分隔的
你需要在 Pandas 中使用 read_csv 函数,并使用正则表达式指定多个分隔符。
1,2,3,4,5,6 a b c d e f z x c v b n
以下是如何使用 Pandas 读取该文件的代码:
import pandas as pd
# 读取文本文件,使用正则表达式指定多个分隔符,并将第一行作为列名
df = pd.read_csv('data.txt', sep=r'[,\t]', engine='python', header=0)
# 打印数据框
print(df)输出结果应为:
1 2 3 4 5 6
0 a b c d e f
1 z x c v b n
这里的 sep 参数使用了正则表达式 [,\t],表示分隔符可以是逗号或者 tab。
engine 参数指定了解析器的引擎,这里我们选择了 Python 自带的解析器。
最后,header=0 参数告诉 Pandas 使用第一行作为列名。
Pandas读取TXT,txt中数据以空格间隔
可以使用pandas的read_csv函数来读取TXT文件中的数据。
在调用read_csv函数时,可以使用sep参数指定数据之间的分隔符。
例如:
如果TXT文件中的数据以空格间隔,则可以使用sep=' '调用read_csv函数。
下面是一个例子
import pandas as pd
# 读取TXT文件中的数据
df = pd.read_csv('data.txt', sep=' ')
# 显示前5行数据
df.head()总结
以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。
相关文章
scrapy+scrapyd+gerapy 爬虫调度框架超详细教程
Scrapy吸引人的地方在于它是一个框架,任何人都可以根据需求方便的修改。它也提供了多种类型爬虫的基类,如BaseSpider、sitemap爬虫等,最新版本又提供了web2.0爬虫的支持,这篇文章主要介绍了scrapy+scrapyd+gerapy 爬虫调度框架超详细教程,需要的朋友可以参考下2022-06-06
PyCharm MySQL可视化Database配置过程图解
这篇文章主要介绍了PyCharm MySQL可视化Database配置过程图解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下2020-06-06
在Django中管理Users和Permissions以及Groups的方法
这篇文章主要介绍了在Django中管理Users和Permissions以及Groups的方法,Django是最具人气的Python web开发框架,需要的朋友可以参考下2015-07-07


最新评论