Python使用read_csv读数据遇到分隔符问题的2种解决方式

 更新时间:2022年07月27日 10:04:52   作者:清三皮  
read.csv()可以从带分隔符的文本文件中导入数据,下面这篇文章主要给大家介绍了关于Python使用read_csv读数据遇到分隔符问题的2种解决方式,文中通过实例代码介绍的非常详细,需要的朋友可以参考下

用read_csv读数据遇到分隔符问题的两种解决方式

import pandas as pd

1.更改read_csv函数中的传参“sep”

1.1缺省sep参数

默认分隔符为‘,’

1.2不缺省sep参数

1.2.1要读入的文档中分隔符为一位字符

用单引号括起文本中的分隔符

例:sep = '|'

1.2.2要读入的文档中分隔符为多位字符

多位字符在python中被识别为正则式

此时可用为sep = ‘\s+’(不论多位分隔符有什么组成,比如几个空格、\r\t)

此时,python将用自己的语法分析器来对多位字符进行识别

2.利用记事本功能进行分隔符替换

因为自己在编程的时候用正则表达式出现了一些问题,故找到了另一种更改文本中分隔符,以便于设定sep参数的方法,现记录如下。

2.1利用txt中的“编辑”—>“替换”操作

当前分隔符为‘,’

替换为‘ | ’,并单击全部替换

替换后,分隔符为‘ | ’

2.2小tips

选择分隔符的时候有可能面临

“这么大空挡是几个空格?”

“这个逗号是中文的还是英文的?”

所以建议直接用鼠标拉着两个数据之间的分割区域,复制,然后粘贴填入要替换的框中。(像我这种手残眼花的人就喜欢这种方式。。。)

补充:Python read_csv 报错:‘gbk‘ codec can‘t decode byte 0xb4 in position 8: illegal multibyte sequence

在我们使用pandas.read_csv()读取文件时 经常会遇到UnicodeDecodeError 的错误

我遇到的主要有两种:

UnicodeDecodeError: 'gbk' codec can't decode byte 0xb4 in position 8: illegal multibyte sequence

或者

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbc in position 2: invalid start byte

尝试过改encoding="gbk",encoding="utf-8"或者GB2312、gbk、ISO-8859-1的方法,有时候能够起效果,有时候不行

介绍一种最有效的方法:​​​​​​

1.找到csv文件–>右键–>打开方式–>记事本

2.打开记事本之后,在右下角可以看到文件的默认编码格式为ANSI,选择头部菜单的“文件–>另存为”,

3.选择编码下拉框,选择需要的编码格式UTF-8,重新保存即可

4.使用 read_csv('./test.csv', encoding="utf-8") 即可

下面我遇到过错误可以尝试的解决办法如下(推荐使用上面的,下面的有时候也不行):

1. csvdata = pd.read_csv(file, keep_default_na=False, encoding="gbk")

报错:

UnicodeDecodeError: 'gbk' codec can't decode byte 0xb4 in position 8: illegal multibyte sequence

解决:将 encoding="gbk" 改为encoding="utf-8" 或者删掉

2. csvdata = pd.read_csv(file, keep_default_na=False)

报错:

UnicodeDecodeError: 'utf-8' codec can't decode byte 0xbc in position 2: invalid start byte

解决:加上 encoding="gbk" 试试看

总结

到此这篇关于Python使用read_csv读数据遇到分隔符问题的2种解决方式的文章就介绍到这了,更多相关Python read_csv读数据分隔符问题内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Pycharm中的Python Console用法解读

    Pycharm中的Python Console用法解读

    这篇文章主要介绍了Pycharm中的Python Console用法解读,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-01-01
  • Python json格式化打印实现过程解析

    Python json格式化打印实现过程解析

    这篇文章主要介绍了Python json格式化打印实现过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-07-07
  • 解决tf.keras.models.load_model加载模型报错问题

    解决tf.keras.models.load_model加载模型报错问题

    这篇文章主要介绍了解决tf.keras.models.load_model加载模型报错问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-06-06
  • Python FFT合成波形的实例

    Python FFT合成波形的实例

    今天小编大家分享一篇Python FFT合成波形的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • Python实现线程状态监测简单示例

    Python实现线程状态监测简单示例

    这篇文章主要介绍了Python实现线程状态监测,结合简单实例形式分析了Python线程start启动、sleep推迟运行、isAlive判断等方法使用技巧,需要的朋友可以参考下
    2018-03-03
  • Python Pandas实现DataFrame合并的图文教程

    Python Pandas实现DataFrame合并的图文教程

    我们在使用pandas处理数据的时候,往往会需要合并两个或者多个DataFrame的操作,下面这篇文章主要给大家介绍了关于Pandas实现DataFrame合并的相关资料,需要的朋友可以参考下
    2022-07-07
  • python 进程 进程池 进程间通信实现解析

    python 进程 进程池 进程间通信实现解析

    这篇文章主要介绍了python 进程 进程池 进程间通信实现解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-08-08
  • python切片(获取一个子列表(数组))详解

    python切片(获取一个子列表(数组))详解

    这篇文章主要介绍了python切片(获取一个子列表(数组))详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-08-08
  • Django Paginator分页器的使用示例

    Django Paginator分页器的使用示例

    django内置的分页器组件,能够帮我们实现对查询的数据进行自动分页,并返回分页对象,本文讲解分页器的用法
    2021-06-06
  • numpy中的norm()函数求范数实例

    numpy中的norm()函数求范数实例

    这篇文章主要介绍了numpy中的norm()函数求范数实例,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-02-02

最新评论