使用python读取CSV文件时遇到编码问题解决方案

 更新时间:2023年08月14日 08:32:39   作者:myrj  
这篇文章主要介绍了用python读取CSV文件时遇到编码问题,本文给大家分享最优解决方案,通过使用csvkit,它使用自动检测适当的编码和解码,需要的朋友可以参考下

尝试使用python读取CSV文件时遇到障碍。

更新:如果只想跳过字符或错误,可以打开文件,如下所示:

with open(os.path.join(directory, file), 'r', encoding="utf-8", errors="ignore") as data_file:

到目前为止,我已经尝试过了。

for directory, subdirectories, files in os.walk(root_dir):

for file in files:

with open(os.path.join(directory, file), 'r') as data_file:

reader = csv.reader(data_file)

for row in reader:

print (row)

我得到的错误是:

UnicodeEncodeError: 'charmap' codec can't encode characters in position 224-225: character maps to

我试过了

with open(os.path.join(directory, file), 'r', encoding="UTF-8") as data_file:

错误:

UnicodeEncodeError: 'charmap' codec can't encode character '\u2026' in position 223: character maps to

现在,如果我只打印data_file,它说它们是cp1252编码的,但是如果我尝试

with open(os.path.join(directory, file), 'r', encoding="cp1252") as data_file:

我得到的错误是:

UnicodeEncodeError: 'charmap' codec can't encode characters in position 224-225: character maps to

我也尝试了推荐的套餐。

我得到的错误是:

UnicodeEncodeError: 'charmap' codec can't encode characters in position 224-225: character maps to

我要解析的行是:

2015-11-28 22:23:58,670805374291832832,479174464,"MarkCrawford15","RT @WhatTheFFacts: The tallest man in the world was Robert Pershing Wadlow of Alton, Illinois. He was slighty over 8 feet 11 inches tall.","None

任何想法或帮助表示赞赏。

解决方案

我将使用csvkit,它使用自动检测适当的编码和解码。例如

import csvkit
reader = csvkit.reader(data_file)

正如聊天解决方案所述,

for directory, subdirectories, files in os.walk(root_dir):
for file in files:
with open(os.path.join(directory, file), 'r', encoding="utf-8") as data_file:
reader = csv.reader(data_file)
for row in reader:
data = [i.encode('ascii', 'ignore').decode('ascii') for i in row]
print (data)

到此这篇关于用python读取CSV文件时遇到编码问题的文章就介绍到这了,更多相关python读取CSV文件内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • 详解Python如何检查一个数字是否为科技数

    详解Python如何检查一个数字是否为科技数

    科技数(Tech Number)是一种在数学上具有一定特殊性质的数字,这篇文章主要为大家详细介绍了如何使用Python检查一个数字是否为科技数,感兴趣的可以了解下
    2024-03-03
  • Python接入MySQL实现增删改查的实战记录

    Python接入MySQL实现增删改查的实战记录

    这篇文章主要给大家介绍了关于Python接入MySQL实现增删改查的相关资料,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-03-03
  • 使用Python实现NBA球员数据查询小程序功能

    使用Python实现NBA球员数据查询小程序功能

    这篇文章主要介绍了使用Python实现NBA球员数据查询小程序功能,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-11-11
  • 一篇文章从零开始创建conda环境、常用命令的使用及pycharm配置项目环境

    一篇文章从零开始创建conda环境、常用命令的使用及pycharm配置项目环境

    在Conda中创建新环境是一个非常有用的做法,尤其是当你需要为不同的项目安装不同版本的软件包时,这篇文章主要给大家介绍了关于从零开始创建conda环境、常用命令的使用及pycharm配置项目环境的相关资料,需要的朋友可以参考下
    2024-07-07
  • Flask传递URL参数的实现

    Flask传递URL参数的实现

    在Flask中,传递URL参数是一种常见且强大的功能,本文主要介绍了Flask传递URL参数的实现,具有一定的参考价值,感兴趣的可以了解一下
    2024-09-09
  • python json load json 数据后出现乱序的解决方案

    python json load json 数据后出现乱序的解决方案

    今天小编就为大家分享一篇python json load json 数据后出现乱序的解决方案,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-02-02
  • 如何在Pycharm中制作自己的爬虫代码模板

    如何在Pycharm中制作自己的爬虫代码模板

    当有很多个个网站想要爬时,每个爬虫的代码不一样,但有某种联系,这个时候可以抽出一部分通用的代码制成模板,减少代码工作量。本文将具体介绍如何实现这一模板,需要的可以参考一下
    2021-12-12
  • pycharm使用matplotlib画图问题解决方法

    pycharm使用matplotlib画图问题解决方法

    Pycharm是一款功能强大的Python集成开发环境(IDE),它提供了许多有用的工具和功能,可以帮助开发人员更轻松地编写和调试Python代码,其中一个有用的工具是Pycharm如何画图,本文给大家介绍在pycharm中使用matplotlib画图问题,感兴趣的朋友一起看看吧
    2023-11-11
  • Python稀疏矩阵及参数保存代码实现

    Python稀疏矩阵及参数保存代码实现

    这篇文章主要介绍了Python稀疏矩阵及参数保存代码实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-04-04
  • 用python绘制彩色螺旋线代码

    用python绘制彩色螺旋线代码

    大家好,本篇文章主要讲的是用python绘制彩色螺旋线代码,感兴趣的同学赶快来看一看吧,对你有帮助的话记得收藏一下
    2022-01-01

最新评论