Python如何实现读取csv文件时忽略文件的编码格式

 更新时间:2025年03月04日 15:01:06   作者:一晌小贪欢  
我们再日常读取csv文件的时候经常会发现csv文件的格式有多种,所以这篇文章为大家介绍了Python如何实现读取csv文件时忽略文件的编码格式吧

1、背景介绍

我们再日常读取csv文件的时候经常会发现csv文件的格式有多种,常见的有【UTF-8】\【GBK】\ 【ANSI】格式,我们再读取的时候会加上encoding="xx"参数,为了,方便我们可以使用 chardet.detect()检测文件编码。

  • 编码检测:通过chardet自动检测文件编码,确保正确读取文件内容。
  • 异常处理:对可能出现的编码错误进行处理,提供备用的UTF-8编码读取方案。
  • CSV处理:使用标准库csv模块读取并打印CSV文件内容,包括表头和数据行。

2、库的安装

用途安装
csvcsv文件的读写内置库无需安装

3、核心代码

①:到的编码格式

def detect_encoding(file_path):
    with open(file_path, 'rb') as f:
         raw_data = f.read()
         result = chardet.detect(raw_data)
         return result['encoding']

②:调用detect_encoding函数获取文件的编码格式

def main():
    file_path = '新建XLSX 工作表.csv'
    encoding = detect_encoding(file_path)

    try:
        read_csv(file_path, encoding)
    except UnicodeDecodeError:
        # 如果检测到的编码格式读取失败,尝试使用 UTF-8 编码读取
        try:
            read_csv(file_path, 'utf-8')
        except Exception as e:
            print(f"读取文件时发生错误: {e}")
    except Exception as e:
        print(f"读取文件时发生错误: {e}")
    

4、完整代码

# -*- coding: UTF-8 -*-
'''
@Project :测试 
@File    :test2_read_csv.py
@IDE     :PyCharm 
@Author  :一晌小贪欢(278865463@qq.com)
@Date    :2025/3/1 21:40 
'''

import csv
import chardet


def detect_encoding(file_path):
    with open(file_path, 'rb') as f:
        raw_data = f.read()
        result = chardet.detect(raw_data)
        return result['encoding']


def read_csv(file_path, encoding):
    with open(file_path, 'r', encoding=encoding) as f:
        reader = csv.reader(f)
        head = next(reader)
        print("表头", head)
        for row in reader:
            print(row)


def main():
    file_path = '新建XLSX 工作表.csv'
    encoding = detect_encoding(file_path)

    try:
        read_csv(file_path, encoding)
    except UnicodeDecodeError:
        # 如果检测到的编码格式读取失败,尝试使用 UTF-8 编码读取
        try:
            read_csv(file_path, 'utf-8')
        except Exception as e:
            print(f"读取文件时发生错误: {e}")
    except Exception as e:
        print(f"读取文件时发生错误: {e}")


if __name__ == "__main__":
    main()

到此这篇关于Python如何实现读取csv文件时忽略文件的编码格式的文章就介绍到这了,更多相关Python读取csv内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python使用 toml的实现

    python使用 toml的实现

    本文将结合实例代码介绍python使用 toml的实现,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-06-06
  • python基于递归解决背包问题详解

    python基于递归解决背包问题详解

    这篇文章主要介绍了python基于递归解决背包问题,递归是个好东西,任何具有递归性质的问题通过函数递归调用会变得很简单。一个很复杂的问题,几行代码就能搞定,需要的朋友可以参考下
    2019-07-07
  • 如何利用Python合并两张图片

    如何利用Python合并两张图片

    在Python中可以使用PIL库(Python Imaging Library)来合并两张图片,这篇文章主要给大家介绍了关于如何利用Python合并两张图片的相关资料,文中给了详细的代码示例,需要的朋友可以参考下
    2024-03-03
  • Python做图像处理及视频音频文件分离和合成功能

    Python做图像处理及视频音频文件分离和合成功能

    这篇文章主要介绍了Python做图像处理及视频音频文件分离和合成功能,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-11-11
  • python matplotlib画图实例代码分享

    python matplotlib画图实例代码分享

    这篇文章主要介绍了python matplotlib画图实例代码分享,具有一定借鉴价值,需要的朋友可以参考下
    2017-12-12
  • 在python3.5中使用OpenCV的实例讲解

    在python3.5中使用OpenCV的实例讲解

    下面小编就为大家分享一篇在python3.5中使用OpenCV的实例讲解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-04-04
  • pandas.DataFrame.iloc的具体使用详解

    pandas.DataFrame.iloc的具体使用详解

    本文主要介绍了pandas.DataFrame.iloc的具体使用详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-06-06
  • Pandas删除数据的几种情况(小结)

    Pandas删除数据的几种情况(小结)

    这篇文章主要介绍了Pandas删除数据的几种情况(小结),详细的介绍了4种方式,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-06-06
  • Python完全新手教程

    Python完全新手教程

    Python完全新手教程...
    2007-02-02
  • pymongo如何通过oplog获取数据(mongodb)

    pymongo如何通过oplog获取数据(mongodb)

    使用MongoDB的oplog(操作日志)进行数据同步是高级的用法,主要用于复制和故障恢复,这篇文章主要介绍了pymongo通过oplog获取数据(mongodb),需要的朋友可以参考下
    2023-09-09

最新评论