Python如何实现读取csv文件时忽略文件的编码格式

 更新时间:2025年03月04日 15:01:06   作者:一晌小贪欢  
我们再日常读取csv文件的时候经常会发现csv文件的格式有多种,所以这篇文章为大家介绍了Python如何实现读取csv文件时忽略文件的编码格式吧

1、背景介绍

我们再日常读取csv文件的时候经常会发现csv文件的格式有多种,常见的有【UTF-8】\【GBK】\ 【ANSI】格式,我们再读取的时候会加上encoding="xx"参数,为了,方便我们可以使用 chardet.detect()检测文件编码。

  • 编码检测:通过chardet自动检测文件编码,确保正确读取文件内容。
  • 异常处理:对可能出现的编码错误进行处理,提供备用的UTF-8编码读取方案。
  • CSV处理:使用标准库csv模块读取并打印CSV文件内容,包括表头和数据行。

2、库的安装

用途安装
csvcsv文件的读写内置库无需安装

3、核心代码

①:到的编码格式

def detect_encoding(file_path):
    with open(file_path, 'rb') as f:
         raw_data = f.read()
         result = chardet.detect(raw_data)
         return result['encoding']

②:调用detect_encoding函数获取文件的编码格式

def main():
    file_path = '新建XLSX 工作表.csv'
    encoding = detect_encoding(file_path)

    try:
        read_csv(file_path, encoding)
    except UnicodeDecodeError:
        # 如果检测到的编码格式读取失败,尝试使用 UTF-8 编码读取
        try:
            read_csv(file_path, 'utf-8')
        except Exception as e:
            print(f"读取文件时发生错误: {e}")
    except Exception as e:
        print(f"读取文件时发生错误: {e}")
    

4、完整代码

# -*- coding: UTF-8 -*-
'''
@Project :测试 
@File    :test2_read_csv.py
@IDE     :PyCharm 
@Author  :一晌小贪欢(278865463@qq.com)
@Date    :2025/3/1 21:40 
'''

import csv
import chardet


def detect_encoding(file_path):
    with open(file_path, 'rb') as f:
        raw_data = f.read()
        result = chardet.detect(raw_data)
        return result['encoding']


def read_csv(file_path, encoding):
    with open(file_path, 'r', encoding=encoding) as f:
        reader = csv.reader(f)
        head = next(reader)
        print("表头", head)
        for row in reader:
            print(row)


def main():
    file_path = '新建XLSX 工作表.csv'
    encoding = detect_encoding(file_path)

    try:
        read_csv(file_path, encoding)
    except UnicodeDecodeError:
        # 如果检测到的编码格式读取失败,尝试使用 UTF-8 编码读取
        try:
            read_csv(file_path, 'utf-8')
        except Exception as e:
            print(f"读取文件时发生错误: {e}")
    except Exception as e:
        print(f"读取文件时发生错误: {e}")


if __name__ == "__main__":
    main()

到此这篇关于Python如何实现读取csv文件时忽略文件的编码格式的文章就介绍到这了,更多相关Python读取csv内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python从入门到精通(DAY 3)

    python从入门到精通(DAY 3)

    本文是python从入门到精通系列文章的第三篇,主要是给大家讲诉做的一个编写登陆接口练习程序的全过程,非常的细致,有需要的小伙伴可以参考下。
    2015-12-12
  • Python操作Excel之xlsx文件

    Python操作Excel之xlsx文件

    前段时间做一个项目,不得不使用Python直接生成Excel文件,后来随着需求的变化,还要对已有的Excel文件进行读取。所以想着记录下来,这篇文章主要给大家介绍了Python操作Excel之xlsx文件的相关资料,需要的朋友可以参考下。
    2017-03-03
  • Python 面向对象 成员的访问约束

    Python 面向对象 成员的访问约束

    在Java,C++,以及PHP中都有对应的关键字,public,protected,private,但是在Python中却没有这些关键字来声明类成员的访问作用域。
    2008-12-12
  • python写日志文件操作类与应用示例

    python写日志文件操作类与应用示例

    这篇文章主要介绍了python写日志文件操作类与应用,结合实例形式分析了Python日志文件操作类的定义与使用相关操作技巧,需要的朋友可以参考下
    2019-07-07
  • python添加命令行参数的详细过程

    python添加命令行参数的详细过程

    Click 是 Flask 的开发团队 Pallets 的另一款开源项目,它是用于快速创建命令行的第三方模块,这篇文章主要介绍了python怎么添加命令行参数,需要的朋友可以参考下
    2023-06-06
  • python实现CSF地面点滤波算法原理解析

    python实现CSF地面点滤波算法原理解析

    这篇文章主要介绍了python实现CSF地面点滤波算法原理,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2021-08-08
  • Python抓取数据到可视化全流程的实现过程

    Python抓取数据到可视化全流程的实现过程

    这篇文章主要介绍了Python抓取数据到可视化全流程的实现过程,
    2022-01-01
  • Python短信轰炸的代码

    Python短信轰炸的代码

    这篇文章主要介绍了Python短信轰炸的代码,代码简单易懂,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-03-03
  • Flask 的路由Route详情

    Flask 的路由Route详情

    在上一篇Flask 入门Web 微框架Hello Flask中,我们用 Flask 框架写了一个 Hello Flask 应用程序,我们了解到 Flask 框架简洁高效、可以快速上手,接下来将对 Flask 框架的各项功能详细的介绍一下,本篇文章介绍的是 Flask 的路由(Route),需要的朋友可以参考一下
    2021-11-11
  • Python中让MySQL查询结果返回字典类型的方法

    Python中让MySQL查询结果返回字典类型的方法

    这篇文章主要介绍了Python中让MySQL查询结果返回字典类型的方法,默认情况下Mysql返回的是元组类型,本文实现了返回字典类型,需要的朋友可以参考下
    2014-08-08

最新评论