pandas如何读取含有中文的excel

 更新时间:2024年02月23日 15:37:00   作者:语嫣凝冰  
这篇文章主要介绍了pandas如何读取含有中文的excel问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

pandas读取含有中文的excel

在读取含有中文的 Excel 文件时,需要使用 encoding 参数设置编码方式。

常用的编码方式有 'gbk' 和 'utf-8'。

示例代码:

import pandasas pd
 
# 读取含有中文的 Excel 文件
df = pd.read_excel('filename.xlsx', encoding='gbk')

如果读取过程中出现乱码,可以尝试更换编码方式。

pandas读取excel时遇到的编码问题 unknown_codepage_21010

最近在使用pandas读取不规则excel表时遇到了一种编码问题,自己找了好久资料也是终于综合了一下解决了这种编码异常的问题。  

首先呢,报错会提示 下面这种错误:

unknown encoding: unknown_codepage_21010

自己在找资料的时候看到一篇很早在git上发布的一篇文章,意思就是让直接明确将编码设置好,具体可以看一下git链接

https://github.com/okfn/messytables/issues/47

最后呢,自己改了一个源文件里的东西,其实也不知道是不是正确的,但是这个问题却解决了,所以分享出来,也算是为自己记录一下,以防以后再次遇到这个问题,又得找半天。

找到xlrd的__init__.py文件,在 open_workbook 模块中将encoding_override的值明确为"cp1252",其实具体这样做的原因就是将编码明确,使得可以识别这种异常编码。

def open_workbook(filename=None,
                  logfile=sys.stdout,
                  verbosity=0,
                  use_mmap=USE_MMAP,
                  file_contents=None,
                  encoding_override="cp1252",
                  formatting_info=False,
                  on_demand=False,
                  ragged_rows=False):

这样问题就成功解决了~

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • python 中[0]*2与0*2的区别说明

    python 中[0]*2与0*2的区别说明

    这篇文章主要介绍了python 中[0]*2与0*2的区别说明,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2021-05-05
  • Scipy稀疏矩阵bsr_array的使用

    Scipy稀疏矩阵bsr_array的使用

    本文主要介绍了Scipy稀疏矩阵bsr_array的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2023-02-02
  • 基于python tkinter的点名小程序功能的实例代码

    基于python tkinter的点名小程序功能的实例代码

    这篇文章主要介绍了基于python tkinter的点名小程序,本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-08-08
  • 一文教你Python如何创建属于自己的IP池

    一文教你Python如何创建属于自己的IP池

    这篇文章主要为大家详细介绍了python如何创建属于自己的IP池,文中的示例代码讲解详细,对我们学习或工作有一定参考价值,需要的可以参考一下
    2022-04-04
  • Python bisect模块原理及常见实例

    Python bisect模块原理及常见实例

    这篇文章主要介绍了Python bisect模块原理及常见实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-06-06
  • Python实现四舍五入的两个方法总结

    Python实现四舍五入的两个方法总结

    这篇文章主要介绍了python中实现四舍五入的两种方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-09-09
  • Pandas中Series和DataFrame的索引实现

    Pandas中Series和DataFrame的索引实现

    这篇文章主要介绍了Pandas中Series和DataFrame的索引实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-06-06
  • 解决python3.x安装numpy成功但import出错的问题

    解决python3.x安装numpy成功但import出错的问题

    这篇文章主要介绍了解决python3.x安装numpy成功但import出错的问题,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-11-11
  • PyTorch详解经典网络种含并行连结的网络GoogLeNet实现流程

    PyTorch详解经典网络种含并行连结的网络GoogLeNet实现流程

    今天小编就为大家分享一篇Pytorch实现GoogLeNet的方法,GoogLeNet提出了一个名为“Inception”的深度卷积神经网结构,其目标是将分类、识别ILSVRC14数据集的技术水平提高一个层次。这一结构的主要特征是对网络内部计算资源的利用进行了优化
    2022-05-05
  • python 提取key 为中文的json 串方法

    python 提取key 为中文的json 串方法

    今天小编就为大家分享一篇python 提取key 为中文的json 串方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12

最新评论