Python如何使用Pandas库从Excel文件中提取数据

 更新时间:2025年04月08日 08:57:51   作者:Asthenian  
今天我要分享一个超级实用的Python技巧:如何用pandas库从Excel文件中提取我们需要的数据列,这个技能在工作中特别有用,比如处理学生成绩表、客户名单等Excel数据时,可以快速获取关键信息,需要的朋友可以参考下

用Pandas轻松搞定Excel数据提取:新手也能学会的Python技巧

准备工作:安装必要的库

首先,我们需要确保电脑上安装了pandas库。如果你还没安装,只需要在命令行输入:

pip install pandas openpyxl

这里openpyxl是用来处理Excel文件的依赖库。

代码解析:一行一行来看

让我们仔细看看图片中的代码,我会用最通俗的方式解释每一行的作用:

# 导入pandas库
import pandas as pd

这行代码就像是在对Python说:"嘿,我要用pandas这个工具包了,给我准备好!"pandas是Python中处理表格数据的利器。

# 紧凑显示
pd.set_option('display.max_rows', 10)

这行代码设置了显示选项,意思是"当数据太多时,最多只显示10行,其他的用省略号表示"。这样我们的输出就不会在控制台刷屏了,看起来更清爽。

# 读文件数据
df = pd.read_excel('ClassScore.xls', index_col='学号')

这是最关键的一步: • pd.read_excel是读取Excel文件的函数 • 'ClassScore.xls'是我们的文件名 • index_col='学号'表示把"学号"这一列作为每行的标识(索引)

想象一下,这就像是在Excel中把"学号"列设置为了第一列,方便我们查找。

name = df['姓名']

这行代码从数据中提取了"姓名"这一列,相当于在Excel中选中了整个姓名列。

# 输出姓名列
print(name)

最后,我们把姓名列打印出来,就能看到整洁的学生名单了!

实际效果

运行这段代码后,你会看到类似这样的输出:

学号
2301    张三
2302    李四
2303    王五
...
2418    赵六
Name: 姓名, dtype: object

中间的"..."表示省略了一些行,这正是我们设置的紧凑显示效果。

常见问题解答

Q:为什么我的代码报错了? A:可能的原因有:

  • 文件不在当前目录下(解决方法:使用完整文件路径)
  • 文件名拼写错误(检查大小写和扩展名)
  • 列名不匹配(确认Excel中确实有"学号"和"姓名"列)

Q:如何显示更多/更少的行? A:修改display.max_rows的值即可,比如设为5就是只显示5行。

Q:能不能同时显示多列? A:当然可以!比如要显示学号和姓名:

print(df[['学号', '姓名']])

小技巧分享

  • 在Jupyter Notebook中运行这段代码,效果更直观
  • 可以用df.head()快速查看前几行数据
  • 添加encoding='utf-8'参数可以避免中文乱码问题

总结

通过这个简单的例子,我们学会了:

  • 用pandas读取Excel文件
  • 设置紧凑显示
  • 提取特定列数据
  • 输出整理后的结果

这个技能就像是一个数据处理的"瑞士军刀",简单但超级实用。掌握了它,你就能快速从各种表格中提取需要的信息,再也不用手动复制粘贴了!

以上就是Python如何使用Pandas库从Excel文件中提取数据的详细内容,更多关于Python Pandas提取Excel数据的资料请关注脚本之家其它相关文章!

相关文章

  • Python 列表(list)的常用方法

    Python 列表(list)的常用方法

    这篇文章主要介绍了Python 列表(list)的常用方法,这节主要讲列表,列表用于存储任意数目、任意类型的数据集合,本文通过示例代码给大家详细讲解,需要的朋友可以参考下
    2023-05-05
  • matplotlib jupyter notebook 图像可视化 plt show操作

    matplotlib jupyter notebook 图像可视化 plt show操作

    这篇文章主要介绍了matplotlib jupyter notebook 图像可视化 plt show操作,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • python接口自动化测试之接口数据依赖的实现方法

    python接口自动化测试之接口数据依赖的实现方法

    这篇文章主要介绍了python接口自动化测试之接口数据依赖的实现方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-04-04
  • PyQt5超详细入门级教程(推荐!)

    PyQt5超详细入门级教程(推荐!)

    PyQt5是Python编程语言的一个模块,它提供了一种在Python中使用Qt库的方式,下面这篇文章主要给大家介绍了关于PyQt5超详细入门级教程的相关资料,文中通过代码介绍的非常详细,需要的朋友可以参考下
    2024-09-09
  • Python执行JS的四种方法

    Python执行JS的四种方法

    本文将详细介绍Python中执行和调用JavaScript的多种方法,包括内置的execjs库、外部库如PyExecJS、使用浏览器引擎和与Node.js的交互,感兴趣的可以了解一下
    2023-11-11
  • python使用wmi模块获取windows下硬盘信息的方法

    python使用wmi模块获取windows下硬盘信息的方法

    这篇文章主要介绍了python使用wmi模块获取windows下硬盘信息的方法,涉及Python获取系统硬件信息的相关技巧,需要的朋友可以参考下
    2015-05-05
  • Python中Turtle库改变画笔(海龟)方向的两种方法总结

    Python中Turtle库改变画笔(海龟)方向的两种方法总结

    turtle库是python标准库之一,入门级绘图库,import turtle之后即可使用,下面这篇文章主要给大家介绍了关于Python中Turtle库改变画笔(海龟)方向的两种方法,需要的朋友可以参考下
    2022-11-11
  • Restful_framework视图组件代码实例解析

    Restful_framework视图组件代码实例解析

    这篇文章主要介绍了Restful_framework视图组件代码实例解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-11-11
  • 简单了解python模块概念

    简单了解python模块概念

    这篇文章主要介绍了简单了解python模块概念,具有一定借鉴价值,需要的朋友可以参考下
    2018-01-01
  • Python中urllib与urllib2模块的变化与使用详解

    Python中urllib与urllib2模块的变化与使用详解

    urllib是python提供的一个用于操作URL的模块,在python2.x中有URllib库,也有Urllib2库,在python3.x中Urllib2合并到了Urllib中,我们爬取网页的时候需要经常使用到这个库,需要的朋友可以参考下
    2023-05-05

最新评论