利用Python读取Excel表内容的详细过程

 更新时间:2022年10月17日 14:48:53   作者:WYKB_Mr_Q  
python有多种方式可以去读取excel文档的内容,下面这篇文章主要给大家介绍了利用Python读取Excel表内容的详细过程,文中通过实例代码介绍的非常详细,需要的朋友可以参考下

用python读取excel表中的数据

假如说有如下一张存储了数据的excel表,其中x1-x6是特征,y_label是特征对应的类别标签。我们想要使用python对以下数据进行数据分析,那么第一步就要先把excel表中的数据读取出来才行。这里我们主要使用到了python中的pandas库。

首先确定excel表存放的路径所在,比如我的路径是 ‘E:\relate_code\svm\dataset\data.xlsx’.

import pandas as pd

file_path = r'E:\relate_code\svm\dataset\data.xlsx'   # r对路径进行转义,windows需要
raw_data = pd.read_excel(file_path, header=0)  # header=0表示第一行是表头,就自动去除了
print(raw_data)

这样就可以取出数据了,输出见下图。可以看出,这里就没有表中的x1等表头信息了。

但是,最左边这里还有0-169这些行号额外信息,咱们可以用以下命令只要里面的有用信息,并保存到数组中。

data = raw_data.values     # 只提取表中信息
print(data)

输出结果:

这时候数据就都读进来了,并且存储为了数组形式。咱们可以选择想要的数据,比如想把x和y分开,毕竟一个是特征,另一个是标签,这时候可以使用以下代码。

features = data[:, 0:6]  # 由于是二维数组,所以第一个冒号表示选择所有行,之后0:6表示只要前六列的数据
labels = data[:, -1]     # 标签只要最后一列

1、还可以对特征进行选择,假如只要第四列的特征也可以使用:

feature_4 = data[: 3:4]  # 这样得出的数组依然是二维数组,便于后续特征操作

2、如果不想要第四个特征,其它都想要,也可以这样使用,需要用到numpy库:

import numpy as np

feature1_3 = data[:, 0:3]   # 取前三列特征
feature5_6 = data[:, 4:6]   # 取第5,第6列特征
feature_choose = np.hstack(feature1_3, feature5_6)   # 对两份特征进行特征拼接

这里再多说一下,np.hstack()函数和 np.vstack()函数:

这里是np.vstack()函数。主要是进行竖直堆叠,使用这个函数的时候要保证两个数组列数是一致的(都是三列),得出的结果如下。

import numpy as np

arr1 = np.array([[1, 2, 3], [4, 5, 6]])
arr2 = np.array([7, 8, 9])
print(np.vstack((arr1, arr2)))

下面是np.hstack()函数,主要是进行水平堆叠,使用这个函数的时候要保证行数是一致的(都是两行)。

import numpy as np

arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[7, 8, 9], [10, 11, 12]])
print(np.hstack((arr1, arr2)))

就先介绍到这里吧,下一篇文章介绍机器学习的代码使用!

总结

到此这篇关于利用Python读取Excel表内容的文章就介绍到这了,更多相关Python读取Excel表内容内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python爬虫MeterSphere平台执行报告使用进阶

    python爬虫MeterSphere平台执行报告使用进阶

    这篇文章主要为大家介绍了python爬虫MeterSphere平台执行报告使用进阶示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-12-12
  • Python where函数保姆级使用教程

    Python where函数保姆级使用教程

    本文主要和大家介绍了详解Python中where()函数的用法,小编觉得挺不错的,现在分享给大家,也给大家做个参,希望能帮助到大家
    2022-06-06
  • 详解Python单元测试的两种写法

    详解Python单元测试的两种写法

    python的两个单元测试包分别是 doctest 和 unittest,这两个包的使用起来各有长处,适用于不同的场景,这篇文章主要介绍了Python单元测试的两种写法,需要的朋友可以参考下
    2022-07-07
  • Python实现选择排序

    Python实现选择排序

    选择法也算是入门的一种排序算法,比起冒泡法,它的方法巧妙了一些,它的出发点在于“挑”,每次挑选数组的最值,与前置元素换位,然后继续挑选剩余元素的最值并重复操作。个人认为选择排序的意义不在于排序本身,而在于挑选和置换的方法,对于一些问题很有帮助。
    2017-06-06
  • 使用Python进行自动化部署详解

    使用Python进行自动化部署详解

    在软件开发和运维领域,自动化部署是一个至关重要的环节,本文将介绍如何使用Python进行自动化部署,并提供代码实例来说明,希望对大家有所帮助
    2024-04-04
  • 详解Python中DOM方法的动态性

    详解Python中DOM方法的动态性

    这篇文章主要介绍了详解Python中DOM方法的动态性,xml.dom模块在Python的网络编程中相当有用,本文来自于IBM官网的开发者技术文档,需要的朋友可以参考下
    2015-04-04
  • 解决Python中回文数和质数的问题

    解决Python中回文数和质数的问题

    今天小编就为大家分享一篇解决Python中回文数和质数的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-11-11
  • CentOS 7下安装Python 3.5并与Python2.7兼容并存详解

    CentOS 7下安装Python 3.5并与Python2.7兼容并存详解

    这篇文章主要给大家介绍了在CentOS 7下安装Python 3.5并与Python2.7兼容并存的相关资料,文中将安装步骤介绍的非常详细,对大家具有一定的参考学习价值,需要的朋友们下面跟着小编来一起学习学习吧。
    2017-07-07
  • Matplotlib绘图基础之画布详解

    Matplotlib绘图基础之画布详解

    Matplotlib 库是一个用于数据可视化和绘图的 Python 库,这篇文章主要为大家介绍了下Matplotlib绘制的图形中的第一个重要的元素--画布,感兴趣的可以了解下
    2023-07-07
  • 教你用scrapy框架爬取豆瓣读书Top250的书类信息

    教你用scrapy框架爬取豆瓣读书Top250的书类信息

    这篇文章主要介绍了教你用scrapy框架爬取豆瓣读书Top250的书类信息,文中提供了解决思路和部分实现代码,需要的朋友可以参考下
    2023-03-03

最新评论