Pandas如何提取单元格中的文字并进行切片处理

 更新时间:2024年02月23日 15:06:53   作者:勤奋的大熊猫  
这篇文章主要介绍了Pandas如何提取单元格中的文字并进行切片处理方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

Pandas提取单元格中的文字并进行切片

比如有如下的Excel数据

现在我们想要提取其中付款时间列中的内容,并且仅截取出发货的当天具体时间。

使用.str.slice()来解决这一问题

代码如下:

import pandas as pd

file = pd.read_excel(r"C:\Users\15025\Desktop\uncle\debug.xlsx")
time = file["付款时间"].str.slice(11, 19)
print(time)
"""
result:
0     23:57:14
1     23:47:16
2     23:47:15
3     23:43:14
4     23:40:30
5     23:28:40
6     23:28:44
7     23:25:42
8     23:23:57
9     23:22:11
10    23:21:47
Name: 付款时间, dtype: object
"""

可以看到,我们已经成功截取出了其中的时间信息。

上述方法是比较pandas的写法。

还可以用另一种方法替代

代码如下:

import pandas as pd

file = pd.read_excel(r"C:\Users\15025\Desktop\uncle\debug.xlsx")

for i in range(len(file["付款时间"])):
    print(file["付款时间"][i][11:19])
"""
result:
23:57:14
23:47:16
23:47:15
23:43:14
23:40:30
23:28:40
23:28:44
23:25:42
23:23:57
23:22:11
23:21:47
"""

可以看到,我们也成功地获取到了我们想要的信息,但是我们使用了循环。

虽然速度感觉也不慢,还需要大量数据测试才能说明两种方法的优劣性。

目前推荐使用第一种pandas的内置方法。

如果想要对最后一行数据进行处理呢?

可以使用如下代码:

import pandas as pd

file = pd.read_excel(r"C:\Users\15025\Desktop\uncle\debug.xlsx")
time = file.iloc[-1].tolist()
time1 = file.values[-1]
print(time)
print(time1)
"""
['SXDD202112212321341427301514', '2021-12-21 23:21:34', '2021-12-21 23:21:47', '2021122122001498451403927933', 'G202112212321334217301915']
['SXDD202112212321341427301514' '2021-12-21 23:21:34'
 '2021-12-21 23:21:47' '2021122122001498451403927933'
 'G202112212321334217301915']
"""

可以看到我们成功地将最后一行的数据转化为了列表对象

接下来就可以正常的使用列表切片来获取我们需要的数据了

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。 

相关文章

  • matplotlib部件之矩形选区(RectangleSelector)的实现

    matplotlib部件之矩形选区(RectangleSelector)的实现

    这篇文章主要介绍了matplotlib部件之矩形选区(RectangleSelector)的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-02-02
  • python实现将pvr格式转换成pvr.ccz的方法

    python实现将pvr格式转换成pvr.ccz的方法

    这篇文章主要介绍了python实现将pvr格式转换成pvr.ccz的方法,涉及Python实现格式转换的相关技巧,具有一定参考借鉴价值,需要的朋友可以参考下
    2015-04-04
  • python操作小程序云数据库实现简单的增删改查功能

    python操作小程序云数据库实现简单的增删改查功能

    这篇文章主要介绍了python操作小程序云数据库实现简单的增删改查功能,本文给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-06-06
  • PyCharm最新激活码(2020/10/27全网最新)

    PyCharm最新激活码(2020/10/27全网最新)

    Pycharm最新激活码全网最新(2020/10/27更新),适用Intellij idea 2020.2.x,WebStorm 2020.2.x,Pycharm 2020.2.x
    2020-10-10
  • python修改全局变量可以不加global吗?

    python修改全局变量可以不加global吗?

    这篇文章主要探讨的是python修改全局变量可不可以不加global,我们在局部作用域内使用全局变量,需要使用global关键字进行声明,不然便不可用,但下面小编就和大家分享可以修改的数据类型在函数内部做修改操作是不需要声明global的商务情况,需要的朋友可以参考下
    2022-02-02
  • Python数据提取-lxml模块

    Python数据提取-lxml模块

    这篇文章主要介绍了Python数据提取-lxml模块,lxml模块和xpath语法的关系,lxml模块的使用场景、lxml模块的安装、谷歌浏览器xpath helper插件的安装和使用等相关内容介绍,需要的朋友可以参考一下
    2022-01-01
  • Python使用Tkinter实现转盘抽奖器的步骤详解

    Python使用Tkinter实现转盘抽奖器的步骤详解

    这篇文章主要介绍了Python使用Tkinter实现转盘抽奖器,,本文分场景通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-01-01
  • 运用Python巧妙处理Word文档的方法详解

    运用Python巧妙处理Word文档的方法详解

    大家平时在工作与学习中都会操作到Word文件格式,特别是很多数据的时候,靠人力去识别操作非常容易出错。今天就带大家用python来处理Word文件,感兴趣的可以了解一下
    2022-05-05
  • 提高Matplotlib绘图清晰度的几种方法

    提高Matplotlib绘图清晰度的几种方法

    使用python中的matplotlib.pyplot绘图的时候,如果将图片显示出来,或者另存为图片,常常会出现清晰度不够的问题,当然这种问题是对于png或者jpg这种格式的图片而言的,所以本文给大家介绍了提高Matplotlib绘图清晰度的几种方法,需要的朋友可以参考下
    2024-01-01
  • python线程池 ThreadPoolExecutor 的用法示例

    python线程池 ThreadPoolExecutor 的用法示例

    这篇文章主要介绍了python线程池 ThreadPoolExecutor 的用法示例,帮助大家更好得理解和使用python线程池,感兴趣的朋友可以了解下
    2020-10-10

最新评论