python语言中pandas字符串分割str.split()函数

 更新时间:2022年08月04日 16:09:50   作者:hanyunkaka  
分列在我们日常工作中经常用到,从各种系统中导出的什么订单号、名称、日期很多都是复合组成的,这些列在匹配、合并时没有办法使用,我们经常需要将她们分开,下面这篇文章主要给大家介绍了关于python语言中pandas字符串分割str.split()函数的相关资料,需要的朋友可以参考下

前言

为了介绍python语言中pandas库在数据分析中的重要作用,本人打算以NBA球星勒布朗詹姆斯在2020-2021赛季常规赛个人数据为例对pandas相关函数进行详细说明。利用爬虫技术,在知名篮球网站虎扑爬取了勒布朗詹姆斯的数据,稍后会将数据上传至csdn,以供大家下载。

这篇文章,详细介绍了pandas字符串分割函数---str.split()的用法。

DataFrame.str.split(pa,n,expand)
pat:字符串分隔符,默认为空格。
n:用于指定需要分割的次数,默认为-1。其中,None,0和-1都被解释为返回所有分割的字符串。
expand:将拆分的字符串展开为单独的列,默认为False。

                True:返回DataFrame / MultiIndex;

                False:返回包含字符串列表的Series / Index。

1、常规赛数据格式

勒布朗詹姆斯2020-2021赛季常规赛个人数据的数据结构如下:

日期对手比分时间投篮...
05/17鹈鹕110-98(胜)2711-22...
05/16步行者122-115(胜)2811-22...
..................

2、计算詹姆斯常规赛命中率

勒布朗詹姆斯2020-2021赛季常规赛个人数据中只有每场比赛的命中率,数据的第4列为每场比赛的投篮数和命中数,格式为"命中数-投篮数"。如果想要计算詹姆斯整个常规赛的命中率,则需要算出他常规赛的投篮数和命中数。此时,需要用到pandas分割字符串函数str.split()。

import numpy as np
import pandas as pd
df = pd.read_csv(“lbj-2020-2021-regular.csv”,encoding="gbk")
df0 = df['投篮'].str.split("-",expand=True)
df0.columns = ['命中数','投篮数']

DataFrame类型的df0即为詹姆斯常规赛的命中数和投篮数,如下所示:

0命中数投篮数
11122
21122
.........

因为要分别求取命中数和投篮数的总和,所以需要将df0的列转化为整型,继而可得到詹姆斯整个常规赛的命中率。

df0['命中数'] = df0['命中数'].astype('int')
df0['投篮数'] = df0['投篮数'].astype('int')
ShootRate = df0['命中数'].sum() / df0['投篮数'].sum()

计算得到,詹姆斯2020-2021常规赛投篮命中率为51.34%,还是很不错的水平。

总结

到此这篇关于python语言中pandas字符串分割str.split()函数的文章就介绍到这了,更多相关pandas字符串分割str.split()函数内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python调用Java数据接口实现CRUD操作的详细指南

    Python调用Java数据接口实现CRUD操作的详细指南

    Python和Java作为两种流行的编程语言,在企业级应用中常常需要实现跨语言的数据交互,下面我们就来看看如何在Django Python项目中调用Java数据接口实现CRUD操作吧
    2025-04-04
  • 如何解决pytorch训练过程中CPU内存溢出问题

    如何解决pytorch训练过程中CPU内存溢出问题

    这篇文章主要介绍了如何解决pytorch训练过程中CPU内存溢出问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-09-09
  • Python 私有函数的实例详解

    Python 私有函数的实例详解

    这篇文章主要介绍了Python 私有函数的实例详解的相关资料,希望通过本文大家能掌握Python 私有函数的使用方法,需要的朋友可以参考下
    2017-09-09
  • Python数据分析模块pandas用法详解

    Python数据分析模块pandas用法详解

    这篇文章主要介绍了Python数据分析模块pandas用法,结合实例形式详细分析了Python数据分析模块pandas的功能、常见用法及相关操作注意事项,需要的朋友可以参考下
    2019-09-09
  • Python button选取本地图片并显示的实例

    Python button选取本地图片并显示的实例

    今天小编就为大家分享一篇Python button选取本地图片并显示的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-06-06
  • 利用pyecharts实现地图可视化的例子

    利用pyecharts实现地图可视化的例子

    今天小编就为大家分享一篇利用pyecharts实现地图可视化的例子,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-08-08
  • python得到电脑的开机时间方法

    python得到电脑的开机时间方法

    今天小编就为大家分享一篇python得到电脑的开机时间方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • 详解Python进行数据相关性分析的三种方式

    详解Python进行数据相关性分析的三种方式

    相关系数量化数据集的变量或特征之间的关联。这些统计数据对科学和技术非常重要,Python 有很好的工具可以用来计算它们。SciPy、NumPy 和Pandas相关方法以及数据可视化功能,感兴趣的可以了解一下
    2022-04-04
  • 详解利用Pandas求解两个DataFrame的差集,交集,并集

    详解利用Pandas求解两个DataFrame的差集,交集,并集

    这篇文章主要和大家讲解一下如何利用Pandas函数求解两个DataFrame的差集、交集、并集,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
    2022-07-07
  • Python入门教程(二)Python快速上手

    Python入门教程(二)Python快速上手

    这篇文章主要介绍了Python入门教程(二)Python快速上手,Python是一门非常强大好用的语言,也有着易上手的特性,本文为入门教程,需要的朋友可以参考下
    2023-04-04

最新评论