关于数据分析Pandas的Series用法总结

 更新时间:2023年07月06日 10:29:50   作者:信橙则灵  
这篇文章主要介绍了关于数据分析Pandas的Series用法总结,Series序列,是一种一维的结构,类似于一维列表和ndarray中的一维数组,但是功能比他们要更为强大,Series由两部分组成:索引index和数值values,本篇对其用法做出总结

Series

Series是线性的数据结构,带有标签的一维数组,轴标签统称为索引,数据和标签之间存在联系

一、导入Series

from pandas import Series

如果没有安装pandas的话,使用pip install pandas 进行导入

二、创建Series

1、使用列表或者numpy进行创建,默认索引为0到N-1的整数型索引

a = Series([list], index=[list])

备注:      

index: 设置Series的index,index列表的元素个数跟数据list的元素个数要对应起来

示例:      

没有index的话,默认index为0到N-1的整数型索引

obj = Series([1,2,3,4])
obj

在这里插入图片描述

自定义 index:

obj2 = Series([1,2,3,4],index=[‘a',‘b',‘c',‘d'])
obj2

在这里插入图片描述

numpy创建跟list创建是相同的道理

在这里插入图片描述

2、使用字典创建(推荐使用)

创建方法为:

a = Series({Dict})

示例:

obj = Series({‘a':1,‘b':2, ‘c':3, ‘d':4})
obj

在这里插入图片描述

总结: 比较推荐使用方法2,是因为方法2中没有对应index(index中的元素个数要跟数据个数相同)的限制,这样方法2就会比较自由

创建成功之后,下一步就是取值,Series可通过索引和切片的方法进行取值

三、Series的索引和切片

索引是为了获取具体的值,而切片则是为了获取一定范围内的值

1、显式索引与切片

显式索引

s.loc[‘索引名称']         #使用index中元素的名称作为索引值

示例: 取单个值:

obj = Series({‘a':10,‘b':12,‘c':17})
obj.loc[‘a']      # 也可省略loc,即obj.loc[‘a']

在这里插入图片描述

取多个值:

obj.loc[[‘a',‘c']]      # 或 obj[[‘a',‘c']]

在这里插入图片描述

显式切片:

obj = Series({‘a':10,‘b':12,‘c':17})
obj[‘a':‘c']         # 或 obj[‘a':‘c']

在这里插入图片描述

2、隐式索引与切片

隐式索引

s.iloc[]        #使用index中元素对应的下标作为索引值

示例: 取单个值:

obj = Series({‘a':10,‘b':12,‘c':17})
obj.iloc[0]      # 或 obj[0]

在这里插入图片描述

取多个值:

obj.iloc[[0, 1]]      # 或 obj[[0, 1]]

在这里插入图片描述

隐式切片:

obj = Series({‘a':10,‘b':12,‘c':17})
obj.iloc[0:2]      # 或 obj[0:2]

在这里插入图片描述

学了这个显式和隐式的操作,可能大家有一些迷糊,那么进行一下总结:

  • 显式索引就是通过索引值获取对应索引的结果(loc可省略)
    隐式索引就是通过索引的下标获取对应索引的结果(.loc可省略)
  • 切片和取多个值的格式要注意区分:

切片的格式为: [:]               即 一个[], 中间的为冒号,相当于list中的切片

取多值的格式为:[[,]]          即 两个[], 中间的分隔为逗号

  • 注意切片操作中,显式索引和隐式索引的区别

显式索引是通过索引值获取索引的结果,两边索引值对应的值都能取到 左闭右闭

隐式索引为通过索引的下标获取的结果,只能取到左边索引下标对应的值,右边索引下标对应的值取不到,同python中的list切片  左闭右开

  • 其实在Series中,有没有loc或者iloc好像没什么区别,但这并不说明loc和iloc就没有用,个人觉得它更有意义的是在DataFrame当中使用,而且,知道loc和iloc能阅读明白他人的代码,避免见到后不认识

四、Series的基本概念

1、通过head(),tail()快速查看Series对象的样式

1)先创建个测试数据

s = pd.Series(np.random.randint(1,10,size=(10,)))

2)获取数据的前五行数据

s.head() # 默认是前五行数据,可自定义行数,比如想要十行的话,s.head(10)

在这里插入图片描述

tail()是展示数据的后五行,也可自定义行数, 例如:s.tail(10) 即 展示数据的后10行

2、isnull(),notnull()函数检测缺失数据

缺失数据在Series中一般表示为: NaN(not a number)

1)创建测试数据

obj = Series([10,4,np.nan])

2)使用notnull()查看空值,为空则返回Flase,不为空则返回True

notnull = pd.notnull(obj)

3)根据isnull()返回的结果,取不为空的数据

obj[notnull]

在这里插入图片描述

isnull()跟notnull()的用法相同,只不过是,isnull()为空返回True,notnull()为空返回False

3、扩展

可以把Series看成一个定长的有序字典 可以通过shape,size,index,values等得到series的属性

在这里插入图片描述

五、Series的运算

1、 适用于numpy的数组运算也适用于Series

这个需要仔细了解numpy的运算才行,这个就不扩展了,大家有兴趣的话,可上网上搜索下相关知识点

2、Series之间的运算

首先说下Series之间常用的运算:

add加 sub减 mul乘 div除

1)相同索引的数据进行运算, 如果索引不对应,则补NaN

①:测试数据

A = pd.Series([2,4,6],index=[0,1,2])
B = pd.Series([1,3,5],index=[1,2,3])
display(A,B)

②: 加运算

A.add(B)

在这里插入图片描述

在A和B数据中,index(索引)中的1、2是相同的,所以对应索引的数据进行运算,而其他索引对应不上的则没有相加的数值,所以值只能为NaN

扩展

出现NaN的原因是,两个Series中,索引相关的只对应不上,但我现在不想让这些对应不上的为NaN,那么有什么办法解决这个问题呢?

fill_value: 对空值赋值

A.add(B,fill_value=0)

在这里插入图片描述

fill_value的值为0时,则是,将索引不对应的补充为0, 如果自定义为,ill_value的值为1,则,将索引不对应的补充为1

在这里插入图片描述

到此这篇关于关于数据分析Pandas的Series用法总结的文章就介绍到这了,更多相关Pandas的Series用法内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python 实现读取csv数据,分类求和 再写进 csv

    python 实现读取csv数据,分类求和 再写进 csv

    这篇文章主要介绍了python 实现读取csv数据,分类求和 再写进 csv,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-05-05
  • 如何利用itertuples对DataFrame进行遍历

    如何利用itertuples对DataFrame进行遍历

    这篇文章主要介绍了如何利用itertuples对DataFrame进行遍历问题,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-06-06
  • Python 调用有道翻译接口实现翻译

    Python 调用有道翻译接口实现翻译

    这篇文章主要介绍了Python 调用有道翻译接口实现翻译,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-03-03
  • Python利用xmltodict模块实现处理XML数据

    Python利用xmltodict模块实现处理XML数据

    理解和处理XML数据在Python中是一项常见任务,xmltodict便是一个Python库,用于将XML数据解析为易于处理的Python字典,下面我们就来学习一下xmltodict库的具体使用吧
    2023-11-11
  • 解决pyinstaller打包pyqt5的问题

    解决pyinstaller打包pyqt5的问题

    今天小编就为大家分享一篇解决pyinstaller打包pyqt5的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-01-01
  • python按行读取文件并找出其中指定字符串

    python按行读取文件并找出其中指定字符串

    这篇文章主要介绍了python按行读取文件并找出其中指定字符串的方法,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下
    2019-08-08
  • 运行独立 pyspark 时出现 Windows 错误解决办法

    运行独立 pyspark 时出现 Windows 错误解决办法

    在本篇文章里小编给大家分享的是一篇关于运行独立 pyspark 时出现 Windows 错误解决办法,对此有需求的方法可以参考下。
    2021-12-12
  • python生成式的send()方法(详解)

    python生成式的send()方法(详解)

    下面小编就为 大家带来一篇python生成式的send()方法(详解)。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-05-05
  • PyTorch中permute的基本用法示例

    PyTorch中permute的基本用法示例

    pytorch中的permute就像是numpy中的transpose()函数一样,根据指定的维度进行转置,下面这篇文章主要给大家介绍了关于PyTorch中permute的基本用法,需要的朋友可以参考下
    2022-04-04
  • python实现请求数据包签名

    python实现请求数据包签名

    这篇文章主要介绍了python实现请求数据包签名,主要以python怎么快速对请求体做一次签名为主题,塑造实现请求数据包签名过程,具有一定得参考价值,需要的小伙伴可以参考一下
    2022-02-02

最新评论