Python利用Pandas进行数据分析的方法详解

 更新时间:2022年09月05日 08:21:52   作者:海拥  
Pandas是最流行的用于数据分析的 Python 库。它提供高度优化的性能。本文将利用Python进行数据分析,感兴趣的小伙伴可以跟随小编一起学习一下

Pandas是最流行的用于数据分析的 Python 库。它提供高度优化的性能,后端源代码完全用CPython编写。

我们可以通过以下方式分析 pandas 中的数据:

1.Series

2.数据帧

Series

Series 是 pandas 中定义的一维(1-D)数组,可用于存储任何数据类型。

代码 #1

创建 Series

# 创建 Series 的程序

# 导入 Panda 库
import pandas as pd

# 使用数据和索引创建 Series
a = pd.Series(Data, index = Index)

在这里,数据可以是:

  • 一个标量值,可以是 integerValue、字符串
  • 可以是键值对的Python 字典
  • 一个Ndarray

注意:默认情况下,索引从 0、1、2、...(n-1) 开始,其中 n 是数据长度。

代码 #2

当 Data 包含标量值时

# 使用标量值创建 Series 的程序

# 数值数据
Data =[1, 3, 4, 5, 6, 2, 9]

# 使用默认索引值创建系列
s = pd.Series(Data)	

# 预定义的索引值
Index =['a', 'b', 'c', 'd', 'e', 'f', 'g']

# 创建具有预定义索引值的系列
si = pd.Series(Data, Index)

输出

具有默认索引的标量数据

带索引的标量数据

代码#3

当数据包含字典时

# 创建词典 Series 程序
dictionary ={'a':1, 'b':2, 'c':3, 'd':4, 'e':5}

# 创建字典类型 Series
sd = pd.Series(dictionary)

输出

字典类型数据

代码 #4

当 Data 包含 Ndarray

# 创建 ndarray series 的程序

# 定义二维数组
Data =[[2, 3, 4], [5, 6, 7]]

# 创建一系列二维数组
snd = pd.Series(Data)	

输出

数据作为 Ndarray

数据框

DataFrames是 pandas 中定义的二维(2-D)数据结构,由行和列组成。

代码 #1

创建 DataFrame

# 创建 DataFrame 的程序

# 导入库
import pandas as pd

# 使用数据创建 DataFrame
a = pd.DataFrame(Data)

在这里,数据可以是:

  • 一本或多本词典
  • 一个或多个Series
  • 2D-numpy Ndarray

代码 #2

当数据是字典时

# 使用两个字典创建数据框的程序

# 定义字典 1
dict1 ={'a':1, 'b':2, 'c':3, 'd':4}

# 定义字典 2
dict2 ={'a':5, 'b':6, 'c':7, 'd':8, 'e':9}

# 用 dict1 和 dict2 定义数据
Data = {'first':dict1, 'second':dict2}

# 创建数据框
df = pd.DataFrame(Data)

输出

带有两个字典的 DataFrame

代码 #3

当数据是Series时

# 创建三个系列的Dataframe的程序
import pandas as pd

# 定义 series 1
s1 = pd.Series([1, 3, 4, 5, 6, 2, 9])

# 定义 series 2
s2 = pd.Series([1.1, 3.5, 4.7, 5.8, 2.9, 9.3])

# 定义 series 3
s3 = pd.Series(['a', 'b', 'c', 'd', 'e'])	

# 定义 Data
Data ={'first':s1, 'second':s2, 'third':s3}

# 创建 DataFrame
dfseries = pd.DataFrame(Data)			

输出

三个 Series 的 DataFrame

代码 #4

当 Data 为 2D-numpy ndarray注意:在创建 2D 数组的 DataFrame 时必须保持一个约束 - 2D 数组的维度必须相同。

# 从二维数组创建 DataFrame 的程序

# 导入库
import pandas as pd

# 定义 2d 数组 1
d1 =[[2, 3, 4], [5, 6, 7]]

# 定义 2d 数组 2
d2 =[[2, 4, 8], [1, 3, 9]]

# 定义 Data
Data ={'first': d1, 'second': d2}

# 创建 DataFrame
df2d = pd.DataFrame(Data)	

输出

带有 2d ndarray 的 DataFrame

到此这篇关于Python利用Pandas进行数据分析的方法详解的文章就介绍到这了,更多相关Python Pandas数据分析内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python raise的基本使用

    python raise的基本使用

    这篇文章主要介绍了python raise的基本使用,帮助大家更好的理解和学习python,感兴趣的朋友可以了解下
    2020-09-09
  • 一文详解Python中的重试机制

    一文详解Python中的重试机制

    本文将给大家介绍一个第三方库-Tenacity(标题中的重试机制并并不准确,它不是 Python 的内置模块,因此并不能称之为机制),它实现了几乎我们可以使用到的所有重试场景,快跟随小编一起学习一下吧
    2022-07-07
  • python语音识别实践之百度语音API

    python语音识别实践之百度语音API

    这篇文章主要为大家详细介绍了python语音识别实践之百度语音API,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-08-08
  • Python全栈之for循环

    Python全栈之for循环

    这篇文章主要为大家介绍了Python for循环,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2021-11-11
  • Laravel+Dingo/Api 自定义响应的实现

    Laravel+Dingo/Api 自定义响应的实现

    这篇文章主要介绍了Laravel+Dingo/Api 自定义响应的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-02-02
  • 一步步教你用python代码画一幅星空

    一步步教你用python代码画一幅星空

    这篇文章主要给大家介绍了关于如何使用python代码画一幅星空的相关资料,Python是一种非常流行的编程语言,它可以用来创建许多有趣的项目,例如绘制星空,需要的朋友可以参考下
    2023-09-09
  • Pycharm debug程序,跳转至指定循环条件/循环次数问题

    Pycharm debug程序,跳转至指定循环条件/循环次数问题

    这篇文章主要介绍了Pycharm debug程序,跳转至指定循环条件/循环次数问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-08-08
  • tensorflow mnist 数据加载实现并画图效果

    tensorflow mnist 数据加载实现并画图效果

    TensorFlow™ 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。这篇文章给大家介绍tensorflow mnist 数据加载实现并画图效果,感兴趣的朋友一起看看吧
    2020-02-02
  • VSCode Python开发环境配置的详细步骤

    VSCode Python开发环境配置的详细步骤

    这篇文章主要介绍了VSCode Python开发环境配置的详细步骤,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2019-02-02
  • 在Windows8上的搭建Python和Django环境

    在Windows8上的搭建Python和Django环境

    作为一个.NET程序员,真心不喜欢以及PHP这种松散的语法。有人说,程序员应该多学几门语言,本想学习Java,无奈感觉Java的语法太啰嗦了。很多人都推荐Python,说它的语法简洁,执行效率高。趁这两天空闲,开始学习Python。
    2014-07-07

最新评论