Python Pandas describe()函数的使用详解

 更新时间:2024年05月25日 14:48:26   作者:高斯小哥  
pandas库中的describe()函数为我们提供了这样的功能,它可以快速生成数据集的描述性统计信息,这篇文章主要介绍了Python Pandas describe()函数的使用介绍,需要的朋友可以参考下

一、初识describe()函数

  在数据分析和处理的过程中,我们经常需要了解数据的基本统计信息,如均值、标准差、最小值、最大值等。pandas库中的describe()函数为我们提供了这样的功能,它可以快速生成数据集的描述性统计信息。

二、describe()函数的基本用法

  describe()函数是pandas库中DataFrame和Series对象的一个方法,它默认返回以下统计信息:

  • count:非空值的数量
  • mean:平均值
  • std:标准差
  • min:最小值
  • 25%:第一四分位数(Q1)
  • 50%:第二四分位数(中位数,Q2)
  • 75%:第三四分位数(Q3)
  • max:最大值

使用示例:

import pandas as pd
# 创建一个简单的DataFrame
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': [10, 20, 30, 40, 50]
}
df = pd.DataFrame(data)
# 使用describe()函数
description = df.describe()
print(description)

输出:

              A         B          C
count  5.000000  5.000000   5.000000
mean   3.000000  3.000000  30.000000
std    1.581139  1.581139  15.811388
min    1.000000  1.000000  10.000000
25%    2.000000  2.000000  20.000000
50%    3.000000  3.000000  30.000000
75%    4.000000  4.000000  40.000000
max    5.000000  5.000000  50.000000

三、定制describe()函数的输出

  describe()函数提供了多个参数,允许我们定制输出的统计信息。

  • percentiles:指定要包括的其他百分位数,例如percentiles=[.25, .5, .75]将返回第一、第二和第三四分位数。
  • include:指定要包括的数据类型,默认为'all',可以设置为'all', 'nums', 或 'object'
  • exclude:指定要排除的数据类型。

使用示例:

import pandas as pd
# 创建一个简单的DataFrame
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': [10, 20, 30, 40, 50]
}
df = pd.DataFrame(data)
# 使用describe()函数定制输出
custom_description = df.describe(percentiles=[.30, .60, .90])
print(custom_description)

输出:

              A         B          C
count  5.000000  5.000000   5.000000
mean   3.000000  3.000000  30.000000
std    1.581139  1.581139  15.811388
min    1.000000  1.000000  10.000000
30%    2.200000  2.200000  22.000000
50%    3.000000  3.000000  30.000000
60%    3.400000  3.400000  34.000000
90%    4.600000  4.600000  46.000000
max    5.000000  5.000000  50.000000

四、describe()函数与数据可视化

  describe()函数输出的统计信息经常与数据可视化结合使用,以更直观地了解数据的分布。例如,我们可以使用matplotlib库来绘制箱线图(boxplot)。

使用示例:​​​​​​​

import pandas as pd
from matplotlib import pyplot as plt
# 创建一个简单的DataFrame
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': [10, 20, 30, 40, 50]
}
df = pd.DataFrame(data)
# 使用describe()函数定制输出
custom_description = df.describe(percentiles=[.30, .60, .90])
print(custom_description)
# 绘制箱线图
df.boxplot()
plt.show()

效果展示:

 五、深入理解统计指标

  了解describe()函数输出的统计指标对于正确解读数据至关重要。例如,标准差可以告诉我们数据集的离散程度,中位数则可以告诉我们数据集的中心趋势,而不受极端值的影响。

六、总结与进阶学习

  describe()函数是pandas库中非常实用的一个函数,它可以帮助我们快速了解数据集的基本统计信息。通过定制输出、结合数据可视化以及深入理解统计指标,我们可以更好地分析和处理数据。在进阶学习中,你还可以探索其他与describe()函数相关的统计方法和可视化工具,以提高你的数据处理和分析能力。

希望这篇博客能帮助你更好地理解和使用pandas中的describe()函数!

到此这篇关于Python Pandas describe()函数的使用介绍的文章就介绍到这了,更多相关Python Pandas describe()函数内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python发展简史 Python来历

    Python发展简史 Python来历

    在本文里我们给大家分享了关于Python的来历以及Python相关的发展内容,有兴趣的读者们阅读下。
    2019-05-05
  • pandas 快速处理 date_time 日期格式方法

    pandas 快速处理 date_time 日期格式方法

    今天小编就为大家分享一篇pandas 快速处理 date_time 日期格式方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-11-11
  • python抓取最新博客内容并生成Rss

    python抓取最新博客内容并生成Rss

    本文给大家分享的是使用python抓取最新博客内容并生成Rss的代码,主要用到了PyRSS2Gen方法,非常的简单实用,有需要的小伙伴可以参考下。
    2015-05-05
  • Python中Merge使用的示例详解

    Python中Merge使用的示例详解

    Python里的merger函数是数据分析工作中最常见的函数之一,类似于MySQL中的join函数和Excel中的vlookup函数。本文将通过一些简单的实力和大家聊聊Merge的使用,需要的可以了解一下
    2023-02-02
  • pytest多线程与多设备并发appium

    pytest多线程与多设备并发appium

    这篇文章介绍了pytest多线程与多设备并发appium,文中通过示例代码介绍的非常详细。对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-06-06
  • python爬虫爬取淘宝商品信息(selenum+phontomjs)

    python爬虫爬取淘宝商品信息(selenum+phontomjs)

    这篇文章主要为大家详细介绍了python爬虫爬取淘宝商品信息,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-02-02
  • Python3中的指针你了解吗

    Python3中的指针你了解吗

    Python这个编程语言虽然没有指针类型,但是Python中的可变参量也可以像指针一样,改变一个数值之后,所有指向该数值的可变参量都会随之而改变,这篇文章主要介绍了Python3中的“指针”,需要的朋友可以参考下
    2024-02-02
  • python得到一个excel的全部sheet标签值方法

    python得到一个excel的全部sheet标签值方法

    今天小编就为大家分享一篇python得到一个excel的全部sheet标签值方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • python tqdm库的使用

    python tqdm库的使用

    这篇文章主要介绍了python tqdm库的使用,帮助大家更好的理解和学习python,感兴趣的朋友可以了解下
    2020-11-11
  • Python自动发邮件脚本

    Python自动发邮件脚本

    本文主要介绍了Python自动发邮件脚本的相关知识。具有很好的参考价值,下面跟着小编一起来看下吧
    2017-03-03

最新评论