Python处理PDF与CDF实例

 更新时间:2020年02月26日 08:42:07   作者:Apple@Jing  
今天小编就为大家分享一篇Python处理PDF与CDF实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

在拿到数据后,最需要做的工作之一就是查看一下自己的数据分布情况。而针对数据的分布,又包括pdf和cdf两类。

下面介绍使用python生成pdf的方法:

使用matplotlib的画图接口hist(),直接画出pdf分布;

使用numpy的数据处理函数histogram(),可以生成pdf分布数据,方便进行后续的数据处理,比如进一步生成cdf;

使用seaborn的distplot(),好处是可以进行pdf分布的拟合,查看自己数据的分布类型;

上图所示为采用3种算法生成的pdf图。下面是源代码。

from scipy import stats
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns

arr = np.random.normal(size=100)

# plot histogram
plt.subplot(221)
plt.hist(arr)

# obtain histogram data
plt.subplot(222)
hist, bin_edges = np.histogram(arr)
plt.plot(hist)

# fit histogram curve
plt.subplot(223)
sns.distplot(arr, kde=False, fit=stats.gamma, rug=True)
plt.show()

下面介绍使用python生成cdf的方法:

使用numpy的数据处理函数histogram(),生成pdf分布数据,进一步生成cdf;

使用seaborn的cumfreq(),直接画出cdf;

上图所示为采用2种算法生成的cdf图。下面是源代码。

from scipy import stats
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns

arr = np.random.normal(size=100)

plt.subplot(121)
hist, bin_edges = np.histogram(arr)
cdf = np.cumsum(hist)
plt.plot(cdf)

plt.subplot(122)
cdf = stats.cumfreq(arr)
plt.plot(cdf[0])

plt.show()

在更多时候,需要把pdf和cdf放在一起,可以更好的显示数据分布。这个实现需要把pdf和cdf分别进行归一化。

上图所示为归一化的pdf和cdf。下面是源代码。

from scipy import stats
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns

arr = np.random.normal(size=100)

hist, bin_edges = np.histogram(arr)
width = (bin_edges[1] - bin_edges[0]) * 0.8
plt.bar(bin_edges[1:], hist/max(hist), width=width, color='#5B9BD5')

cdf = np.cumsum(hist/sum(hist))
plt.plot(bin_edges[1:], cdf, '-*', color='#ED7D31')

plt.xlim([-2, 2])
plt.ylim([0, 1])
plt.grid()

plt.show()

以上这篇Python处理PDF与CDF实例就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python reversed反转序列并生成可迭代对象

    Python reversed反转序列并生成可迭代对象

    这篇文章主要介绍了Python reversed反转序列并生成可迭代对象,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-10-10
  • Python matplotlib安装和使用的完整教程

    Python matplotlib安装和使用的完整教程

    Python Matplotlib是一个强大的数据可视化库,它允许用户创建各种类型的静态、动态图表和图形,Matplotlib基于NumPy和Pandas等科学计算库,提供了丰富的绘图选项,本文介绍了Python matplotlib安装和使用的完整教程,需要的朋友可以参考下
    2024-07-07
  • Pytest+Allure使用示例教程

    Pytest+Allure使用示例教程

    Allure是开源的免费的自动化测试报告,支持Java,Python,我们来看看如何使用Python pytest与Allure整合,输出漂亮的测试报告,这篇文章主要介绍了Pytest+Allure使用教程,需要的朋友可以参考下
    2023-12-12
  • Python实现批量提取Word文档表格数据

    Python实现批量提取Word文档表格数据

    在大数据处理与信息抽取领域中,Word文档是各类机构和个人普遍采用的一种信息存储格式,本文将介绍如何使用Python实现对Word文档中表格的提取,感兴趣的可以了解下
    2024-03-03
  • python把数据框写入MySQL的方法

    python把数据框写入MySQL的方法

    这篇文章主要介绍了如何让python把数据框写入MySQL,下文利用上海市2016年9月1日公共交通卡刷卡数据的一份数据单展开其方法,需要的小伙伴可以参考一下
    2022-03-03
  • python实现桌面气泡提示功能

    python实现桌面气泡提示功能

    这篇文章主要为大家详细介绍了python实现桌面气泡提示功能,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2019-07-07
  • python小程序之飘落的银杏

    python小程序之飘落的银杏

    这篇文章主要介绍了利用制作的python小程序-飘落的银杏,代码详细,简单易懂,有需要练习python的朋友可以参考下
    2021-04-04
  • Matplotlib学习笔记之plt.xticks()用法

    Matplotlib学习笔记之plt.xticks()用法

    在matplotlib中ticks表示的是刻度,而刻度有两层意思,一个是刻标(locs),一个是刻度标签(tick labels),下面这篇文章主要给大家介绍了关于Matplotlib学习笔记之plt.xticks()用法的相关资料,需要的朋友可以参考下
    2022-09-09
  • Linux添加Python path方法及修改环境变量的三种方法

    Linux添加Python path方法及修改环境变量的三种方法

    这篇文章主要介绍了Linux添加Python path方法及修改环境变量的三种方法,Linux 下设置环境变量有三种方法,一种用于当前终端,一种用于当前用户,一种用于所有用户,本文对每种方法给大家介绍的非常详细,需要的朋友可以参考下
    2022-07-07
  • Python编程tkinter库Canvas实现涂鸦颜色表及围棋盘示例

    Python编程tkinter库Canvas实现涂鸦颜色表及围棋盘示例

    这篇文章主要为大家介绍了Python编程中如何使用tkinter库Canvas来实现涂鸦,颜色表及围棋盘的示例,有需要的朋友可以借鉴参考下,希望能够有所帮助
    2021-10-10

最新评论