Pandas库中dataframe.corr()函数的使用

 更新时间:2024年07月22日 11:35:59   作者:Midsummer-逐梦  
dataframe.corr()是Pandas库中的一个函数,用于计算DataFrame中各列之间的相关系数,本文主要介绍了Pandas库中dataframe.corr()函数的使用,具有一定的参考价值,感兴趣的可以了解一下

一、简介

dataframe.corr()是Pandas库中的一个函数,用于计算DataFrame中各列之间的相关系数。相关系数衡量的是两个变量之间线性关系的强度和方向,结果在-1到1之间,分别表示完全负相关和完全正相关。

二、语法和参数

DataFrame.corr(method='pearson', min_periods=1)

method: 可选。计算相关系数的方法,有’pearson’(默认)、‘kendall’、'spearman’三种可选。

  • 'pearson':标准皮尔逊相关系数。
  • 'kendall':肯德尔等级相关系数。
  • 'spearman':斯皮尔曼等级相关系数。

min_periods: 可选。每对元素的最小数量,以便计算相关系数。

三、实例

3.1 计算默认的皮尔逊相关系数

import pandas as pd

# 创建示例数据
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': [2, 2, 3, 4, 4]
}
df = pd.DataFrame(data)

# 计算相关系数
correlation_matrix = df.corr()
print(correlation_matrix)

输出:

          A         B         C
A  1.000000 -1.000000  0.948683
B -1.000000  1.000000 -0.948683
C  0.948683 -0.948683  1.000000

3.2 计算斯皮尔曼相关系数

import pandas as pd

# 创建示例数据
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': [2, 2, 3, 4, 4]
}
df = pd.DataFrame(data)

# 计算相关系数
correlation_matrix = df.corr(method='spearman')
print(correlation_matrix)

输出:

          A         B         C
A  1.000000 -1.000000  0.948683
B -1.000000  1.000000 -0.948683
C  0.948683 -0.948683  1.000000

3.3 计算斯皮尔曼相关系数

import pandas as pd

# 创建示例数据
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': [2, 2, 3, 4, 4]
}
df = pd.DataFrame(data)

# 计算相关系数
correlation_matrix = df.corr(method='kendall')
print(correlation_matrix)

输出

          A         B         C
A  1.000000 -1.000000  0.894427
B -1.000000  1.000000 -0.894427
C  0.894427 -0.894427  1.000000

四、注意事项

  • 当使用kendallspearman方法时,计算可能会比pearson方法慢,因为这些方法需要排序。
  • 如果数据集中存在NaN值,默认情况下这些值会被忽略。
  • 计算相关系数前,确保数据已经清洗并准备好,以避免错误或不准确的结果。

到此这篇关于Pandas库中dataframe.corr()函数的使用的文章就介绍到这了,更多相关Pandas dataframe.corr()函数内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家! 

相关文章

  • python标准算法实现数组全排列的方法

    python标准算法实现数组全排列的方法

    这篇文章主要介绍了python标准算法实现数组全排列的方法,实例分析了全排列的原理与Python实现技巧,需要的朋友可以参考下
    2015-03-03
  • Python+LyScript实现自定义反汇编

    Python+LyScript实现自定义反汇编

    LyScript 插件默认提供了一个get_disasm_code()方法可以直接获取到指定行数的反汇编代码。本文将利用LyScript实现自定义反汇编,感兴趣的可以了解一下
    2022-07-07
  • Python实现base64编码的图片保存到本地功能示例

    Python实现base64编码的图片保存到本地功能示例

    这篇文章主要介绍了Python实现base64编码的图片保存到本地功能,涉及Python针对base64编码解码与图形文件输出保存相关操作技巧,需要的朋友可以参考下
    2018-06-06
  • 深入了解python的函数参数

    深入了解python的函数参数

    这篇文章主要为大家介绍了python的函数参数,具有一定的参考价值,感兴趣的小伙伴们可以参考一下,希望能够给你带来帮助
    2021-12-12
  • 使用Python获取CPU、内存和硬盘等windowns系统信息的2个例子

    使用Python获取CPU、内存和硬盘等windowns系统信息的2个例子

    这篇文章主要介绍了使用Python获取CPU、内存和硬盘等windowns系统信息的2个例子,使用的python wmi模块,需要的朋友可以参考下
    2014-04-04
  • Python中条件语句、循环语句和pass语句的使用示例

    Python中条件语句、循环语句和pass语句的使用示例

    Python条件语句是通过一条或多条语句的执行结果(True或者False)来决定执行的代码块,下面这篇文章主要给大家介绍了关于Python中条件语句、循环语句和pass语句使用的相关资料,需要的朋友可以参考下
    2022-06-06
  • Python实现对数坐标系绘制与自定义映射

    Python实现对数坐标系绘制与自定义映射

    这篇文章主要为大家学习介绍了如何利用Python实现对数坐标系绘制与坐标自定义映射,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
    2023-08-08
  • python树状打印项目路径的实现

    python树状打印项目路径的实现

    在Python中,要打印当前路径,可以使用os模块中的getcwd()函数,本文主要介绍了python树状打印项目路径,具有一定的参考价值,感兴趣的可以了解一下
    2023-10-10
  • 20非常有用的Python单行代码分享

    20非常有用的Python单行代码分享

    有用的 Python 单行代码片段,只需一行代码即可解决特定编码问题!本文将分享20 个 Python 一行代码,你可以在 30 秒或更短的时间内轻松学习它们。这种单行代码将节省你的时间,并使你的代码看起来更干净且易于阅读
    2022-11-11
  • Python 通过URL打开图片实例详解

    Python 通过URL打开图片实例详解

    这篇文章主要介绍了Python 通过URL打开图片实例详解的相关资料,需要的朋友可以参考下
    2017-06-06

最新评论