Pandas库中dataframe.corr()函数的使用

 更新时间:2024年07月22日 11:35:59   作者:Midsummer-逐梦  
dataframe.corr()是Pandas库中的一个函数,用于计算DataFrame中各列之间的相关系数,本文主要介绍了Pandas库中dataframe.corr()函数的使用,具有一定的参考价值,感兴趣的可以了解一下

一、简介

dataframe.corr()是Pandas库中的一个函数,用于计算DataFrame中各列之间的相关系数。相关系数衡量的是两个变量之间线性关系的强度和方向,结果在-1到1之间,分别表示完全负相关和完全正相关。

二、语法和参数

DataFrame.corr(method='pearson', min_periods=1)

method: 可选。计算相关系数的方法,有’pearson’(默认)、‘kendall’、'spearman’三种可选。

  • 'pearson':标准皮尔逊相关系数。
  • 'kendall':肯德尔等级相关系数。
  • 'spearman':斯皮尔曼等级相关系数。

min_periods: 可选。每对元素的最小数量,以便计算相关系数。

三、实例

3.1 计算默认的皮尔逊相关系数

import pandas as pd

# 创建示例数据
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': [2, 2, 3, 4, 4]
}
df = pd.DataFrame(data)

# 计算相关系数
correlation_matrix = df.corr()
print(correlation_matrix)

输出:

          A         B         C
A  1.000000 -1.000000  0.948683
B -1.000000  1.000000 -0.948683
C  0.948683 -0.948683  1.000000

3.2 计算斯皮尔曼相关系数

import pandas as pd

# 创建示例数据
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': [2, 2, 3, 4, 4]
}
df = pd.DataFrame(data)

# 计算相关系数
correlation_matrix = df.corr(method='spearman')
print(correlation_matrix)

输出:

          A         B         C
A  1.000000 -1.000000  0.948683
B -1.000000  1.000000 -0.948683
C  0.948683 -0.948683  1.000000

3.3 计算斯皮尔曼相关系数

import pandas as pd

# 创建示例数据
data = {
    'A': [1, 2, 3, 4, 5],
    'B': [5, 4, 3, 2, 1],
    'C': [2, 2, 3, 4, 4]
}
df = pd.DataFrame(data)

# 计算相关系数
correlation_matrix = df.corr(method='kendall')
print(correlation_matrix)

输出

          A         B         C
A  1.000000 -1.000000  0.894427
B -1.000000  1.000000 -0.894427
C  0.894427 -0.894427  1.000000

四、注意事项

  • 当使用kendallspearman方法时,计算可能会比pearson方法慢,因为这些方法需要排序。
  • 如果数据集中存在NaN值,默认情况下这些值会被忽略。
  • 计算相关系数前,确保数据已经清洗并准备好,以避免错误或不准确的结果。

到此这篇关于Pandas库中dataframe.corr()函数的使用的文章就介绍到这了,更多相关Pandas dataframe.corr()函数内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家! 

相关文章

  • Python 脚本获取ES 存储容量的实例

    Python 脚本获取ES 存储容量的实例

    今天小编就为大家分享一篇Python 脚本获取ES 存储容量的实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • python2.7安装图文教程

    python2.7安装图文教程

    这篇文章主要为大家详细介绍了python2.7安装图文教程,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-03-03
  • Python如何优雅获取本机IP方法

    Python如何优雅获取本机IP方法

    这篇文章主要介绍了Python如何优雅获取本机IP方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-11-11
  • python爬虫搭配起Bilibili唧唧的流程分析

    python爬虫搭配起Bilibili唧唧的流程分析

    这篇文章主要介绍了python爬虫搭配起Bilibili唧唧的流程分析,本文通过图文并茂的形式给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-12-12
  • python代码规范之异常,规则,函数返回值使用解读

    python代码规范之异常,规则,函数返回值使用解读

    文章主要介绍了Python的集合、自定义哈希对象、数据类、字符串格式化、容器、异常处理、函数返回建议以及Django框架中的AnonymousUser等知识点
    2025-12-12
  • Python ORM框架Peewee用法详解

    Python ORM框架Peewee用法详解

    这篇文章主要介绍了Python ORM框架Peewee用法详解,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-04-04
  • 浅析python常用数据文件处理方法

    浅析python常用数据文件处理方法

    这篇文章主要介绍了python常用数据文件处理方法,虽说python运行速度慢,但其编程速度,第三方包的丰富度是真的高,涉及到文件批处理还是会选择python,感兴趣的朋友跟随小编一起看看吧
    2021-10-10
  • Python实现NLP的完整流程介绍

    Python实现NLP的完整流程介绍

    这篇文章主要为大家详细介绍了Python实现NLP的完整流程,文中的示例代码讲解详细,具有一定的借鉴价值,感兴趣的小伙伴可以跟随小编一起学习一下
    2025-01-01
  • 使用Python脚本轻松实现文件的批量重命名

    使用Python脚本轻松实现文件的批量重命名

    在日常工作和学习中,我们经常会遇到需要批量重命名文件的情况,无论是整理照片、文档还是其他类型的文件,手动一个个修改既费时又容易出错,今天,我将分享一个简单而强大的Python脚本,帮助你轻松实现文件的批量重命名,需要的朋友可以参考下
    2025-11-11
  • Python操作Git的项目实践

    Python操作Git的项目实践

    本文介绍了使用Python和GitPython库进行各种Git操作,包括打开仓库、查询状态、添加和提交更改等,具有一定的参考价值,感兴趣的可以了解一下
    2024-12-12

最新评论