pandas中merge函数的用法

 更新时间:2024年06月26日 11:54:00   作者:2301_81245389  
merge()函数是Pandas中用于合并两个DataFrame的函数,本文主要介绍了pandas中merge函数的用法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

merge() 函数是 Pandas 中用于合并两个 DataFrame 的函数,类似于 SQL 中的 JOIN 操作。它允许你根据指定的列或索引进行连接操作。以下是一些 merge() 函数的用法示例:

merge函数的基本用法

merge()函数的基本用法非常简单,主要包括以下几个参数:

  • left:要合并的左侧DataFrame;
  • right:要合并的右侧DataFrame;
  • how:指定合并的方式,默认为'inner',可以是'left'、'right'、'outer'等;
  • on:指定用于合并的列名,如果不指定,则默认使用两个DataFrame中的公共列进行合并。

几个常用的参数

  • left_on、right_on:指定左侧DataFrame和右侧DataFrame用于合并的列名,可用于处理两个DataFrame中列名不同的情况;
  • suffixes:指定在列名冲突时用于区分的后缀,默认为('_x', '_y');
  • indicator:在结果DataFrame中增加一个特殊的列,指示每行的合并方式,默认为False;
  • validate:检查合并操作的类型是否有效,默认为None。

假设我们有两个 DataFrame,分别是 df1 和 df2

import pandas as pd

# 创建 DataFrame df1
data1 = {'ID': [1, 2, 3, 4],
         'Name': ['Alice', 'Bob', 'Charlie', 'David']}
df1 = pd.DataFrame(data1)

# 创建 DataFrame df2
data2 = {'ID': [2, 3, 4, 5],
         'Age': [25, 30, 35, 40]}
df2 = pd.DataFrame(data2)

1.内连接(Inner Join):

merged_outer = pd.merge(df1, df2, on='ID', how='outer')
print(merged_outer)

这会将两个 DataFrame 按照共同的 ID 列进行内连接。结果将只包含两个 DataFrame 中都有的 ID

2.左连接(Left Join):

merged_outer = pd.merge(df1, df2, on='ID', how='outer')
print(merged_outer)

这会将 df1 按照 ID 列进行左连接,即将 df1 的所有行保留,并且将 df2 中匹配的行合并。

3.右连接(Right Join):

merged_outer = pd.merge(df1, df2, on='ID', how='outer')
print(merged_outer)

这会将 df2 按照 ID 列进行右连接,即将 df2 的所有行保留,并且将 df1 中匹配的行合并。

4.外连接(Outer Join):

merged_outer = pd.merge(df1, df2, on='ID', how='outer')
print(merged_outer)

这会将两个 DataFrame 按照共同的 ID 列进行外连接,即保留两个 DataFrame 中的所有行,并且将匹配的行合并。

到此这篇关于pandas中merge函数的用法的文章就介绍到这了,更多相关pandas merge函数内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Django加载配置的过程详解

    Django加载配置的过程详解

    这篇文章主要介绍了Django加载配置的过程详解,包括Django服务启动 manage.py的详细介绍,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2022-05-05
  • python实现将文件名批量命名为四位数or五位数

    python实现将文件名批量命名为四位数or五位数

    这篇文章主要介绍了python实现将文件名批量命名为四位数or五位数问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-08-08
  • 余弦相似性计算及python代码实现过程解析

    余弦相似性计算及python代码实现过程解析

    这篇文章主要介绍了余弦相似性计算及python代码实现过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-09-09
  • pip install过程中出现error: subprocess-exited-with-error错误的解决办法

    pip install过程中出现error: subprocess-exited-with-erro

    在Python环境配置过程中,经常会遇到各种安装错误,其中一个常见的错误是 pip install 过程中出现的 error: subprocess-exited-with-error,在本文中,我将详细解析这个错误的原因,并提供具体的解决方案和步骤,确保大家能够顺利完成安装,避免类似问题的再次发生
    2024-07-07
  • Python matplotlib seaborn绘图教程详解

    Python matplotlib seaborn绘图教程详解

    Seaborn是在matplotlib的基础上进行了更高级的API封装,从而使得作图更加容易,在大多数情况下使用seaborn就能做出很具有吸引力的图。本文将详细讲解如何利用Seaborn绘制图表,需要的可以参考一下
    2022-03-03
  • 简单谈谈Python中函数的可变参数

    简单谈谈Python中函数的可变参数

    和C语言一样,Python中也有可变参数函数,即一个函数可以接收多个参数,而这些参数的个数在函数调用之前事先是不知道的。下面这篇文章我们来介绍下python中的可变参数
    2016-09-09
  • python列表的构造方法list()

    python列表的构造方法list()

    这篇文章主要介绍了python列表的构造方法list(),python中没有数组这个概念,与之相应的是列表,本篇文章就来说说列表这个语法,下面文章详细内容,需要的小伙伴可以参考一下
    2022-03-03
  • python使用PyFetion来发送短信的例子

    python使用PyFetion来发送短信的例子

    这篇文章主要介绍了python使用PyFetion来发送短信的例子,需要的朋友可以参考下
    2014-04-04
  • 解决Django响应JsonResponse返回json格式数据报错问题

    解决Django响应JsonResponse返回json格式数据报错问题

    这篇文章主要介绍了解决Django响应JsonResponse返回json格式数据报错问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-08-08
  • Python CNN卷积神经网络实战教程深入讲解

    Python CNN卷积神经网络实战教程深入讲解

    CNN,即卷积神经网络,主要用于图像识别,分类。由输入层,卷积层,池化层,全连接层(Affline层),Softmax层叠加而成。卷积神经网络中还有一个非常重要的结构:过滤器,它作用于层与层之间(卷积层与池化层),决定了怎样对数据进行卷积和池化
    2022-12-12

最新评论