使用pd.merge表连接出现多余行的问题解决

 更新时间:2022年06月16日 11:18:41   作者:路明非Re  
本文主要介绍了使用pd.merge表连接出现多余行的问题解决,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧

本文的目标是将表1论文及出版物与表2出版物及其指标进行匹配。

表1 论文出版物信息(存在空值)

表2 出版物指标信息

利用pandas的merge函数实现表的左外连接。左外连接即左表的外连接,左表保持不变,匹配右表的行(合并后右表肯能存在空值)。

paperPublicationIndicator = pd.merge(paperPublication,publicationIndicator,
    how='left',left_on='出版物',right_on='名称',sort=False)

结果发现连接后表相比于表1论文出版物 多出来13行。进行探究发现是表2出版物指标信息中存在 出版物A-指标1,出版物A-指标2这样的出版物重复行。进行匹配后会出现:

出版物  名称  指标
出版物A  出版物A  指标1
出版物A  出版物A  指标2   #多余的行

这里选择预先删除 表2出版物指标 中的重复出版物信息。

publicationIndicator.drop_duplicates(subset=['名称'],
		keep='first',inplace=True)

这样结果就没有问题了。

到此这篇关于使用pd.merge表连接出现多余行的问题解决的文章就介绍到这了,更多相关pd.merge表连接多余行问题内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Django自定义列表 models字段显示方式

    Django自定义列表 models字段显示方式

    这篇文章主要介绍了Django自定义列表 models字段显示方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-04-04
  • 解决每次打开pycharm直接进入项目的问题

    解决每次打开pycharm直接进入项目的问题

    今天小编就为大家分享一篇解决每次打开pycharm直接进入项目的问题,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-10-10
  • python中numpy包使用教程之数组和相关操作详解

    python中numpy包使用教程之数组和相关操作详解

    这篇文章主要给大家介绍了关于python中numpy包的使用教程,包含数组和相关操作等内容,文中通过示例代码介绍的非常详细,对大家具有一定的参考学习价值,需要的朋友们下面来跟着小编一起学习学习吧。
    2017-07-07
  • OPENAI API 微调 GPT-3 的 Ada 模型

    OPENAI API 微调 GPT-3 的 Ada 模型

    这篇文章主要为大家介绍了OPENAI API 微调 GPT-3 的 Ada 模型使用示例详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2023-04-04
  • pycharm查看变量值的4种方法汇总

    pycharm查看变量值的4种方法汇总

    因为Python是脚本语言,不会进行编译,所以只有执行到那一行,才能知道那个变量的类型,下面这篇文章主要给大家介绍了关于pycharm查看变量值的4种方法,需要的朋友可以参考下
    2022-04-04
  • Python实现解析yaml配置文件的示例详解

    Python实现解析yaml配置文件的示例详解

    在开发过程中,配置文件是少不了的,而且配置文件是有专门的格式的,比如:ini,yaml,toml等等。本文带大家来看看Python如何解析yaml文件,它的表达能力相比 ini 更加的强大,需要的可以参考一下
    2022-09-09
  • 在dataframe两列日期相减并且得到具体的月数实例

    在dataframe两列日期相减并且得到具体的月数实例

    今天小编就为大家分享一篇在dataframe两列日期相减并且得到具体的月数实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-07-07
  • Python实现批量word文档转pdf并统计其页码

    Python实现批量word文档转pdf并统计其页码

    pypdf2是一个Python模块,可以用来读取、写入和操作PDF文件,本文就将利用该模块实现批量word文档转pdf并统计其页码,需要的小伙伴可以了解一下
    2023-05-05
  • python excel多行合并的方法

    python excel多行合并的方法

    这篇文章主要介绍了python excel多行合并的方法,帮助大家更好的利用python处理excel表格,感兴趣的朋友可以了解下
    2020-12-12
  • Selenium+Python自动化测试入门

    Selenium+Python自动化测试入门

    本文主要介绍了Selenium+Python自动化测试入门,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-08-08

最新评论