pandas 实现将重复表格去重,并重新转换为表格的方法

 更新时间:2018年04月18日 15:32:13   作者:独钓寒江水  
下面小编就为大家分享一篇pandas 实现将重复表格去重,并重新转换为表格的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧

在python处理数据时,经常用到DataFrame和set。

train=pd.read_csv('XXX.csv')#读取文件 
train=train['item_id']#选择要去重的列 
train=set(train)#去重 
data=pd.DataFrame(list(train),columns=['item_id'])#因为set是无序的,必须要经过list处理后才能成为DataFrame 
data.to_csv('xxx.csv',index=False)#保存表格 

记得导入pandas哦~

以上这篇pandas 实现将重复表格去重,并重新转换为表格的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python pandas的八个生命周期总结

    Python pandas的八个生命周期总结

    这篇文章主要从八个pandas的数据处理生命周期,整理汇总出pandas框架在整个数据处理过程中都是如何处理数据的,感兴趣的小伙伴可以了解一下
    2022-10-10
  • python中对list去重的多种方法

    python中对list去重的多种方法

    这篇文章主要介绍了python中对list去重的多种方法,本文去重的前提是要保证顺序不变,本文给出了多种实现方法,需要的朋友可以参考下
    2014-09-09
  • Python如何给函数库增加日志功能

    Python如何给函数库增加日志功能

    这篇文章主要介绍了Python如何给函数库增加日志功能,文中讲解非常细致,代码帮助大家更好的理解和学习,感兴趣的朋友可以了解下
    2020-08-08
  • Python写入MySQL数据库的三种方式详解

    Python写入MySQL数据库的三种方式详解

    Python 读取数据自动写入 MySQL 数据库,这个需求在工作中是非常普遍的,主要涉及到 python 操作数据库,读写更新等。本文总结了Python写入MySQL数据库的三种方式,需要的可以参考一下
    2022-06-06
  • Python的collections模块中namedtuple结构使用示例

    Python的collections模块中namedtuple结构使用示例

    namedtuple顾名思义,就是名字+元组的数据结构,下面就来看一下Python的collections模块中namedtuple结构使用示例
    2016-07-07
  • Pandas中八个常用option设置的示例详解

    Pandas中八个常用option设置的示例详解

    通过pandas的使用,我们经常要交互式地展示表格(dataframe)、分析表格。本文整理了8个常用的配置选项,使用可以提高很多效率,需要的可以参考一下
    2022-06-06
  • 对比分析BN和dropout在预测和训练时区别

    对比分析BN和dropout在预测和训练时区别

    这篇文章主要为大家介绍了对比分析BN和dropout在预测和训练时区别,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • OpenCV黑帽运算(BLACKHAT)的使用

    OpenCV黑帽运算(BLACKHAT)的使用

    本文主要介绍了OpenCV黑帽运算(BLACKHAT)的使用,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2022-08-08
  • Python使用sort和class实现的多级排序功能示例

    Python使用sort和class实现的多级排序功能示例

    这篇文章主要介绍了Python使用sort和class实现的多级排序功能,涉及Python基于面向对象的元素遍历、列表排序、添加等相关操作技巧,需要的朋友可以参考下
    2018-08-08
  • php使用递归与迭代实现快速排序示例

    php使用递归与迭代实现快速排序示例

    这篇文章主要介绍了php使用递归与迭代实现快速排序的示例,大家参考使用吧
    2014-01-01

最新评论