pandas实现一行拆分成多行

 更新时间:2022年05月12日 09:39:56   作者:Jalen备忘录  
这篇文章主要介绍了pandas实现一行拆分成多行方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

一行拆分成多行

1.根据某一列拆分

效果:

代码:

if __name__ == '__main__':
    import pandas as pd
    df = pd.DataFrame({'Country': ['China,US', 'Japan,EU', 'UK,Australia', 'Singapore,Netherland'],
                       'Number': [100, 150, 120, 90],
                       'Value': [1, 2, 3, 4],
                       'label': list('abcd')})
    df_split_row = df.drop('Country', axis=1).join(
        df['Country'].str.split(',', expand=True).stack().reset_index(level=1, drop=True).rename('Country'))

2.根据多列拆分

效果:

代码:

if __name__ == '__main__':
    import pandas as pd
    df = pd.DataFrame({'Code': ['212027'],
                       'Color': ['blue, pink, yellow'],
                       'Size': ['12-18M, 2-3Y, 3-4Y']})
    split_columns = ['Color', 'Size']
    df_convert = df.drop(columns=split_columns, axis=1)
    for column in split_columns:
        df_convert = df_convert.join(
            df[column].str.split(',', expand=True).stack().reset_index(level=1, drop=True).rename(column))
    df_convert = df_convert.reset_index(drop=True)

一行转多行、多行转一行

1.测试数据

df = pd.DataFrame([['张世龙', '篮球、羽毛球、英雄联盟'],
                   ['黄邵飞', '兵乓球、足球、下棋'],
                   ['刘苗苗', '绘画、写小说、跑步']])
df.columns = ['姓名','爱好']

2.一行转多行

方法一:

# 1、把渠道字段拆分,分为多列; 2、把行转列成列;3、重置索引,并删除多于的索引;4、更改名称
df_ = df['爱好'].str.split('、',expand=True).stack().reset_index(level=1,drop=True).rename('爱好')
df1 = df.drop(['爱好'], axis=1).join(df_)

方发二:

# 1、将渠道字段拆分;2、调用explode()方法
df['爱好'] = df['爱好'].map(lambda x:x.split('、'))
df1 = df.explode('爱好')

3.多行转一行

#定义拼接函数,并对字段进行去重
def concat_func(x):
    return pd.Series({
        '爱好':'、'.join(x['爱好'].unique())
    })
#分组聚合 + 拼接
df2 = df1.groupby(df1['姓名']).apply(concat_func).reset_index()

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • tensorflow TFRecords文件的生成和读取的方法

    tensorflow TFRecords文件的生成和读取的方法

    本篇文章主要介绍了tensorflow TFRecords文件的生成和读取的方法,小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2018-02-02
  • 基于Python实现音频下载应用程序

    基于Python实现音频下载应用程序

    这篇文章主要介绍了如何使用wxPython、yt_dlp和tqdm库,开发一个简单直观的用户界面,并具备高效的音频下载功能,感兴趣的小伙伴可以学习一下
    2023-08-08
  • Python实现统计给定列表中指定数字出现次数的方法

    Python实现统计给定列表中指定数字出现次数的方法

    这篇文章主要介绍了Python实现统计给定列表中指定数字出现次数的方法,涉及Python针对列表的简单遍历、计算相关操作技巧,需要的朋友可以参考下
    2018-04-04
  • keras建模的3种方式详解

    keras建模的3种方式详解

    这篇文章主要介绍了keras建模的3种方式详解,keras是Google公司于2016年发布的以tensorflow为后端的用于深度学习网络训练的高阶API,因接口设计非常人性化,深受程序员的喜爱,需要的朋友可以参考下
    2023-08-08
  • Django 序列化的具体使用

    Django 序列化的具体使用

    django rest framework 中的序列化组件,本文主要介绍了Django 序列化的具体使用,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-11-11
  • python中leastsq函数的使用方法

    python中leastsq函数的使用方法

    这篇文章主要介绍了python中leastsq函数的使用方法,leastsq作用是最小化一组方程的平方和,下面文章举例说明详细内容,具有一的参考价值,需要的小伙伴可以参考一下
    2022-03-03
  • Python中表示字符串的三种方法

    Python中表示字符串的三种方法

    这篇文章主要介绍了Python中表示字符串的三种方法的相关资料,需要的朋友可以参考下
    2017-09-09
  • Python IO文件管理的具体使用

    Python IO文件管理的具体使用

    我们可以使用python来操作文件,比如读取文件内容、写入新的内容等,本文主要介绍了Python IO文件管理的具体使用,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-03-03
  • 详解解决Python memory error的问题(四种解决方案)

    详解解决Python memory error的问题(四种解决方案)

    这篇文章主要介绍了详解解决Python memory error的问题(四种解决方案),文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2019-08-08
  • Python字符串的索引与切片

    Python字符串的索引与切片

    这篇文章主要介绍了Python字符串的索引与切片,文章围绕主题展开详细的相关资料,需要的小伙伴可以参考一下
    2022-04-04

最新评论