Python pandas数据预处理之行数据复制方式

 更新时间:2024年02月23日 08:43:16   作者:永远在减肥永远110的的小潘  
这篇文章主要介绍了Python pandas数据预处理之行数据复制方式,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教

pandas数据预处理行数据复制

现有一张进货表格,数据如下,需要将商品数量与商品名称拆分,最终实现有多少个商品显示多少行数据。

即当商品为“鸡蛋*5”时,需要有5条鸡蛋数据。

import pandas as pd
import numpy as np
file_path=r"E:\临时\数据预处理.xlsx"
data=pd.read_excel(file_path)
#首先将不同商品做拆分,间隔符为","
data10=data.join(data["商品"].str.split(",",expand=True))

拆分后的数据

如下:

#不同商品拆分后第一次复制
data20=data10[["日期",0]]
data20.rename(columns={0:"商品"},inplace=True)

data30=data10[["日期",1]]
data30.rename(columns={1:"商品"},inplace=True)

data40=data10[["日期",2]]
data40.rename(columns={2:"商品"},inplace=True)

data_con=pd.concat([data20,data30,data40])

data_con=data_con[data_con["商品"].notna()]
#将商品名称与商品数量拆分
data_con.reset_index(drop=True,inplace=True)
data_con=data_con.join(data_con["商品"].str.split("*",expand=True))

拆分后的数据

如下:

data_con.rename(columns={0:"商品名称",1:"商品数量"},inplace=True)
data_con["商品数量"]=data_con["商品数量"].astype(int)
#商品名称与数量拆分后第二次复制
data_pro=pd.DataFrame()
for i in range(data_con.shape[0]):
    data_temp=pd.DataFrame(np.repeat(pd.DataFrame(data_con.iloc[i]).T.values,data_con.iloc[i]["商品数量"],axis=0))
    data_temp.columns=pd.DataFrame(data_con.iloc[i]).T.columns
    data_pro=pd.concat([data_pro,data_temp])

data_pro=data_pro[['日期',  '商品名称']]

data_pro["商品数量"]=1

最后将data_pro导出即可。

总结

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python报错:KeyError: ‘xxx‘的原因及解决方案

    Python报错:KeyError: ‘xxx‘的原因及解决方案

    在Python编程实践中,遇到KeyError是一种常见的异常,特别是在处理字典(dictionary)时,当尝试访问一个不存在于字典中的键时,Python会抛出KeyError,本文旨在深入探讨这一错误的背景、发生原因、解决方案,需要的朋友可以参考下
    2025-07-07
  • django-filter和普通查询的例子

    django-filter和普通查询的例子

    今天小编就为大家分享一篇django-filter和普通查询的例子,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-08-08
  • python非标准时间的转换

    python非标准时间的转换

    本文主要介绍了python非标准时间的转换,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2021-07-07
  • Django REST framework内置路由用法

    Django REST framework内置路由用法

    这篇文章主要介绍了Django REST framework内置路由用法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-07-07
  • 对Python强大的可变参数传递机制详解

    对Python强大的可变参数传递机制详解

    今天小编就为大家分享一篇对Python强大的可变参数传递机制详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-06-06
  • Python 3.10 的首个 PEP 诞生,内置类型 zip() 迎来新特性(推荐)

    Python 3.10 的首个 PEP 诞生,内置类型 zip() 迎来新特性(推荐)

    这篇文章主要介绍了Python 3.10 的首个 PEP 诞生,内置类型 zip() 迎来新特性,本文给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下
    2020-07-07
  • python numpy.linalg.norm函数的使用及说明

    python numpy.linalg.norm函数的使用及说明

    这篇文章主要介绍了python numpy.linalg.norm函数的使用及说明,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教
    2023-02-02
  • python3安装crypto出错及解决方法

    python3安装crypto出错及解决方法

    这篇文章主要介绍了python3安装crypto出错及解决方法,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2019-07-07
  • Python中的变量与常量

    Python中的变量与常量

    本文基于Python基础,主要介绍了Python基础中变量和常量的区别,对于变量的用法做了详细的讲解,用丰富的案例 ,代码效果图的展示帮助大家更好理解,需要的朋友可以参考下
    2021-11-11
  • Python爬取365好书中小说代码实例

    Python爬取365好书中小说代码实例

    这篇文章主要介绍了Python爬取365好书中小说代码实例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
    2020-02-02

最新评论