Python Pandas多种添加行列数据方法总结

 更新时间:2022年07月11日 15:56:53   作者:CHD托马斯  
在进行数据分析时经常需要按照一定条件创建新的数据列,然后进行进一步分析,下面这篇文章主要给大家介绍了关于Python Pandas多种添加行列数据方法的相关资料,需要的朋友可以参考下

前言

发现自己学习python 的各种库老是容易忘记,所有想利用这个平台,记录和分享一下学习时候的知识点,以后也能及时的复习,最近学习pandas,那我们来看看pandas添加数据的一些方法

创建一个dataframe

1. 增加列数据

为dataframe增加一列新数据,需要确保增加列的长度与原数据保持一致

如果是增加一列相同数据可以直接输入

df['level'] = 1

插入的数据是需要通过源数据进行计算的(eval这个方法感觉比较好用)

df.eval('grade_level = grade * level',inplace = True)

使用insert函数可以在指定列添加列数据,这个函数有好几个参数,使用更加灵活

df.insert(loc, column, value, allow_duplicates=False)

增加列数据的方法还有很多,我只把自己比较常用的记录了下来

2. 增加行数据

比较多的方法有 loc 、iloc、append都行,先看loc这个方法,它是通过 df.loc[index名称] = [对应的数据],这个方法要主要index如果是与原表中有重复,则会将原数据修改,如果没有重复的话,就是在最后面添加对应数据,其中的index名称是根据输入的写入,需要注意!

第二个是通过df.iloc[index位置] = [对应数据] 进行修改这个方法是对原有数据进行修改,并不是增加一行数据

使用append()函数添加一行数据,其中ignore_index=True,否则报错

append()往往做法比较多的是添加一个另外一个dataframe的数据到原来数据上,爬虫时候用得比较多,将每一页的数据保存到一个临时的dataframe中,将这个临时的dataframe数据插入到总的dataframe后面,最后得到总的数据,且效率较高

当然还有concat、merge等方法可以达到相同的效果,下次有机会在继续学习

补充:pandas根据现有列新添加一列

pandas中一个Dataframe,经常需要根据其中一列再新建一列,比如一个常见的例子:需要根据分数来确定等级范围,下面我们就来看一下怎么实现。

def getlevel(score):
    if score < 60:
        return "bad"
    elif score < 80:
        return "mid"
    else:
        return "good"


def test():
    data = {'name': ['lili', 'lucy', 'tracy', 'tony', 'mike'],
            'score': [85, 61, 75, 49, 90]
            }
    df = pd.DataFrame(data=data)
    # 两种方式都可以
    # df['level'] = df.apply(lambda x: getlevel(x['score']), axis=1)
    df['level'] = df.apply(lambda x: getlevel(x.score), axis=1)

    print(df)

上面代码运行结果

    name  score level
0   lili     85  good
1   lucy     61   mid
2  tracy     75   mid
3   tony     49   bad
4   mike     90  good

要实现上面的功能,主要是使用到dataframe中的apply方法。

上面的代码,对dataframe新增加一列名为level,level由分数一列而来,如果小于60分为bad,60-80之间为mid,80以上为good。
其中axis=1表示原有dataframe的行不变,列的维数发生改变。

总结

到此这篇关于Python Pandas多种添加行列数据方法的文章就介绍到这了,更多相关Pandas添加行列数据内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python安装TA-Lib库报错问题的解决方法

    python安装TA-Lib库报错问题的解决方法

    TaLib是一个Python金融指数处理库,包含了很多技术分析里的常用参数指标,例如MA、SMA、WMA、MACD、ATR等,这篇文章主要给大家介绍了关于python安装TA-Lib库报错问题的解决方法,需要的朋友可以参考下
    2024-01-01
  • pycharm中导入不了torch包的解决方案

    pycharm中导入不了torch包的解决方案

    这篇文章主要介绍了pycharm中导入不了torch包的解决方案,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2023-08-08
  • python模拟斗地主发牌

    python模拟斗地主发牌

    这篇文章主要为大家详细介绍了python模拟斗地主发牌,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2020-04-04
  • python生成器generator用法实例分析

    python生成器generator用法实例分析

    这篇文章主要介绍了python生成器generator用法,实例分析了python生成器的相关使用技巧,需要的朋友可以参考下
    2015-06-06
  • pandas针对excel处理的实现

    pandas针对excel处理的实现

    这篇文章主要介绍了pandas针对excel处理的实现,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2021-01-01
  • OpenCV根据面积筛选连通域学习示例

    OpenCV根据面积筛选连通域学习示例

    这篇文章主要为大家介绍了OpenCV根据面积筛选连通域学习示例,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-06-06
  • Python常用内建模块hashlib、hmac详解

    Python常用内建模块hashlib、hmac详解

    这篇文章主要介绍了Python常用内建模块hashlib、hmac详解,摘要算法又称哈希算法、散列算法,它通过一个函数,把任意长度的数据转换为一个长度固定的数据串,需要的朋友可以参考下
    2023-08-08
  • 如何使用Python OpenCV提取物体轮廓详解

    如何使用Python OpenCV提取物体轮廓详解

    图像的轮廓检测不论是机器视觉还是其他方面都有较大作用,下面这篇文章主要给大家介绍了关于如何使用Python OpenCV提取物体轮廓的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2022-05-05
  • 聊聊python中的循环遍历

    聊聊python中的循环遍历

    这篇文章主要介绍了python中的循环遍历的相关资料,帮助大家更好的理解和学习python,感兴趣的朋友可以了解下
    2020-09-09
  • ubuntu系统如何从python3.7升级到python3.8

    ubuntu系统如何从python3.7升级到python3.8

    这篇文章主要给大家介绍了关于ubuntu系统如何从python3.7升级到python3.8的相关资料,Python是一种广泛使用的编程语言,而Ubuntu是一个流行的开源操作系统,通过升级Python您可以获得新功能、性能改进和安全修复,需要的朋友可以参考下
    2023-11-11

最新评论