Python Pandas实现根据多列的值生成新的列

更新时间：2026年02月02日 08:44:49 作者：小满大王i

在 Pandas 中,可以根据多列的值生成新的列,这篇文章主要和大家详细介绍了一些常见的方法,文中的示例代码讲解详细,感兴趣的小伙伴可以了解下

1. 使用apply()+ 自定义函数（推荐）

适用于 复杂逻辑，可以基于多列计算新列。

import pandas as pd

df = pd.DataFrame({
    'math': [90, 80, 70],
    'english': [85, 75, 65],
    'science': [88, 92, 78]
})

# 定义一个函数，基于多列计算平均分
def calculate_average(row):
    return (row['math'] + row['english'] + row['science']) / 3

# 使用 apply() 按行计算
df['average'] = df.apply(calculate_average, axis=1)

print(df)

输出：

math english science average
0 90 85 88 87.666667
1 80 75 92 82.333333
2 70 65 78 71.000000

优化：使用lambda简化

df['average'] = df.apply(lambda row: (row['math'] + row['english'] + row['science']) / 3, axis=1)

2. 使用np.where()或np.select()（条件判断）

适用于 基于多列条件 生成新列。

(1)np.where()（二分类）

import numpy as np

# 如果 math 和 english 都 > 80，则 '优秀'，否则 '普通'
df['grade'] = np.where((df['math'] > 80) & (df['english'] > 80), '优秀', '普通')

print(df)

输出：

math english science average grade
0 90 85 88 87.666667 优秀
1 80 75 92 82.333333 普通
2 70 65 78 71.000000 普通

(2)np.select()（多条件）

conditions = [
    (df['math'] >= 90) & (df['english'] >= 90),
    (df['math'] >= 80) & (df['english'] >= 80),
    (df['math'] >= 70) & (df['english'] >= 70)
]
choices = ['A', 'B', 'C']

df['grade'] = np.select(conditions, choices, default='D')

print(df)

输出：

math english science average grade
0 90 85 88 87.666667 B
1 80 75 92 82.333333 C
2 70 65 78 71.000000 D

3. 直接数学运算（简单计算）

适用于 多列直接运算（如加权平均、总分等）。

# 计算总分（math + english + science）
df['total'] = df['math'] + df['english'] + df['science']

# 计算加权平均（math 权重 0.5，english 0.3，science 0.2）
df['weighted_avg'] = df['math'] * 0.5 + df['english'] * 0.3 + df['science'] * 0.2

print(df)

输出：

math english science total weighted_avg
0 90 85 88 263 87.300000
1 80 75 92 247 79.900000
2 70 65 78 213 70.100000

4. 使用assign()+lambda（链式操作）

适用于 不修改原 DataFrame，而是返回新 DataFrame。

df = df.assign(
    total=lambda x: x['math'] + x['english'] + x['science'],
    weighted_avg=lambda x: x['math'] * 0.5 + x['english'] * 0.3 + x['science'] * 0.2
)

print(df)

输出：

math english science total weighted_avg
0 90 85 88 263 87.300000
1 80 75 92 247 79.900000
2 70 65 78 213 70.100000

5. 使用eval()（高效计算，但需谨慎）

适用于 快速计算，但可能影响可读性。

# 计算总分
df['total'] = df.eval('math + english + science')

# 计算加权平均
df['weighted_avg'] = df.eval('math * 0.5 + english * 0.3 + science * 0.2')

print(df)

输出：

math english science total weighted_avg
0 90 85 88 263 87.300000
1 80 75 92 247 79.900000
2 70 65 78 213 70.100000

总结

方法	适用场景	示例
apply() + 自定义函数	复杂逻辑	df.apply(lambda row: row['A'] + row['B'], axis=1)
np.where() / np.select()	条件判断	np.where((df['A'] > 0) & (df['B'] < 0), '符合', '不符合')
直接运算	简单计算	df['total'] = df['A'] + df['B'] + df['C']
assign() + lambda	链式操作	df.assign(new_col=lambda x: x['A'] * 2)
eval()	高效计算	df.eval('A + B * C')

最佳实践：

简单计算 → 直接 + - * / 或 assign()
复杂逻辑 → apply() + lambda 或自定义函数
条件判断 → np.where()（二分类）或 np.select()（多条件）
避免 eval()（除非性能关键，否则可读性较差）

示例：综合应用

# 计算总分
df['total'] = df['math'] + df['english'] + df['science']

# 计算加权平均
df['weighted_avg'] = df.eval('math * 0.5 + english * 0.3 + science * 0.2')

# 判断是否优秀（math 和 english 都 > 85）
df['is_excellent'] = np.where((df['math'] > 85) & (df['english'] > 85), 'Yes', 'No')

print(df)

输出：

math english science total weighted_avg is_excellent
0 90 85 88 263 87.300000 No
1 80 75 92 247 79.900000 No
2 70 65 78 213 70.100000 No

这样，你可以灵活地基于多列数据生成新列！

到此这篇关于Python Pandas实现根据多列的值生成新的列的文章就介绍到这了,更多相关Pandas根据多列的值生成列内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家！

您可能感兴趣的文章:

Pandas
列

python 动态生成变量名以及动态获取变量的变量名方法
今天小编就为大家分享一篇python 动态生成变量名以及动态获取变量的变量名方法，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧
2019-01-01
Python编程实现输入某年某月某日计算出这一天是该年第几天的方法
这篇文章主要介绍了Python编程实现输入某年某月某日计算出这一天是该年第几天的方法,涉及Python针对日期时间的转换与运算相关操作技巧,需要的朋友可以参考下
2017-04-04
Python字符串前缀使用方法技巧总结
在Python中我们可以通过简单的循环来获取一个字符串的所有前缀,前缀是指从字符串开头到任意位置的子字符串,这篇文章主要介绍了Python字符串前缀使用方法技巧的相关资料,需要的朋友可以参考下
2025-10-10
使用Python简单实现去除彩色水印
这篇文章主要为大家详细介绍了如何使用Python简单实现去除彩色水印效果,文中的示例代码讲解详细,感兴趣的小伙伴可以跟随小编一起学习一下
2025-02-02
Python实战之能监控文件变化的神器—看门狗
这篇文章主要介绍了Python实战之能监控文件变化的神器—看门狗,文中有非常详细的图文及代码示例,对正在学习python的小伙伴们有非常好的帮助,需要的朋友可以参考下
2021-05-05
Django框架的中的setting.py文件说明详解
这篇文章主要介绍了Django框架的中的setting.py文件说明详解，这个文件包含了所有有关这个Django项目的配置信息，具有一定的参考价值，感兴趣的小伙伴们可以参考一下
2018-10-10
使用python-docx在word文档中查找书签,并在书签处写入数据方式
使用python-docx库，可在Word文档中查找书签并写入数据。首先打开文档，通过bookmarks属性获取书签对象，然后使用书签名定位书签位置，最后将数据写入书签处。这种方法适合自动化填充Word模板等场景
2024-09-09
基于nexus3配置Python仓库过程详解
这篇文章主要介绍了基于nexus3配置Python仓库过程详解,文中通过示例代码介绍的非常详细，对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
2020-06-06
python f-string式格式化听语音流程讲解
在本篇文章中小编给大家整理的是关于python f-string式格式化听语音的相关知识点内容，有兴趣的朋友们学习下。
2019-06-06
python中的torch常用tensor处理函数示例详解
这篇文章主要介绍了python中的torch常用tensor处理函数,本文通过实例代码给大家介绍的非常详细，对大家的学习或工作具有一定的参考借鉴价值，需要的朋友可以参考下
2023-07-07