Python的numpy和pandas简介及使用场景
NumPy 与 Pandas 简介
NumPy(Numerical Python)和 Pandas 是 Python 中用于数据分析和科学计算的核心库。NumPy 提供高效的多维数组操作和数学函数,而 Pandas 建立在 NumPy 之上,专注于表格数据的处理和高级分析。
NumPy 的核心功能
多维数组(ndarray)
NumPy 的核心是 ndarray 对象,支持高效的数值运算(如向量化操作),适合处理大规模数值数据。
数学与统计函数
提供丰富的数学函数(如 np.sin(), np.exp())和统计方法(如 np.mean(), np.std())。
广播机制
允许不同形状的数组进行算术运算,无需显式循环。
示例代码
import numpy as np arr = np.array([1, 2, 3]) print(arr * 2) # 输出 [2 4 6]
Pandas 的核心功能
数据结构
Series:一维带标签数组,类似增强版列表。DataFrame:二维表格结构,支持行列索引,类似 Excel 或 SQL 表。
数据操作
支持数据清洗(如缺失值处理)、合并、分组聚合(groupby)和时间序列分析。
示例代码
import pandas as pd
data = {'Name': ['Alice', 'Bob'], 'Age': [25, 30]}
df = pd.DataFrame(data)
print(df[df['Age'] > 25])
主要区别
| 特性 | NumPy | Pandas |
|---|---|---|
| 数据结构 | 多维数组 (ndarray) | Series 和 DataFrame |
| 用途 | 数值计算、线性代数 | 表格数据处理、分析 |
| 索引 | 整数位置索引 | 支持标签索引(如列名) |
结合使用场景
NumPy 适合底层数值计算(如矩阵乘法),Pandas 适合结构化数据分析和预处理。两者常联合使用:
import numpy as np import pandas as pd # 生成随机数据并转换为 DataFrame data = np.random.rand(5, 3) df = pd.DataFrame(data, columns=['A', 'B', 'C']) print(df.describe())
通过合理选择工具,可以高效完成从基础计算到复杂分析的任务。
到此这篇关于Python的numpy和pandas简介及使用场景的文章就介绍到这了,更多相关Python的numpy和pandas内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!
相关文章
pytest解读fixture有效性及跨文件共享fixtures
这篇文章主要为大家介绍了pytest官方文档fixture有效性及跨文件共享fixtures的解读,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪2022-06-06
ruff check文件目录检测--exclude参数设置路径详解
这篇文章主要为大家介绍了ruff check文件目录检测exclude参数如何设置多少路径详解,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪2023-10-10
浅谈Python使用pickle模块序列化数据优化代码的方法
这篇文章主要介绍了浅谈Python使用pickle模块序列化数据优化代码的方法,pickle模块可以对多种Python对象进行序列化和反序列化,序列化称为pickling,反序列化称为unpickling,需要的朋友可以参考下2023-07-07


最新评论