详解如何使用numpy提高Python数据分析效率

 更新时间:2023年04月13日 09:37:15   作者:Python 集中营  
NumPy是Python语言的一个第三方库,其支持大量高维度数组与矩阵运算。本文主要为大家介绍了如何使用numpy提高python数据分析效率,需要的可以参考一下

NumPy是Python语言的一个第三方库,其支持大量高维度数组与矩阵运算。

作为python科学计算领域的三剑客之一,numpy在数据分析处理方面有着独特的魅力!

图片

numpy模块的出现更多的是在数组处理的操作上面,并且支持和python常用的数据结构list之间的相互转换操作。

1、数组初始化

数组初始化即创建数组,numpy提供了相当多的创建不同结构的数组的方式,合理的利用这些数据初始化的操作能够让我们的开发事半功倍。

numpy目前最多可以支持三维数组的创建,下面我们直接通过实例来说明其使用技巧。

# 导入数据处理的numpy模块
import numpy as np

# 通过python列表list创建numpy一维数组
array_ = np.array(['a', 'b', 'c'])

# 控制台打印一维数组
print(array_)
# ['a' 'b' 'c']

# 通过python列表list创建numpy二维数组
array_ = np.array([('a', 'b', 'c'), (1, 2, 3)])

# 控制台打印二维数组
print(array_)
# [['a' 'b' 'c']
#  ['1' '2' '3']]

# 创建四行五列的二维数组,并填充值为1,可通过full函数创建任意的二维数组
array_ = np.full((5, 6), 1)

# 控制台打印任意的行、列的二维数组
print(array_)
# [[1 1 1 1 1 1]
#  [1 1 1 1 1 1]
#  [1 1 1 1 1 1]
#  [1 1 1 1 1 1]
#  [1 1 1 1 1 1]]

# 创建任意行、列的二维数组,并且填充值为随机数
array_ = np.random.rand(3, 4)

# 控制台打印随机数的二维数组
print(array_)
# [[0.94372258 0.66743021 0.47003813 0.44912263]
#  [0.71435389 0.47909147 0.52322176 0.32445311]
#  [0.9843635  0.14054129 0.10611754 0.45922036]]

上述便是常用的numpy模块关于数组的初始化方式,灵活应用几种array数组的创建方式能够解决在业务开发过程中的很多问题。

2、数组元素计算

除了numpy的数组的初始化方式,关于numpy数据元素的计算是开发过程中常常会使用的计算方式。

numpy模块提供的很多计算函数不仅简便,而且执行效率更高。有时候比我们自己写的函数运行速度甚至高出几倍不止。

下面就来看看在日常的数据处理过程中常用的几种数据处理函数的使用过程。

# array函数初始化多维度数组
array_ = np.array([(1, 2),
                   (3, 4), (5, 6)])

# sum函数计算多维度数组每一列的和
sum_ = np.sum(array_)

# 打印数组计算结果
print(sum_)
# 21

# mean函数计算多维度数组的平均值
mean_ = np.mean(array_)

# 打印数组计算结果
print(mean_)
# 3.5

# tile函数使元数组变成多行多列的形式,相当于复制的效果
tile_ = np.tile(array_, (3, 4))

# 打印计算结果
print(tile_)
# [[1 2 1 2 1 2 1 2]
#  [3 4 3 4 3 4 3 4]
#  [5 6 5 6 5 6 5 6]
#  [1 2 1 2 1 2 1 2]
#  [3 4 3 4 3 4 3 4]
#  [5 6 5 6 5 6 5 6]
#  [1 2 1 2 1 2 1 2]
#  [3 4 3 4 3 4 3 4]
#  [5 6 5 6 5 6 5 6]]

# 初始化二维数组
array_ = np.array([[3, 6, 4, 11],
                   [5, 10, 1, 3]])

# argsort函数完成对数组的排序操作
argsort_ = array_.argsort()

# 打印计算结果
print(argsort_)
# [[0 2 1 3]
#  [2 3 0 1]]

# argsort函数完成对数组列值的排序操作
argsort_ = array_.argsort(axis=0)

# 打印计算结果
print(argsort_)
# [[0 0 1 1]
#  [1 1 0 0]]

注意:上述的排序结果返回的是源数组的排序后的下标。

除了上述的numpy数组计算的基本操作,最常用的就是下面的numpy数组的加、减、乘、除计算。

通过数组的加、减、乘、除计算能够满足我们在业务开发过程中的绝大多数的计算操作。

# 初始化两个数组a_、b_分别用于下面的逻辑计算
a_ = np.array([1, 2, 3, 4])
b_ = np.array([5, 6, 7, 8])

# 计算两个一维数组的和
result_ = a_ + b_

# 打印计算结果
print(result_)
# [ 6  8 10 12]

# 计算两个一维数组的差
result_ = a_ - b_

# 打印计算结果
print(result_)
# [-4 -4 -4 -4]

# 计算两个一维数组的乘积
result_ = a_ * b_

# 打印计算结果
print(result_)
# [ 5 12 21 32]

# 计算两个一维数组的商
result_ = a_ / b_

# 打印计算结果
print(result_)
# [0.2        0.33333333 0.42857143 0.5       ]

除了上述的一维数组的相关计算,同时numpy还可支持二维矩阵的逻辑计算。

3、数组元素提取

数组元素的提取其实主要还是对数组的下标索引的相关操作。

numpy提供的多维数组同样能够使用对应的索引位置提取出相应的值。

# 初始化二维数组
array_ = np.array([[3, 6, 4, 11],
                   [5, 10, 1, 3]])

# 提取第二行、第四列的值
value_ = array_[1, 3]

# 打印计算结果
print(value_)
# 3

# 提取出倒数第二行、第三列到第四列之间的二维数组
value_ = array_[-2:, 2:3]

# 打印计算结果
print(value_)
# [[4]
#  [1]]

# 获取数组中大于、小于、等于某个数值的结果
result_ = array_ >= 10

# 打印计算结果
print(result_)
# [[False False False  True]
#  [False  True False False]]

# 返回的数组中,所在位置为True的数值就是符合逻辑计算的数值。

多维数组的索引的数值提取操作,能够辅助我们完成更加复杂的数据处理操作。

到此这篇关于详解如何使用numpy提高Python数据分析效率的文章就介绍到这了,更多相关Python numpy提高数据分析效率内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • python之glob的用法详解

    python之glob的用法详解

    glob 是 Python 中用于文件模式匹配的一个模块,本文主要介绍了python之glob的用法详解,具有一定的参考价值,感兴趣的可以来了解一下
    2023-12-12
  • Python基于正则表达式实现检查文件内容的方法【文件检索】

    Python基于正则表达式实现检查文件内容的方法【文件检索】

    这篇文章主要介绍了Python基于正则表达式实现检查文件内容的方法,可实现针对文件中import强制依赖的文件关系检索,涉及Python文件目录的遍历及正则匹配相关操作技巧,需要的朋友可以参考下
    2017-08-08
  • Matplotlib之解决plt.savefig()保存多张图片有重叠的问题

    Matplotlib之解决plt.savefig()保存多张图片有重叠的问题

    这篇文章主要介绍了Matplotlib之解决plt.savefig()保存多张图片有重叠的问题,具有很好的参考价值,希望对大家有所帮助,
    2023-09-09
  • python类:class创建、数据方法属性及访问控制详解

    python类:class创建、数据方法属性及访问控制详解

    下面小编就为大家带来一篇python类:class创建、数据方法属性及访问控制详解。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2016-07-07
  • Python+Tkinter制作在线个性签名工具

    Python+Tkinter制作在线个性签名工具

    这篇文章主要为大家分享如何利用Python中的Tkinter库制作一个简易的在线个性签名生成工具,文中的示例代码讲解详细,感兴趣的小伙伴可以了解一下
    2022-03-03
  • Python存储json数据发生乱码的解决方法

    Python存储json数据发生乱码的解决方法

    当使用json.dump()把python对象转换为json后存储到文件中时,文件可能会出现乱码的问题,本篇文章可以帮助您解决乱码问题,文中通过图文介绍的非常详细,需要的朋友可以参考下
    2023-09-09
  • python解析xml文件方式(解析、更新、写入)

    python解析xml文件方式(解析、更新、写入)

    这篇文章主要介绍了python解析xml文件方式(解析、更新、写入),具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-03-03
  • 儿童学习python的一些小技巧

    儿童学习python的一些小技巧

    这篇文章给大家总结了关于儿童学python的一些技巧和知识点,对此有兴趣的朋友可以跟着学习下。
    2018-05-05
  • Python基础教程之异常详解

    Python基础教程之异常详解

    调试Python程序时,经常会报出一些异常,下面这篇文章就来给大家介绍了关于Python基础教程之异常的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考下
    2019-01-01
  • Python SVM(支持向量机)实现方法完整示例

    Python SVM(支持向量机)实现方法完整示例

    这篇文章主要介绍了Python SVM(支持向量机)实现方法,结合完整实例形式分析了基于Python实现向量机SVM算法的具体步骤与相关操作注意事项,需要的朋友可以参考下
    2018-06-06

最新评论