Python numpy视图与副本

 更新时间:2022年01月24日 09:40:30   作者:盆友圈的小可爱  
这篇文章主要介绍了Python numpy视图与副本,继上一篇对numpy 模块之ndarray一文中对 ndarray 内存结构主要分为两部分metdata 、raw bata,下面来一起学习文章具体内容吧,需要的小伙伴也可以参考一下

前言:

继上一篇对numpy 模块之ndarray一文中对 ndarray 内存结构主要分为两部分:

metdata :存放数组类型dtype、数组维度ndim、维度数量shape、维间距strides等
raw bata:存放原始数据data

metdata 中包含着关于数组相关信息,可以帮助我们在数组ndarray中快速索引和解释指定的数据

除此了对数组进行索引操作外,也会对数组的原数据进行类似与之前“拷贝”操作。

众所周知,在 Python 中大家应该对深浅拷贝有一定的印象吧,在 numpy 中则换成了“视图”与“副本”的概念了。

相信大家和我一样对此存在疑问,十万个为什么涌上心头了,“视图是什么?”,“什么是副本?”

因此,本期我们一起来学习 numpy 模块中比较新奇的概念视图与副本,Let's go~

1. 简单讲解

我们之前在学习 Python 赋值、深浅拷贝时,在代码添加中对比两个对象的地址id()是否一致。

同理,按照这样的思路,numpy 中也可以对比两个数组地址是否一样。

同时,在 numpy 数组对象ndarray 也提供许多字段,方便让我们进一步地查看数组内部的差异

ndarray.flags : 查看数组存储策略、读写权限、对象等

  • C_CONTIGUOUS (C) 行优先存储
  • F_CONTIGUOUS 列优先存储
  • OWNDATA 数据所有者
  • WRITEABLE 编写权限
  • ALIGNED 数据元素与硬件指针对齐
  • WRITEBACKIFCOPY 数组是其他数组的副本
  • UPDATEIFCOPY 已弃用

注:flags 相关属性名称可以单独调用例如 flags.writeable

  • ndarray.base : 查看数组中的元素是否来自其他数组
  • ndarray.nbytes: 查看数组中数据占用的字节数
  • getsizeof(item): 查看数组占用的内存空点

介绍完上述指标,我们来小试一下:

>>> import numpy as np
>>> a = np.array([1,2,3,4])
>>> print(a[1:3])
[2 3]
>>> print(a[[1,2]])
[2 3]
>>>

查看a[1:3] 与 a[[1,2]] 内存地址,它们俩位置不一样,a[[1,2]]意味发生了深拷贝本(副本),a[1:3] 是原数组a引用(视图)

>>> print(id(a[1:3]))
2247482965008
>>> print(id(a[[1,2]]))
2247482964928

查看ndarray.owndata 属性,发现a[1:3] 数据来自a数组的,而a[[1,2]]是自身数据的

>>> print(a.flags.owndata)
True
>>> print(a[1:3].flags.owndata)
False
>>> print(a[[1,2]].flags.owndata)
True

我们在看一下 ndarray.base 属性,果真印证了使用flags.owndata 查询的结果,a[1:3] 不是数据所有者,而数据来源数组a;

a[[1,2]] 是数据所有者,数据来源本身(None)

>>> print(a[[1,2]].base)
None
>>> print(a[1:3].base)
[1 2 3 4]

2. 视图

视图概念

我们通过上述简单例子,可以知道 a[1:3] 不是数据所有者,数据来源于对数组a的引用(浅拷贝)。

因此,我们应该对视图有了基本的认识了,看一下官方怎么描述视图的

No copy at All。 Simple assignments make no copy of objects or their data.

视图,是对原数组进行引用拷贝,共享原始数组的数据。

视图应用

视图在numpy中广泛使用,视图一般产生有两种场景:

  • 当对原始数组进行引用时
  • 当自身无数据,与原数组共享数据时
>>> import numpy as np
>>> a = np.array([1,2,3,4])
>>> b = a
>>> b is a
True
>>> id(a)
2247207679680
>>> id(b)
2247207679680
>>>

我们可以看到 a 与 b 是 同享同一个数据空间的

numpy 模块诸如索引、切片、函数view(),reshape()等返回视图结果

>>> arr = np.arange(10)
>>> arr_view = arr.view()
>>> arr.shape = (2,5)
>>> arr_reshape = arr.reshape(5,2)
# ndarray.base 属性
>>> print(arr.base)
None
>>> print(arr_view.base)
[[0 1 2 3 4]
 [5 6 7 8 9]]
>>> print(arr_reshape.base)
[[0 1 2 3 4]
 [5 6 7 8 9]]
# ndarray.flags.owndata 属性
>>> print(arr.flags.owndata)
True
>>> print(arr_view.flags.owndata)
False
>>> print(arr_reshape.flags.owndata)
False
>>>

视图优点

在 numpy 中 视图可以创建的对象可以节省内存空间,并且无需复制,提高查询速度

在视图中,创建的对象如果修改数据,原始数据也被修改。

3. 副本

副本概念

副本是对原数组进行完整拷贝(数据地址也会拷贝新的),与原始数组完全独立,相对于“深拷本”,不与原始数组共享数据。

同样截取官网,对副本的描述:

Deep Copy The copy method makes a complete copy of the array and its data

当改变副本的数据元素值时,虽然改变了副本与原数组相互独立,原始数组中元素值不会发生改变。

副本应用

  • 当进行切片操作时
  • 当需要与原始数组数据独立时

副本的实现我们可以直接使用 ndarray.copy()方法对原数组进行深拷贝

b = np.array([2,5,7])

c = b.copy()

c[1] = 8

print("b:",b)
print("c:",c)

print("c is b:",c is b)

# 查看 ndarray.base 属性å
print("b.base:",b.base)
print("c.base:",c.base)

# 查看 ndarray.flags.owndata
print("b.flags.owndata:",b.flags.owndata)
print("c.flags.owndata:",c.flags.owndata)

image.png

image.png

总结:

本期,我们对 numpy 模块中重要的概念视图和副本。

  • 视图,相当于浅拷贝,与原数组共享数据。
  • 副本,相当于深拷贝,与原数组数据相互独立

我们可以通过内存地址id()方法,同时借助ndarray.base、ndarray.flags来进一步分析区别

到此这篇关于Python numpy视图与副本的文章就介绍到这了,更多相关Python numpy视图与副本内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python subprocess模块学习总结

    Python subprocess模块学习总结

    从Python 2.4开始,Python引入subprocess模块来管理子进程,以取代一些旧模块的方法:如 os.system、os.spawn*、os.popen*、popen2.*、commands.*不但可以调用外部的命令作为子进程,而且可以连接到子进程的input/output/error管道,获取相关的返回信息
    2014-03-03
  • 学python需要去培训机构吗

    学python需要去培训机构吗

    在本篇文章里小编给大家整理的是关于学python是否需要去培训机构的相关内容,有需要的朋友们可以阅读下。
    2020-07-07
  • OpenCV 图像旋转、平移、缩放操作代码

    OpenCV 图像旋转、平移、缩放操作代码

    这篇文章主要介绍了OpenCV 图像旋转、平移、缩放,本文是 OpenCV图像视觉入门之路的第7篇文章,本文详细的进行了图像的缩放 cv2.resize()、旋转 cv2.flip()、平移 cv2.warpAffine()等操作,需要的朋友可以参考下
    2022-12-12
  • python spotlight库简化交互式方法探索数据分析

    python spotlight库简化交互式方法探索数据分析

    这篇文章主要为大家介绍了python spotlight库简化的交互式方法探索数据,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2024-01-01
  • keras多显卡训练方式

    keras多显卡训练方式

    这篇文章主要介绍了keras多显卡训练方式,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06
  • Pytorch深度学习之实现病虫害图像分类

    Pytorch深度学习之实现病虫害图像分类

    PyTorch是一个开源的Python机器学习库,基于Torch,用于自然语言处理等应用程序。它具有强大的GPU加速的张量计算和自动求导系统的深度神经网络。本文将介绍如何通过PyTorch实现病虫害图像分类,感兴趣的可以学习一下
    2021-12-12
  • 利用Python实现获取照片位置信息

    利用Python实现获取照片位置信息

    Python中的exifread库,不仅仅是 GPS 信息,几乎能获得图片的所有信息。本文就将利用这个库实现获取照片位置信息,感兴趣的可以了解一下
    2022-08-08
  • 多个版本的python共存时使用pip的正确做法

    多个版本的python共存时使用pip的正确做法

    这篇文章主要介绍了多版本python共存时使用pip的正确做法,帮助有多个python版本需求的人可以正确的导包,感兴趣的朋友可以了解下
    2020-10-10
  • Python中Tkinter布局管理grid的使用

    Python中Tkinter布局管理grid的使用

    本文主要介绍了Python中Tkinter布局管理grid的使用,文中通过示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-01-01
  • Python设计模式结构型组合模式

    Python设计模式结构型组合模式

    这篇文章主要介绍了Python设计模式结构型组合模式,组合模式即Composite Pattern,将对象组合成成树形结构以表示“部分-整体”的层次结构,组合模式使得用户对单个对象和组合对象的使用具有一致性,下文具有一定的参考价值,需要的小伙伴可以参考一下
    2022-02-02

最新评论