pytorch tensor计算三通道均值方式

 更新时间:2022年07月16日 16:12:58   作者:IFT_jason  
这篇文章主要介绍了pytorch tensor计算三通道均值方式,具有很好的参考价值,希望对大家有所帮助。如有错误或未考虑完全的地方,望不吝赐教

tensor计算三通道均值

今天用pytorch处理图像时,涉及到了计算均值的问题,整理一下解决思路。

第一种思路

tensor转换为numpy再进行处理

import torch
import cv2
img = cv2.imread("image path")
tensor_img = torch.from_numpy((img[:, :, ::-1] / 255.0)[None, ...].transpose(0, 3, 1, 2)).cuda()
 
...
 
numpy_img = (tensor_img.detach().cpu().numpy().transpose(2, 3, 1, 0).squeeze() * 255)[:, :, ::-1]
 
ave_color = np.mean(numpy_img , axis=(0, 1))

如果图像里有0值,不想计入运算:

numpy_img[numpy_img == 0] = np.nan
ave_color = np.nanmean(numpy_img, axis=(0, 1))

由于tensor和numpy来回转换会消耗资源、性能。

又查了一番,直接在tensor中计算(非零均值计算)

reshape_tensor_img = tensor_img.view(tensor_img.size(0), tensor_img.size(1), -1)
ave_color = reshape_tensor_img.mean(2)
 
# mean value without 0
non_zero_img = reshape_tensor_img[reshape_tensor_img.nonzero(as_tuple=True)]
ave_color = non_zero_img.view(reshape_tensor_img.size(0), reshape_tensor_img.size(1), -1).mean(2)

计算完均值,想要加法运算的时候也会碰上一点维度上的麻烦,需要维度转换一下。

reshape_ave_color = ave_color.view(ave_color.size(0), ave_color.size(1), 1, 1)
add_img = tensor_img + reshape_ave_color

Pytorch tensor的运算

tensor操作

1. 新建

A、torch.Tensor(shape)/torch.FloatTensor(shape):随机初始化一个维度为shape的张量。

B、torch.randn(shape):用均值为0,方差为1的高斯分布初始化一个shape的张量。

C、torch.rand(shape):在区间[0,1]上均匀分布,初始化一个shape的张量。

2、Tensor的变换

A、view / reshape

两个用法差不多,都是用来改变一个张量的数据分布。

注:(2,-1)中的-1会自动计算剩下的维度。

B、squeeze / unsqueeze

第一个是用来压缩维度为1的张量,如(6,1,32,32).squeeze()之后就变为(6,32,32);第二个是用来增加一个维度。具体看实例如下:

注:squeeze中不带参数,是将所有维度为1的地方去掉,带参数是去指定维度为1的地方,若指定的维度不为1,则不变。

注:在指定的维度上插入一个大小为1的新维度。

C、expand / repeat

这两个都是进行数据的扩充操作,第一个是扩充到指定的维度大小,第二个函数的参数维度上扩充的倍数。一般结合上面2.B中的函数使用。

D、 t / transpose / permute

这三个函数用来数据维度之间的调整,第一个只能用于2D。

E、broadcasting机制

相当于自动完成了unsqueeze+expand的操作,但是相比节省内存空间。

通过broadcasting机制,张量可以直接和标量进行相加。

以上为个人经验,希望能给大家一个参考,也希望大家多多支持脚本之家。

相关文章

  • Python使用MoviePy实现编辑音视频并添加字幕

    Python使用MoviePy实现编辑音视频并添加字幕

    MoviePy是一个用于视频编辑的Python模块,它可被用于一些基本操作,本文主要介绍了如何使用编辑音视频并添加字幕,感兴趣的小伙伴可以了解下
    2024-01-01
  • MATLAB中text函数使用的语法与示例代码

    MATLAB中text函数使用的语法与示例代码

    text函数的功能是向数据点添加文本说明,下面这篇文章主要给大家介绍了关于MATLAB中text函数使用的语法与示例的相关资料,文中通过实例代码介绍的非常详细,需要的朋友可以参考下
    2023-05-05
  • 编写多线程Python服务器 最适合基础

    编写多线程Python服务器 最适合基础

    很好的Python多线程基础教程,能够帮助初学者快速了解Python多线程简单实现。线程可以使任何程序运行得更快。但是这也增加了代码的复杂性。所以,如果你发现很难理解,那么添加更多的日志将有助于检查里面发生了什么
    2018-09-09
  • 如何升级python包到指定版本

    如何升级python包到指定版本

    这篇文章主要介绍了如何升级python包到指定版本问题,具有很好的参考价值,希望对大家有所帮助,如有错误或未考虑完全的地方,望不吝赐教
    2024-03-03
  • python人工智能tensorflow常见损失函数LOSS汇总

    python人工智能tensorflow常见损失函数LOSS汇总

    这篇文章主要为大家介绍了python人工智能tensorflowf常见损失函数LOSS汇总,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步,早日升职加薪
    2022-05-05
  • 使用Pytorch Geometric进行链接预测的实现代码

    使用Pytorch Geometric进行链接预测的实现代码

    PyTorch Geometric (PyG)是构建图神经网络模型和实验各种图卷积的主要工具,在本文中我们将通过链接预测来对其进行介绍,文中有详细的代码示例供大家参考,需要的朋友可以参考下
    2023-10-10
  • 实例讲解Python爬取网页数据

    实例讲解Python爬取网页数据

    这篇文章给大家通过实例讲解了Python爬取网页数据的步骤以及操作过程,有兴趣的朋友跟着学习下吧。
    2018-07-07
  • 在notepad++中实现直接运行python代码

    在notepad++中实现直接运行python代码

    今天小编就为大家分享一篇在notepad++中实现直接运行python代码,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-12-12
  • 对matplotlib改变colorbar位置和方向的方法详解

    对matplotlib改变colorbar位置和方向的方法详解

    今天小编就为大家分享一篇对matplotlib改变colorbar位置和方向的方法详解,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2018-12-12
  • Python实现实时监测可视化数据大屏

    Python实现实时监测可视化数据大屏

    实时监测的可视化数据大屏是一种非常有用的工具,可以帮助我们实时了解数据的变化和趋势,下面我们将介绍如何使用Python代码实现实时监测的可视化数据大屏,需要的可以参考一下
    2023-06-06

最新评论