Pytorch中的图像增广transforms类和预处理方法

 更新时间:2023年04月01日 14:33:54   作者:北岛寒沫  
这篇文章主要介绍了Pytorch中的图像增广和预处理方法(transforms类),本文通过实例代码给大家介绍的非常详细,对大家的学习或工作具有一定的参考借鉴价值,需要的朋友可以参考下

Python客栈送红包、纸质书

1.随机翻转(水平和垂直)

torchvision.transforms.RandomVerticalFlip函数和torchvision.transforms.RandomHorizontalFlip函数是两个可以实现数据增强的函数,可以将输入的图像进行随机垂直翻转和随机水平翻转,从而增加数据集的多样性。

具体来说,torchvision.transforms.RandomVerticalFlip函数可以将输入图像在垂直方向上进行随机翻转,而torchvision.transforms.RandomHorizontalFlip函数可以将输入图像在水平方向上进行随机翻转。这两个函数都可以通过设置参数来控制翻转的概率。

下面是这两个函数的使用方法:

1
2
3
4
5
6
7
8
9
10
11
12
import torch
import torchvision.transforms as transforms
 
# 定义随机垂直翻转和随机水平翻转的概率
vflip_probability = 0.5  # 随机垂直翻转的概率
hflip_probability = 0.5  # 随机水平翻转的概率
 
# 定义图像变换
transform = transforms.Compose([
    transforms.RandomVerticalFlip(p=vflip_probability),
    transforms.RandomHorizontalFlip(p=hflip_probability)
])

在上述代码中,我们首先通过transforms.Compose函数定义了一个图像变换的序列,其中包含了随机垂直翻转和随机水平翻转两个操作。

2.随机裁剪缩放

torchvision.transforms.RandomResizedCrop函数可以进行随机裁剪和缩放,从而增加数据集的多样性。在实际使用中,这个函数有许多可调参数,下面是一个更加完整的介绍:

1
2
3
4
5
6
transforms.RandomResizedCrop(
    size,       # 输出图像的大小
    scale=(0.08, 1.0),  # 缩放范围,将输入图像按照该范围内的随机比例缩放
    ratio=(3.0/4.0, 4.0/3.0),   # 长宽比范围,将输入图像按照该范围内的随机比例进行裁剪
    interpolation=2     # 缩放时使用的插值方法,可选1、2、3、4中的一个,默认为PIL.Image.BILINEAR
)

下面是各个参数的详细介绍:

  • size:输出图像的大小,可以是一个整数,表示输出图像的边长,或者是一个二元组,表示输出图像的宽和高。例如,如果设置size=224,则输出图像的大小为 224 × 224 224\times224 224×224;如果设置size=(256,192),则输出图像的大小为 256 × 192 256\times192 256×192。
  • scale:缩放范围,将输入图像按照该范围内的随机比例缩放。该参数是一个二元组,表示缩放比例的范围,例如(0.08,1.0)表示将输入图像缩放到原来的 0.08 0.08 0.08到 1.0 1.0 1.0倍之间的随机比例。默认值为(0.08, 1.0)。
  • ratio:长宽比范围,将输入图像按照该范围内的随机比例进行裁剪。该参数是一个二元组,表示长宽比的范围,例如(3.0/4.0,4.0/3.0)表示将输入图像按照宽高比在 3 / 4 3/4 3/4到 4 / 3 4/3 4/3之间的随机比例进行裁剪。默认值为(3.0/4.0, 4.0/3.0)。
  • interpolation:缩放时使用的插值方法,可选1、2、3、4中的一个,分别表示PIL.Image.NEAREST、PIL.Image.BILINEAR、PIL.Image.BICUBIC和PIL.Image.LANCZOS。默认值为PIL.Image.BILINEAR。

3.随机修改颜色(颜色抖动)

在PyTorch中,torchvision.transforms.RandomColorJitter函数可以用于对图像进行随机颜色抖动,增加数据集的多样性。这个函数可以随机地改变图像的亮度、对比度、饱和度和色相,并且还可以随机地进行灰度化操作。下面是该函数的参数:

1
2
3
4
5
6
7
transforms.RandomColorJitter(
    brightness=0.1,    # 亮度调整的强度,默认值为0.1
    contrast=0.1,      # 对比度调整的强度,默认值为0.1
    saturation=0.1,    # 饱和度调整的强度,默认值为0.1
    hue=0.1,           # 色相调整的强度,默认值为0.1
    p=0.5,             # 执行颜色抖动的概率,默认值为0.5
)

下面是各个参数的详细介绍:

  • brightness:亮度调整的强度。默认值为0.1。如果设置为0,则不进行亮度调整。
  • contrast:对比度调整的强度。默认值为0.1。如果设置为0,则不进行对比度调整。
  • saturation:饱和度调整的强度。默认值为0.1。如果设置为0,则不进行饱和度调整。
  • hue:色相调整的强度。默认值为0.1。如果设置为0,则不进行色相调整。
  • p:执行颜色抖动的概率。默认值为0.5。如果设置为1,则每个图像都会执行颜色抖动。

4.将图像转化为张量

在PyTorch的torchvision库中,ToTensor函数是一种将PIL Image或numpy.ndarray格式的图像转换为PyTorch Tensor格式的函数。它可以将图像中的像素值转换为0到1之间的标准化数值,并调整图像的通道顺序,使其符合PyTorch模型的输入要求。

ToTensor函数的使用方法如下:

1
2
from torchvision.transforms import ToTensor
transform = ToTensor()

一般来说,在使用Compose组合在一起的一组transform中,ToTensor函数应该放在最后一个位置,以便将图像转换为PyTorch Tensor格式的图像,并确保其他所有的transform都在Tensor转换之前完成。

5.标准化操作

在PyTorch的torchvision.transforms库中,Normalize函数是一种对图像进行标准化处理的函数。它可以将图像中的像素值进行归一化处理,使得图像的像素值均值为0,标准差为1,从而增强模型的收敛速度和泛化性能。

Normalize函数的使用方法如下:

1
2
from torchvision.transforms import Normalize
transform = Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])

在上述代码中,我们首先导入了Normalize函数,并创建了一个名为transform的Normalize对象。其中,meanstd参数分别代表图像各通道像素值的平均值和标准差。在这里,我们以ImageNet数据集的图像均值和标准差为例进行了设置。

需要注意的是,Normalize函数应该在图像转换为PyTorch Tensor格式之后应用,即在ToTensor之后。这是因为Normalize需要对每个通道的像素值进行标准化,而ToTensor函数将图像中的像素值转换为PyTorch Tensor格式后,每个通道的像素值将存储在不同的维度上,因此才需要在ToTensor之后进行标准化处理。

6.同时结合多种增广方法

在PyTorch的torchvision库中,Compose函数是一种将多个数据增强操作组合在一起的函数。它可以将多个数据增强操作按照一定的顺序组合在一起,并将它们作为一个整体应用于数据集中的每个样本。Compose函数可以帮助我们方便地实现复杂的数据增强操作,同时也可以使我们的代码更加简洁和易读。

Compose函数的使用方法如下:

1
2
3
4
5
6
7
8
from torchvision.transforms import Compose
from torchvision.transforms import RandomCrop, RandomHorizontalFlip, ToTensor
 
transform = Compose([
    RandomCrop(32),
    RandomHorizontalFlip(),
    ToTensor()
])

在上述代码中,我们首先导入了Compose函数和其他一些数据增强操作,然后创建了一个名为transform的Compose对象。该Compose对象由三个数据增强操作组成:随机裁剪(RandomCrop),随机水平翻转(RandomHorizontalFlip)和转换为Tensor格式(ToTensor)。

到此这篇关于Pytorch中的图像增广和预处理方法(transforms类)的文章就介绍到这了,更多相关Pytorch图像增广和预处理内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

蓄力AI

微信公众号搜索 “ 脚本之家 ” ,选择关注

程序猿的那些事、送书等活动等着你

原文链接:https://blog.csdn.net/hanmo22357/article/details/129765962

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权/违法违规/事实不符,请将相关资料发送至 reterry123@163.com 进行投诉反馈,一经查实,立即处理!

相关文章

  • 将tf.batch_matmul替换成tf.matmul的实现

    将tf.batch_matmul替换成tf.matmul的实现

    这篇文章主要介绍了将tf.batch_matmul替换成tf.matmul的实现,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-06-06
  • python文件转为exe文件的方法及用法详解

    python文件转为exe文件的方法及用法详解

    py2exe是一个将python脚本转换成windows上的可独立执行的可执行程序(*.exe)的工具,这样,你就可以不用装python而在windows系统上运行这个可执行程序。本文重点给大家介绍python文件转为exe文件的方法,感兴趣的朋友跟随小编一起看看吧
    2019-07-07
  • Python实现图形用户界面计算器

    Python实现图形用户界面计算器

    这篇文章主要为大家详细介绍了Python实现图形用户界面计算器,文中示例代码介绍的非常详细,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2022-07-07
  • python中array数组添加一行或一列数据的具体实现

    python中array数组添加一行或一列数据的具体实现

    这篇文章主要给大家介绍了关于python中array数组添加一行或一列数据的具体实现,最近经常使用到数组方法,文中通过代码介绍的非常详细,需要的朋友可以参考下
    2023-09-09
  • Python爬取雪中悍刀行弹幕分析并可视化详程

    Python爬取雪中悍刀行弹幕分析并可视化详程

    这篇文章主要介绍了用Python爬虫+数据分析+数据可视化,分析《雪中悍刀行》弹幕,本文很适合初学python的同学入门阅读,需要的朋友可以参考下
    2022-01-01
  • Python中Matplotlib的简单使用

    Python中Matplotlib的简单使用

    这篇文章主要介绍了Python中Matplotlib的简单使用,Matplotlib是一个用于绘制数据可视化图形的Python库,支持绘制各种静态,动态,交互式的图表,它是数据科学和机器学习领域最流行的可视化库之一,需要的朋友可以参考下
    2023-07-07
  • python多线程semaphore实现线程数控制的示例

    python多线程semaphore实现线程数控制的示例

    这篇文章主要介绍了python多线程semaphore实现线程数控制的示例,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友们下面随着小编来一起学习学习吧
    2020-08-08
  • pytorch加载自己的图像数据集实例

    pytorch加载自己的图像数据集实例

    这篇文章主要介绍了pytorch加载自己的图像数据集实例,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2020-07-07
  • python set()去重的底层原理及实例

    python set()去重的底层原理及实例

    python中集合set是一个无序不重复元素的集,基本功能包括关系测试和消除重复元素,还可以计算交集、差集、并集等,它与列表(list)的行为类似,这篇文章主要介绍了python set()去重的底层原理,需要的朋友可以参考下
    2022-01-01
  • pyqt QGraphicsView 以鼠标为中心进行缩放功能实现

    pyqt QGraphicsView 以鼠标为中心进行缩放功能实现

    在PyQt开发中,实现QGraphicsView的鼠标中心缩放功能需要注意初始化以及关键函数的重定义,遇到不达预期的效果时,可能需要重写所有鼠标事件,本文记录了解决QGraphicsView鼠标缩放问题的过程,供开发者参考
    2024-10-10

最新评论