​Python使用Mediapipe对图像进行手部地标检测

 更新时间:2022年03月08日 10:39:38   作者:woshicver  
本文将以深度库即Mediapipe为基础库,以及其他计算机视觉预处理的CV2库来制作手部地标检测模型,文中的示例代码讲解详细,感兴趣的可以了解一下

概述

在本文中,我们将以深度库即 Mediapipe为基础库,以及其他计算机视觉预处理的CV2库来制作手部地标检测模型。市场上有很多关于这种问题的用例,例如商业相关的虚拟现实、游戏部分的实时体验。

行业用例

智能家居:这是计算机视觉的现代用例之一,人们使用智能家居来过上更舒适的生活,这就是为什么它不再是一个小众领域,它也正在蔓延到普通家庭。

智能电视:我们经常看到这种用例,你可以用手势来改变音量、改变频道等等。

游戏:对于真正的体验,这项技术越来越多地融入互动游戏。

让我们建立我们的手部检测模型

导入库

在这里,我们将导入整个管道中需要的所有库

import cv2
import numpy as np
import mediapipe as mp
import matplotlib.pyplot as plt

使用 Mediapipe 初始化手的地标检测模型

第一步是使用有效参数初始化模型,无论我们采用哪种检测技术,它可以是Mediapipe 或Yolo,初始化模型很重要,遵循相同的原则,我们将遵循所有给定的步骤:

# First step is to initialize the Hands class an store it in a variable
mp_hands = mp.solutions.hands
 
# Now second step is to set the hands function which will hold the landmarks points
hands = mp_hands.Hands(static_image_mode=True, max_num_hands=2, min_detection_confidence=0.3)
 
# Last step is to set up the drawing function of hands landmarks on the image
mp_drawing = mp.solutions.drawing_utils

代码分解:

  1. 首先,使用mp.solutions.hands初始化变量 mp_hands。
  2. 然后使用相同的变量通过mp.solutions.hands.Hands()为hands设置函数。

到目前为止,我们了解了手模型初始化的结构,现在让我们深入研究函数中使用的参数hands

  • static_image_mode: 该参数将布尔值作为其有效值,即它可以是True或False。当处理视频流时,默认条件是 False ,这意味着它会降低处理延迟,即它会继续专注于特定的手并定位相同的手,直到它追踪的手消失,当我们必须检测实时流或视频中的手时,这可能是有益的,根据我们的要求,我们必须检测图像上的地标,因此我们将值设置为True
  • max_num_hands:此参数将指示模型将在一个实例中检测到的最大手数。默认情况下,该值为 2,这也是有意义的,尽管我们可以更改它,但我们希望至少检测到一双手。
  • min_detection_confidence:它提供了置信水平的阈值。最小检测置信度的理想范围是 [0.0,1.0],默认情况下,它保持为 0.5,这意味着如果置信度低于 50%,则在输出图像中根本不会检测到手。

最后,我们将使用mp.solutions.drawing_utils,它将负责在输出图像上绘制所有手的地标,这些地标由我们的 Hands 函数检测到。

读取图像

在这里,我们将首先使用cv2.imread()读取要在其上执行手部检测的图像,并使用matplotlib库来显示该特定输入图像。

# Reading the sample image on which we will perform the detection
sample_img = cv2.imread('media/sample.jpg')
 
# Here we are specifing the size of the figure i.e. 10 -height; 10- width.
plt.figure(figsize = [10, 10])
 
# Here we will display the sample image as the output.
plt.title("Sample Image");plt.axis('off');plt.imshow(sample_img[:,:,::-1]);plt.show()

输出:

执行手部地标检测

因此,现在我们已经初始化了我们的手部检测模型,下一步将是处理输入图像上的手部地标检测,并使用上述初始化模型在该图像上绘制所有 21 个地标,我们将通过以下步骤。

results = hands.process(cv2.cvtColor(sample_img, cv2.COLOR_BGR2RGB))
 
if results.multi_hand_landmarks:
    
   for hand_no, hand_landmarks in enumerate(results.multi_hand_landmarks):
        print(f'HAND NUMBER: {hand_no+1}')
        print('-----------------------')
        
        for i in range(2):
            print(f'{mp_hands.HandLandmark(i).name}:')
            print(f'{hand_landmarks.landmark[mp_hands.HandLandmark(i).value]}')

输出:

代码分解:

  1. 第一步,我们使用Mediapipe 库中的process函数将手部地标检测结果存储在变量results中,同时我们将图像从 BGR 格式转换为 RGB 格式。
  2. 在进入下一步时,我们将首先检查一些验证,是否检测到点,即变量results应该存放了一些结果。
  3. 如果是,那么我们将遍历在图像中检测到的具有手部地标的所有点。
  4. 现在在另一个循环中,我们可以看到只有 2 次迭代,因为我们只想显示手的 2 个地标。
  5. 最后,我们将根据要求打印出所有检测到并过滤掉的地标。

从上面的处理中,我们发现所有检测到的地标都被归一化为通用尺度,但是现在对于用户端,这些缩放点是不相关的,因此我们会将这些地标恢复到原始状态。

image_height, image_width, _ = sample_img.shape
 
if results.multi_hand_landmarks:
 
    for hand_no, hand_landmarks in enumerate(results.multi_hand_landmarks):
        
        print(f'HAND NUMBER: {hand_no+1}')
        print('-----------------------')
        
        for i in range(2):    
            print(f'{mp_hands.HandLandmark(i).name}:') 
            print(f'x: {hand_landmarks.landmark[mp_hands.HandLandmark(i).value].x * image_width}')
            print(f'y: {hand_landmarks.landmark[mp_hands.HandLandmark(i).value].y * image_height}')
            print(f'z: {hand_landmarks.landmark[mp_hands.HandLandmark(i).value].z * image_width}n')

输出:

代码分解:

我们只需要在这里执行一个额外的步骤,即我们将从我们定义的示例图像中获得图像的原始宽度和高度,然后所有步骤将与我们之前所做的相同,唯一不同的将是现在地标点没有专门缩放。

在图像上绘制地标

由于我们已经从上述预处理中获得了手部地标,现在是时候执行我们的最后一步了,即在图像上绘制点,以便我们可以直观地看到我们的手部地标检测模型是如何执行的。

img_copy = sample_img.copy()
 
if results.multi_hand_landmarks:
 
    for hand_no, hand_landmarks in enumerate(results.multi_hand_landmarks):
        
        mp_drawing.draw_landmarks(image = img_copy, landmark_list = hand_landmarks,
                                  connections = mp_hands.HAND_CONNECTIONS)
    fig = plt.figure(figsize = [10, 10])
 
    plt.title("Resultant Image");plt.axis('off');plt.imshow(img_copy[:,:,::-1]);plt.show()

输出:

代码分解:

  1. 首先,我们将创建原始图像的副本,此步骤是出于安全目的,因为我们不想失去图像的原创性。
  2. 然后我们将处理之前所做的验证工作。
  3. 然后我们将遍历手的每个地标。
  4. 最后,借助mp_drawing.draw_landmarks函数,我们将在图像上绘制地标。
  5. 是时候使用 matplotlib 绘制图像了,所以首先,我们将给出图形大小(此处为 width-10 和 height-10),然后在最后绘制,imshow将 BGR 格式转换为 RGB 格式后的图像使用函数,因为对于 RGB 格式更有意义。

结论

在整个管道中,我们首先初始化模型,然后读取图像,查看输入图像,然后进行预处理。我们缩小了地标点,但这些点与用户无关,因此我们将其恢复到原始状态,最后我们将在图像上绘制地标。

尾注

这是本文的 github 链接:https://github.com/Aman-Preet-Singh-Gulati/hands-landmarks-detection-mediapipe

到此这篇关于Python使用Mediapipe对图像进行手部地标检测的文章就介绍到这了,更多相关Python Mediapipe手部地标检测内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!

相关文章

  • Python基础之列表常见操作经典实例详解

    Python基础之列表常见操作经典实例详解

    这篇文章主要介绍了Python基础之列表常见操作,结合实例形式详细分析了Python列表创建方式、内置函数与相关使用技巧,需要的朋友可以参考下
    2020-02-02
  • python中List添加与删除元素的几种方法实例

    python中List添加与删除元素的几种方法实例

    列表基本上是 Python 中最常用的数据结构之一了,并且删除操作也是经常使用的,下面这篇文章主要给大家介绍了关于python中List添加与删除元素的相关资料,需要的朋友可以参考下
    2022-09-09
  • python计算牛顿迭代多项式实例分析

    python计算牛顿迭代多项式实例分析

    这篇文章主要介绍了python计算牛顿迭代多项式的方法,涉及Python数学运算的相关技巧,需要的朋友可以参考下
    2015-05-05
  • Python编程使用有限状态机识别地址有效性

    Python编程使用有限状态机识别地址有效性

    这篇文章主要介绍了Python编程中如何使用有限状态机识别地址有效性,如何识别一个地址是否有效,确切的讲,如何编程识别一个中国地址是否有效
    2021-09-09
  • pygame游戏之旅 添加游戏界面按键图形

    pygame游戏之旅 添加游戏界面按键图形

    这篇文章主要为大家详细介绍了pygame游戏之旅的第10篇,教大家如何添加游戏界面按键图形,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-11-11
  • python爬虫之生活常识解答机器人

    python爬虫之生活常识解答机器人

    这篇文章主要介绍了python爬虫之生活常识解答机器人,文中有非常详细的代码示例,对正在学习python的小伙伴们有非常好的帮助,需要的朋友可以参考下
    2021-04-04
  • 关于python xlwings模块用法详解

    关于python xlwings模块用法详解

    xlwings是一个用于在Excel和Python之间进行交互的库,它允许您使用Python操作Excel文件,包括读取和写入数据,运行宏,设置格式等等,我们可以使用xlwings来处理Excel文件中的数据,执行各种操作,所以本文小编就给大家python xlwings模块用法
    2023-09-09
  • Python利用heapq实现一个优先级队列的方法

    Python利用heapq实现一个优先级队列的方法

    今天小编就为大家分享一篇Python利用heapq实现一个优先级队列的方法,具有很好的参考价值,希望对大家有所帮助。一起跟随小编过来看看吧
    2019-02-02
  • python中温度单位转换的实例方法

    python中温度单位转换的实例方法

    在本篇文章里小编给大家整理关于python中温度单位转换的实例方法,有需要的朋友们可以学习参考下。
    2020-12-12
  • Python编码类型转换方法详解

    Python编码类型转换方法详解

    这篇文章主要介绍了Python编码类型转换方法,结合实例形式详细分析了Python针对各种常见编码的转码与解码等操作技巧,需要的朋友可以参考下
    2016-07-07

最新评论