敢不敢和AI比猜拳?能赢算我输----基于手势识别的AI猜拳游戏【含python源码+PyqtUI界面+原理详解】-python手势识别 深度学习实战项目

news2024/11/23 14:55:35

功能演示

在这里插入图片描述

摘要:手势识别是一种通过技术手段识别视频图像中人物手势的技术。本文详细介绍了手势识别实现的技术原理,同时基于pythonpyqt开发了一款带UI界面的基于手势识别的猜拳游戏。手势识别采用了mediapipe的深度学习算法进行手掌检测与手部的关键点定位,实时检测速度快、识别精度高。该软件通过摄像头的方式进行手部动作识别,实现与机器人的实时猜拳。本文提供了完整的Python代码和使用教程,给感兴趣的小伙伴参考学习,完整的代码资源文件获取方式见文末。

文章目录

  • 功能演示
  • 前言
  • 一、软件核心功能介绍及效果演示
  • 二、手势识别的基本原理
    • 1.基本原理
    • 2. 代码实现
  • 【获取方式】
  • 结束语

点击跳转至文末《完整相关文件及源码》获取


前言

手势识别技术是一种将人类手部的动作转化为机器可理解形式的技术。它可以通过分析图像或视频中的手部或身体动作,来识别并理解用户的意图或指令。手势识别技术广泛应用于人机交互、虚拟现实、增强现实、智能监控等领域。通过手势识别技术,用户可以使用手势进行操作和交互,从而提供更加自然、直观的用户体验。

手势识别技术目前正处于快速发展阶段,并取得了很多重要的研究进展。以下是手势识别技术目前常见的一些研究:
1.传感器技术:传感器技术在手势识别中起着关键作用。例如,深度相机、红外传感器和摄像头等设备能够捕捉到人体的姿态和动作信息。
2.深度学习:深度学习方法在手势识别中被广泛应用。通过使用深度神经网络模型,可以实现对复杂手势的准确识别和分类。
3.实时性:实时手势识别是当前研究的一个重点。研究人员致力于提高算法的效率和响应速度,以满足实时交互的需求。
4.多模态融合:多模态手势识别结合了多种传感器数据,如图像、声音和运动数据,以提高识别准确度和鲁棒性。
5.应用:手势识别技术在各个领域都有广泛应用。例如,在虚拟现实和增强现实中,手势识别可用于交互和控制;在医疗领域,手势识别可用于康复训练和手术操作辅助等。

博主根据Mediapipe框架中的深度学习算法进行手势识别检测,并基于此开发了一款基于手势识别的猜拳软件,可以和机器人进行猜拳游戏。感兴趣的小伙伴可以自己试试。

软件初始界面如下图:
在这里插入图片描述

摄像头开启后猜拳的界面如下:
在这里插入图片描述

一、软件核心功能介绍及效果演示

手势识别系统主要功能包括以下几个部分:
1. 支持摄像头进行手部动作识别;
2. 可区分左右手,并显示相应手部的坐标位置,以及21个手部关键点;
3. 可与机器人进行猜拳游戏,并显示最终结果;

(1)摄像头猜拳功能演示
点击打开摄像头按钮,即可开启摄像头,再次点击该按钮,会关闭摄像头,操作演示如下:
在这里插入图片描述

二、手势识别的基本原理

1.基本原理

Mediapipe是Google开源的一个多媒体处理框架,旨在为开发者提供高效、可扩展的数据流图(dataflow graph)方式来构建多媒体应用程序。它提供了一系列预训练好的模型和工具,用于处理视频、音频、姿势估计、手势识别等多媒体任务。

Mediapipe进行手势识别的基本原理是通过检测和跟踪手部关键点来识别手势。它使用了深度学习模型和计算机视觉技术来实现这一目标。首先,mediapipe使用大量的手部图像数据进行训练,以构建一个手部姿势估计模型。在进行检测时,mediapipe加载训练好的模型,并将输入的图像传递给模型。模型会检测图像中的手部区域,并定位手部关键点的位置。一旦检测到手部关键点的位置,mediapipe会利用计算机视觉技术对这些关键点进行跟踪。这有助于在连续帧之间保持关键点的一致性,以提高识别准确性。然后,根据手部关键点的位置和动作,mediapipe可以将手势分为不同的类别。这些类别可以包括手势如拳头、平手、手势指令等。

2. 代码实现

Mediapipe库基于C++实现,并提供了Python接口,使得开发者能够方便地使用这些功能。下面是使用mediapipe进行手势识别的基本原理:
安装:首先,需要安装mediapipe库。可以通过pip命令进行安装:

pip install mediapipe

导入库:导入mediapipe库和其他必要的依赖项。

python
import cv2
import mediapipe as mp

加载模型:使用mediapipe加载已经训练好的手部关键点模型。

mp_hands = mp.solutions.hands
hands = mp_hands.Hands()
mp_drawing = mp.solutions.drawing_utils

手势识别:打开摄像头并读取视频帧,将每一帧传递给hands.process()方法进行手势识别。

# coding:utf-8
cap = cv2.VideoCapture(0)  # 打开摄像头
while True:
    ret, frame = cap.read()  # 读取视频帧
    if not ret:
        break
    image = cv2.cvtColor(frame, cv2.COLOR_BGR2RGB)  # 转换颜色空间
    results = hands.process(image)  # 手势识别

    # 处理识别结果
    if results.multi_hand_landmarks:
        for hand_landmarks in results.multi_hand_landmarks:
            mp_drawing.draw_landmarks(
                frame,
                hand_landmarks,
                mp_hands.HAND_CONNECTIONS) # 用于指定地标如何在图中连接。

            for point in hand_landmarks.landmark:
                x = int(point.x * frame.shape[1])
                y = int(point.y * frame.shape[0])
                cv2.circle(frame, (x, y), 5, (0, 255, 0), -1) # 画出关键点

    cv2.imshow('Gesture Recognition', frame)  # 显示结果
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()

在上述代码中,我们首先导入了mediapipe库和其他必要的依赖项。然后,使用mp.solutions.hands.Hands()加载手部关键点模型,并打开摄像头读取视频帧。每一帧都传递给hands.process()方法进行手势识别。返回的结果包含检测到的手部关键点的位置信息,我们可以根据这些信息进行相应的处理。手部关键点位置如下图:
在这里插入图片描述

通过遍历识别结果中的多个手部关键点,我们可以获取每个关键点在图像中的坐标,并在图像上绘制圆形表示关键点的位置。最后,使用cv2.imshow()方法显示结果,并通过cv2.waitKey()检测按键操作。

这就是使用mediapipe进行手势识别的基本原理。通过结合mediapipe库提供的预训练模型和API,开发者可以更轻松地构建手势识别应用程序。
下图是摄像头检测结果:
在这里插入图片描述

根据以上原理,博主基于python+ pyqt5开发了基于手势识别与机器人猜拳的软件。也就是第二部分介绍的软件功能内容。关于该手势识别猜拳系统的涉及到的完整源码、UI界面代码等相关文件,均已打包上传,感兴趣的小伙伴可以通过下载链接自行获取。


【获取方式】

关注下方名片G-Z-H:【阿旭算法与机器学习】,回复【手势识别】即可获取下载方式

本文涉及到的完整全部程序文件:包括python源码、UI文件等(见下图),获取方式见文末:
在这里插入图片描述

注意:该代码采用Pycharm+Python3.8开发,运行界面的主程序为MainProgram.py,,摄像头测试脚本可运行MyCameraTest.py。并提供了环境一键配置脚本文件:installPackages.py。为确保程序顺利运行,请按照程序环境配置说明.txt配置软件运行所需环境。

关注下方名片GZH:【阿旭算法与机器学习】,回复【手势识别】即可获取下载方式


结束语

以上便是博主开发的关于手势识别系统的全部内容,由于博主能力有限,难免有疏漏之处,希望小伙伴能批评指正
关于本篇文章大家有任何建议或意见,欢迎在评论区留言交流!

觉得不错的小伙伴,感谢点赞、关注加收藏哦!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/745976.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

字符设备驱动开发(最初方式)

目录: 1.字符设备驱动简介2.字符设备驱动开发步骤2.1. 驱动模块的加载与卸载2.2. Makefile的编写2.3.字符设备的注册与注销2.3.1.设备号的组成2.3.2.设备号的分配 2.4.具体操作函数的实现2.4.1.进行打开和关闭操作2.4.2.对chrdev进行读写操作 3.具体程序的实现3.1.驱…

第十一章——使用类

运算符重载 运算符重载是一种形式的C多态。之前介绍过的函数重载(定义多个名称相同但特征标不同的函数)让程序员能够用同名的函数来完成相同的基本操作,即使这些操作被用于不同的数据类型。 运算符重载将重载的概念扩展到运算符上&#xff0…

gulimall-性能监控与压力测试

性能监控与压力测试 前言一、性能监控1.1 jvm 内存模型1.2 jvisualvm 作用1.3 监控指标 二、压力测试2.1 概念2.2 性能指标2.3 JMeter 压测工具 前言 本文继续记录B站谷粒商城项目视频 P141-150 的内容,做到知识点的梳理和总结的作用。 一、性能监控 1.1 jvm 内存…

灯具小程序怎么制作

灯具小程序怎么制作,有什么功能 1. 商品展示:灯具小程序商城提供了丰富多样的灯具产品,并通过清晰的商品展示页面展示给用户。用户可以浏览不同种类的灯具,包括吊灯、台灯、壁灯等,了解产品的图片、规格、价格等详细信…

python 文件夹py文件相互引用

文章目录 前言Python文件相互调用情况一:同级文件情况二:非同级文件上层调用下层下层调用上层sys.path.append(.)详细测试同名测试引入结论 跨文件夹调用 总结 前言 我之前学过一些别的语言,例如Java,C#,JS。所以我上手python还是挺快的&…

Threejs模型切片转3DTiles加载

个人主页: 左本Web3D,更多案例预览请点击》 在线案例 个人简介:专注Web3D使用ThreeJS实现3D效果技巧和学习案例 💕 💕积跬步以至千里,致敬每个爱学习的你。获取模型或源码请点赞收藏加留言,有问…

Scala中的集合

水善利万物而不争,处众人之所恶,故几于道💦 目录 一、集合简介 二、集合关系继承图 一、集合简介 Java中的集合: Scala中的集合: Scala的集合有三大类:序列Seq、集Set、映射Map,所有的集合…

Vue3+Vite+Pinia+Naive后台管理系统搭建之七:utils 工具构建

前言 如果对 vue3 的语法不熟悉的,可以移步Vue3.0 基础入门,快速入门。 1. cookie 保存工具 1.1 安装依赖 yarn add js-cookie // or npm install js-cookie 1.2 编写 src/utils/cookie.js // src/utils/cookie.js import Cookies from "js-co…

操作系统_计算机系统

目录 1. 操作系统的基本概念 1.1 操作系统的特征 1.1.1 并发(Concurrence) 1.1.2 共享(Sharing) 1.1.3 虚拟(Virtual) 1.1.4 异步(Asynchronism) 1.2 操作系统的目标和功能 …

FIR滤波器与IIR滤波器的区别与特点

目录 FIR滤波器与IIR滤波器的区别与特点 FIR滤波器定义: 特点: IIR滤波器定义: 特点: 区别: IIR滤波器有以下几个特点: IIR与FIR数字滤波器的比较: 1、从性能上比较 2、从结…

Firewalld防火墙 图形和字符

目录 字符界面 一、防火墙介绍 二、防火墙的基本应用 将防火墙接口划分到区域中 区域添加访问规则 图形界面 字符界面 安装图形化防火墙管理工具 [rootbogon ~]# yum -y install firewall-config 一、防火墙介绍 1、netfilter和防火墙管理工具 1)netfilter …

Unity Obfuscator 过滤指定目录下的所有类

视频 Unity Obfuscator 过滤指定目录下的所有class 源码 替换调 OptionsManager 脚本文件就可以了 using System.Collections.Generic; using UnityEngine; using UnityEditor;

Tomcat查看源码

比如需要从请求域拿数据 点击右上角的Choose Sources 找到对应源码的位置 源码 下载Tomcat源码 http://tomcat.apache.org 下载指定版本Tomcat https://archive.apache.org/dist/tomcat/ 下载下来解压即可

spring boot MySQL操作

极简spring boot MySQL测试 默认: spring boot环境已经搭好,可以跑最基本的hello world 有MySQL环境有部分测试数据表,并且有MySQL语法基础 配置 application.yml 如下配置,根据自己的数据库信息与个人需求配置 server: tomcat: uri-encoding: UTF-8 threads: …

为什么TCP是面向字节流协议

大家好,我是三叔,很高兴这期又和大家见面了,一个奋斗在互联网的打工人。 笔者在TCP 机制一文中有说到 TCP 是面向字节流的,这篇博客给大家介绍一下:为什么 TCP 是面向字节流协议的。 首先说一下 UDP ,是一…

prompt:有需求就有价值,prompt案例

prompt:有需求就有价值 此文章来自于小七姐 首先来看需求: 客户需要生成1000条俏皮灵动,趣味盎然,比喻精妙的和美食有关的短句子,要求文风优美,句子让人充满食欲。 客户使用这些句子的场景比较奇妙&…

eval() trim() dispaly:contents等属性的理解

1.eval(除去前后的双引号) 2.字符串.trim() 除去前后的空格 3.display:contents(提升到父级元素的子集元素)

How to Make Your Writing Stand Out From AI 如何让你的写作从人工智能中脱颖而出

Thanks to amazing tools such as ChatGPT, there is now a flood of well-written, functional, and useful writing to compete with if you’re a human writer. This means your writing needs to differentiate itself from this new breed of content. Here’s how to do…

OSError [Errno 22] Invalid argument(已解决)

最近跑别人的项目遇到一个这样的问题 OSError: [Errno 22] Invalid argument xxxxxxxxxxxxxxxxxx一开始以为是没有用管理员的权限运行,导致创建不了日志文件 后来发现是和windows的命名规则冲突了(以下来源官网地址) 命名约定 以下基本规…

希尔排序法解析

希尔排序法解析 什么是希尔排序法 希尔排序法(Shell Sort),也称为缩小增量排序,是一种改进的插入排序算法。它通过将待排序的元素按照一定的间隔分组,对每个分组进行插入排序,逐渐减小间隔直至为1&#x…