python基于mediapipe开发构建人体姿态检测系统

news2025/1/6 17:48:37

之前做的人体姿态检测大都是基于openpose或者是yolo-pose之类的技术框架,这里主要是想基于一个开源的实现来完成人体姿态检测。首先看下效果图:

 Mediapipe是google的一个开源项目,支持跨平台的常用ML方案。项目在这里,如下所示:

 github仓库在这里,如下所示:

MediaPipe工具包包括框架和Solutions。框架是用c++、Java和Obj-C编写的,包含:Calculator API (C++)、Graph construction API (Protobuf)和Graph Execution API (C++, Java, Obj-C)。Solutions是基于特定的预训练TensorFlow或TFLite模型的开源预构建示例。MediaPipe Solutions构建在框架之上。目前,它提供了16个Solutions,包括:人脸检测、Face Mesh、虹膜、手、姿态、人体、人物分割、头发分割、目标检测、Box Tracking、Instant Motion Tracking、3D目标检测、特征匹配、AutoFlip、MediaSequence、YouTube-8M。如下所示:

 这里主要是想基于mediapipe来实现人体姿态检测。

核心代码实现很简单,如下所示:

mp_pose = mp.solutions.pose
mp_drawing = mp.solutions.drawing_utils
pose = mp_pose.Pose(static_image_mode=True,
                    smooth_landmarks=True,
                    min_detection_confidence=0.5,
                    min_tracking_confidence=0.5
                    )
# 姿态估计
results = pose.process(img)
print("results: ", results.pose_landmarks)
# 可视化
mp_drawing.draw_landmarks(img, results.pose_landmarks, mp_pose.POSE_CONNECTIONS)
look_img(img)

结果如下所示:

 我们再多测试几张图片,如下所示:

 效果还是可以的,毕竟是开箱即用的工具了。

这里打印出来了计算得到的landmarks,如下所示:

landmark {
  x: 0.8632122278213501
  y: 0.39934223890304565
  z: -0.0021378363016992807
  visibility: 1.0
}
landmark {
  x: 0.8844274282455444
  y: 0.387251079082489
  z: 0.005716356914490461
  visibility: 1.0
}
landmark {
  x: 0.8930062055587769
  y: 0.3897208869457245
  z: -0.002450103173032403
  visibility: 1.0
}
landmark {
  x: 0.9013738632202148
  y: 0.39209526777267456
  z: 0.0007952205487526953
  visibility: 1.0
}
landmark {
  x: 0.8574270009994507
  y: 0.378071129322052
  z: 0.0035106923896819353
  visibility: 1.0
}
landmark {
  x: 0.8468424081802368
  y: 0.37453708052635193
  z: 0.003549371613189578
  visibility: 1.0
}
landmark {
  x: 0.8365076184272766
  y: 0.3711674213409424
  z: -0.0029587973840534687
  visibility: 1.0
}
landmark {
  x: 0.8933941125869751
  y: 0.3996911644935608
  z: -0.0009722764370962977
  visibility: 0.9999998807907104
}
landmark {
  x: 0.8056524991989136
  y: 0.37151792645454407
  z: 0.0004327383066993207
  visibility: 0.9999991655349731
}
landmark {
  x: 0.8579585552215576
  y: 0.4187290668487549
  z: 6.539761670865119e-05
  visibility: 0.9999994039535522
}
landmark {
  x: 0.8241762518882751
  y: 0.40628987550735474
  z: 0.004473073408007622
  visibility: 0.9999991655349731
}
landmark {
  x: 0.8441612720489502
  y: 0.5035648345947266
  z: -0.25567159056663513
  visibility: 0.9999856948852539
}
landmark {
  x: 0.6964893341064453
  y: 0.39029890298843384
  z: -0.24796368181705475
  visibility: 0.9999732971191406
}
landmark {
  x: 0.8154499530792236
  y: 0.6286311745643616
  z: -0.5366763472557068
  visibility: 0.9982965588569641
}
landmark {
  x: 0.567449688911438
  y: 0.37861955165863037
  z: -0.5087283253669739
  visibility: 0.9612370133399963
}
landmark {
  x: 0.8140097856521606
  y: 0.5123477578163147
  z: -0.5489024519920349
  visibility: 0.9991863369941711
}
landmark {
  x: 0.6818426847457886
  y: 0.3975215554237366
  z: -0.6002770066261292
  visibility: 0.9928218722343445
}
landmark {
  x: 0.8133549690246582
  y: 0.4815672039985657
  z: -0.5735042691230774
  visibility: 0.9980783462524414
}
landmark {
  x: 0.7153089642524719
  y: 0.4053640067577362
  z: -0.6815528273582458
  visibility: 0.9833958148956299
}
landmark {
  x: 0.822299599647522
  y: 0.4749387800693512
  z: -0.5469208359718323
  visibility: 0.9978579878807068
}
landmark {
  x: 0.7317229509353638
  y: 0.4011012315750122
  z: -0.6464983820915222
  visibility: 0.9760293364524841
}
landmark {
  x: 0.8098946809768677
  y: 0.48704978823661804
  z: -0.5442765355110168
  visibility: 0.9976638555526733
}
landmark {
  x: 0.7142665982246399
  y: 0.4025900065898895
  z: -0.6355682611465454
  visibility: 0.9730454087257385
}
landmark {
  x: 0.546131432056427
  y: 0.5851266384124756
  z: -0.09281446784734726
  visibility: 0.9991334080696106
}
landmark {
  x: 0.508682131767273
  y: 0.48553502559661865
  z: 0.04270992800593376
  visibility: 0.9998688697814941
}
landmark {
  x: 0.5611737966537476
  y: 0.7204070091247559
  z: -0.24625882506370544
  visibility: 0.9888652563095093
}
landmark {
  x: 0.42196184396743774
  y: 0.3439556956291199
  z: -0.3940356969833374
  visibility: 0.9972810745239258
}
landmark {
  x: 0.5202962756156921
  y: 0.8794336915016174
  z: -0.15859434008598328
  visibility: 0.9323670268058777
}
landmark {
  x: 0.31913697719573975
  y: 0.17321842908859253
  z: -0.18911319971084595
  visibility: 0.9997671246528625
}
landmark {
  x: 0.49125418066978455
  y: 0.9076821208000183
  z: -0.21756611764431
  visibility: 0.90669184923172
}
landmark {
  x: 0.26992592215538025
  y: 0.1453598439693451
  z: -0.29918187856674194
  visibility: 0.99979168176651
}
landmark {
  x: 0.570073127746582
  y: 0.9116483330726624
  z: -0.3478630483150482
  visibility: 0.9282693862915039
}
landmark {
  x: 0.381407231092453
  y: 0.09821030497550964
  z: -0.4874095618724823
  visibility: 0.9996092915534973
}

为了方便界面展示,这里对其进行解析处理,结果输出如下所示:

x: 0.8632, y: 0.3993, z: -0.0021, visibility: 1.0
x: 0.8844, y: 0.3873, z: 0.0057, visibility: 1.0
x: 0.893, y: 0.3897, z: -0.0025, visibility: 1.0
x: 0.9014, y: 0.3921, z: 0.0008, visibility: 1.0
x: 0.8574, y: 0.3781, z: 0.0035, visibility: 1.0
x: 0.8468, y: 0.3745, z: 0.0035, visibility: 1.0
x: 0.8365, y: 0.3712, z: -0.003, visibility: 1.0
x: 0.8934, y: 0.3997, z: -0.001, visibility: 1.0
x: 0.8057, y: 0.3715, z: 0.0004, visibility: 1.0
x: 0.858, y: 0.4187, z: 0.0001, visibility: 1.0
x: 0.8242, y: 0.4063, z: 0.0045, visibility: 1.0
x: 0.8442, y: 0.5036, z: -0.2557, visibility: 1.0
x: 0.6965, y: 0.3903, z: -0.248, visibility: 1.0
x: 0.8154, y: 0.6286, z: -0.5367, visibility: 0.9983
x: 0.5674, y: 0.3786, z: -0.5087, visibility: 0.9612
x: 0.814, y: 0.5123, z: -0.5489, visibility: 0.9992
x: 0.6818, y: 0.3975, z: -0.6003, visibility: 0.9928
x: 0.8134, y: 0.4816, z: -0.5735, visibility: 0.9981
x: 0.7153, y: 0.4054, z: -0.6816, visibility: 0.9834
x: 0.8223, y: 0.4749, z: -0.5469, visibility: 0.9979
x: 0.7317, y: 0.4011, z: -0.6465, visibility: 0.976
x: 0.8099, y: 0.487, z: -0.5443, visibility: 0.9977
x: 0.7143, y: 0.4026, z: -0.6356, visibility: 0.973
x: 0.5461, y: 0.5851, z: -0.0928, visibility: 0.9991
x: 0.5087, y: 0.4855, z: 0.0427, visibility: 0.9999
x: 0.5612, y: 0.7204, z: -0.2463, visibility: 0.9889
x: 0.422, y: 0.344, z: -0.394, visibility: 0.9973
x: 0.5203, y: 0.8794, z: -0.1586, visibility: 0.9324
x: 0.3191, y: 0.1732, z: -0.1891, visibility: 0.9998
x: 0.4913, y: 0.9077, z: -0.2176, visibility: 0.9067
x: 0.2699, y: 0.1454, z: -0.2992, visibility: 0.9998
x: 0.5701, y: 0.9116, z: -0.3479, visibility: 0.9283
x: 0.3814, y: 0.0982, z: -0.4874, visibility: 0.9996

之后开发专用的可视化界面实现可视化推理如下所示:

 界面大小的限制,这里仅展示了Top 10的关键点信息数据,感兴趣的话都可以自行尝试。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/445062.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

软件挖掘|软件缺陷|蜕变关系

目录 软件无处不在 软件发展不是一个简单的任务 识别软件缺陷 软件缺陷定位 使用bug报告识别有缺陷的源代码 使用标准IR方法建模相关性 VSM rVSM 根据bug报告和源代码学习共享主题,并根据主题衡量相关度 学习结合大量手工制作的特性 如何建模&#xf…

页表结构详细说明

一、页表 1. 内存地址的分解 我们知道linux采用了分页机制,通常采用四级页表,页全局目录(PGD),页上级目录(PUD),页中间目录(PMD),页表(PTE)。如下: 其含义定义在arch/arm64/include/asm/pgtable-hwdef.…

应急响应 - Windows启动项分析,Windows计划任务分析,Windows服务分析

「作者简介」:CSDN top100、阿里云博客专家、华为云享专家、网络安全领域优质创作者 「推荐专栏」:对网络安全感兴趣的小伙伴可以关注专栏《网络安全入门到精通》 Windows应急响应 一、启动项分析1、msconfig2、gpedit.msc3、注册表4、msinfo325、启动菜…

【数据结构实验】哈希表设计

【数据结构实验】哈希表设计 简介 针对本班同学中的人名设计一个哈希表,使得平均查找长度不超过R,完成相应的建表和查表程序。文末贴出了源代码。 需求分析 假设人名为中国人姓名的汉语拼音形式,待填入哈希表的人名共有三十个左右&#x…

汇编指令角度掌握函数调用堆栈详细过程

函数参数从右向左依次压栈push,call 要先把下一行指令 压栈, 根据如下代码思考两个问题: 问题一:main函数调用sum,sum执行完以后,怎么知道回到哪个函数中? 问题二:sum函数执行完&…

使用树状图可视化聚类

一般情况下,我们都是使用散点图进行聚类可视化,但是某些的聚类算法可视化时散点图并不理想,所以在这篇文章中,我们介绍如何使用树状图(Dendrograms)对我们的聚类结果进行可视化。 树状图 树状图是显示对象…

vue 项目中 向数组 添加元素 的方式

学习目标: 提示:了解 vue 向数组 添加元素 的三种方式 学习内容: 提示: vue 向数组 添加元素 的三种方式 方法: push()unshift()splice() 总结: 提示:这里总结相关的知识 1、push() 含义&a…

网络编程之 Socket 套接字(使用数据报套接字和流套接字分别实现一个小程序(附源码))

文章目录 1. 什么是网络编程2. 网络编程中的基本概念1)发送端和接收端2)请求和响应3)客户端和服务端4)常见的客户端服务端模型 3. Socket 套接字1)Socket 的分类2)Java 数据报套接字通信模型3)J…

【Redis7】Redis7 集群(重点:哈希槽分区)

【大家好,我是爱干饭的猿,本文重点介绍Redis7 集群概述、作用、集群算法-分片-槽位slot、集群环境案例步骤、集群常用操作命令和CRC16算法。 后续会继续分享Redis7和其他重要知识点总结,如果喜欢这篇文章,点个赞👍&am…

ChatGPT 的数据保护盲点以及安全团队如何解决这些盲点

自成立以来的短时间内,ChatGPT 和其他生成式 AI 平台理所当然地赢得了终极生产力助推器的声誉。 然而,能够按需快速生成高质量文本的技术,可能同时暴露敏感的公司数据。 最近发生的一起事件,三星软件工程师将专有代码粘贴到 ChatG…

SpringBoot集成MyBatis-yml方式详解

SpringBoot集成MyBatis-yml方式详解 简介:spring boot整合mybatis开发web系统目前来说是市面上主流的框架,每个Java程序和springboot mybatis相处的时间可谓是比和自己女朋友相处的时间都多,但是springboot mybatis并没有得到你的真爱&#x…

涨点技巧: 谷歌强势推出优化器Lion,引入到Yolov8,内存更小、效率更高,秒杀Adam(W)

1.Lion优化器介绍 论文:https://arxiv.org/abs/2302.06675 代码:automl/lion at master google/automl GitHub 1.1 简单、内存高效、运行速度更快 1)与 AdamW 和各种自适应优化器需要同时保存一阶和二阶矩相比,Lion 只需要动量,将额外的内存占用减半; 2)由于 Lion…

企业批量寄件快递教程

了解企业批量寄快递操作流程之前,我们先来解答一下这个问题:什么样的企业需要批量寄快递? 电商行业就不提,本身二者就是相互依存的关系。就商务件来说,具体什么样的企业需要批量寄快递,其实很简单&#xf…

Ansys Zemax | 如何使用坐标返回功能

概述 这篇文章简单介绍了如何使用OpticStudio中的坐标返回(Coordinate Return)功能。坐标返回功能可以非常方便的使系统坐标自动返回到目标表面处。(联系我们获取文章附件) 介绍 在OpticStudio的序列模式中,我们经常会使用坐标间断(Coordinat…

Netty 源码解析(上)

序 Netty的影响力以及使用场景就不用多说了, 去年10月份后,就着手研究Netty源码,之前研究过Spring源码,MyBatis源码,java.util.concurrent源码,tomcat源码,发现一个特点,之前的源码都…

PHPStudy安装imagick扩展

phpstudy软件管理中没有自带安装imagick扩展,只能自己安装了。 下面将用几个步骤来进行phpstudy imagick安装: 1.下载imagick 下载地址 ImageMagick – Download 下载电脑版本相对的64/32位,最新的版本 2.安装imagick 双击刚刚下载的文件…

三维可视化如何助力智慧城市建设?

在智慧城市建设中,如何将城市各类数据可视化是一大难题,目前市面上可视化的方法很多,如传统的三维建模、地物模型、建筑模型等。 这些方法各有利弊,从其实现方式来看: GIS/BIM是将所有的空间信息全部整合到一起; 从技术…

第三章 法的渊源与法的分类

目录 第一节 法的渊源的分类 一、法的渊源释义二、法的渊源种类 第二节 正式法源 一、正式法源的含义二、当代中国的正式法源三、正式法源的一般效力原则 第三节 非正式法源 一、当代中国的非正式法源 第四节 法的分类 一、法的一般分类二、法的特殊分类 第一节 法的渊源的…

SSH连接本地centerOS系统配置

SSH连接本地linux系统 前提:安装好centerOS系统并能启动 目标:连通外网并设置SSH 1.网卡配置文件路径 打开linux本地终端 快捷键一般是ctrlaltf2(f1~f3) 这里是管理员登录,密码是隐藏式的输入(输入看不见) 这样就显示成功登录了! 下面查…

Unity InputSystem (二)

InputActionAssets 是包含输入操作以及其关联的绑定和控制方案的资源,文件以 .inputactions 文件扩展名存储,并且是以纯 json 文件存储的。 创建 InputActionAssets 文件 在 Assets 窗口内选择创建 InputActions 文件 ControlSchemes 控制的解决方案…