人脸识别:我是如何工作的?

news2024/9/21 10:37:09

任何自动人脸识别过程都必须考虑导致其复杂性的几个因素,因为人脸是一个动态实体,在多个因素的影响下不断变化,例如光照、姿势、年龄……这三个参数中的任何一个的变化都会导致同一个人的两幅图像之间的误差值大于不同个体的两幅图像之间的误差值。

通常人脸识别过程包括以下几个步骤:

  • 编程:图像采集和数字化处理,在这个过程中,噪声被添加到系统采集的数据中,这将影响图像的质量。添加到图像中的噪声量取决于设备和环境。

  • 预处理:必须使用图像处理和恢复技术去除噪声,此过程包括补偿已知或恢复良好的图像质量。除此之外,如果获取的图像包含多张人脸或背景不是中性的,则需要人脸检测算法来定位图像中的人脸。 

85f889da7c66fb5f3a7e48b2ca4d1408.png

  • 分析:又名索引、建模或特征提取,对于从图像(面部的 ROI)中提取将保存在内存中并稍后在决策阶段(在线)使用的信息是必要的。选择要使用的特征非常重要,因为它会对系统的性能产生影响,所选择的特征必须是有区别的并且是非冗余的。这些特征的一个例子是面部特征,包括眼睛之间的距离、眼窝的深度、前额到下巴的距离、颧骨的形状以及嘴唇、耳朵和下巴的轮廓…… 

073c70522d33a2165f3e3be76aa77cbb.png

  • 学习:这一阶段将上一步提取的特征存储到数据库中,一般将分析和学习两个步骤合并为一个阶段。

  • 决策:为了估计两幅图像之间的差异,使用相似性度量,例如欧氏距离。

a84aa333b0dbdcdfdabcb9264ed007b4.png

人脸识别技术的类别

基于图像的人脸识别技术分为三类:

本地方法

a.k.a 几何方法,或基于特征的方法。在这种方法中,面部分析是通过对其各部分及其关系的单独描述来进行的。该模型对应于人类使用面部特征点感知面部的方式。

c9fecc8b5746c0f22ab888ea11a0921f.png

面部特征提取阶段是该过程中的关键步骤,因为整个系统的性能取决于提取相关信息的准确性。另一方面,它们的主要缺点是难以处理面部的不同视图,以及“提取”阶段缺乏精确性。

a7b7f0cd8f6dad13ba00791244e0c545.png

全局方法

这些方法使用面部的整个区域作为识别算法的输入。它们是非常成功且经过充分研究的技术。这些方法提供了最好的性能,但存储在“学习”阶段提取的信息的问题仍然是一个主要缺点。

a50bb18f2641e6871e9c29ed9db6f2f0.png

混合方法

这些方法结合了前两种类型,因此有可能提供两全其美的方法。它们基于与人类感知系统相同的原理,人类感知系统使用局部特征和整个面部区域来识别个人。

人脸识别技术的应用

人脸识别技术被用于许多行业,从娱乐到国家安全问题。

健康

安全

零售、营销和广告

银行

结论

从我的角度来看,这是关于人脸识别、可用技术的类别及其应用。

这项技术的未来会怎样?根据一些专家的说法,我们的生物特征(例如面部、指纹、声音……)最终将取代身份证、护照和信用卡密码。考虑到这项技术的简单性和成本效益,并且越来越多地被普通民众使用和接受,这一预测并不牵强。想一想您口袋里或手上拿着的设备,现在几乎每部手机都具有面部或指纹识别功能

7298db576e80a3b9f468a41c6c05d25a.png

当然还有语音识别系统:iPhone 的 Siri、Android 的 Iris、Windows 的 Cortana

4c0890b9c950624c8f7cb44f92567479.png

如果这一预测成真,那么现在采用该技术的任何公司都将在未来拥有竞争优势。

·  END  ·

HAPPY LIFE

8e616da175dd54b64bf33893955b0d4a.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/141826.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

分享136个PHP源码,总有一款适合您

PHP源码 分享136个PHP源码,总有一款适合您 136个PHP源码下载链接:https://pan.baidu.com/s/1A5sR357dh_SlS7pu33lW1Q?pwdkzgn 提取码:kzgn import os# 查找指定文件夹下所有相同名称的文件 def search_file(dirPath, fileName):dirs os…

红中私教-文件上传漏洞DVWA靶场实战(浅析)

前言 🍀作者简介:被吉师散养、喜欢前端、学过后端、练过CTF、玩过DOS、不喜欢java的不知名学生。 🍁个人主页:红中 首先呢,针对于文件上传漏洞 这个漏洞为什么存在?目的是什么?我们为什幺要攻击…

开发环境和测试环境共用Eureka

问题描述 在开发过程中会遇到一种情况,那就是只需要修改一个服务,但是这个服务依赖了其他的3个服务,导致开发人员在本地也要启动其他的3个服务,还要启动一个Eureka注册中心。问题显而易见,在依赖过多的情况下&#xf…

一种多维数据库的数据事务专利解读

什么是事务? 事务是数据库系统中的核心机制。我们要理解下事务概念:什么是事务呢?事务是并发控制的单位,是用户定义的一个操作序列。有四个特性(ACID): 原子性(Atomicity): 事务是数据库的逻辑工作单位&…

使用 VSCode 开发的必备插件,你都安装了吗?

0️⃣前言 VSCode是由微软研发的一款免费、开源的跨平台代码编辑器,目前是前端开发使用最多的一款软件开发工具。 因为每个开发者所接触项目、所有技术不同, 用到的插件不同, 但总有几个插件基本是必备的, 以下就给出一些插件推荐,希望能给大家一些参考。…

腾讯会议发布录屏工具“会记”,让云端视频协作随用随录、随享随看

随着云端协同成为新常态,企业和组织沟通的形式也在不断丰富。1月5日,腾讯会议发布云端录屏工具“会记”, 用户在腾讯会议中就能自由使用人像、屏幕、声音、窗口等多种组合方式进行录制,录制完成后视频将自动上传至云端&#xff0c…

Centos7.9安装WebLogic详细步骤

目录 一、weblogic下载 二、准备环境 三、创建用户和组 四、安装jdk 安装 五、安装WebLogic 1、使用root用户创建目录/opt/weblogic并授权 2.创建 oraInst.loc 文件 3、创建wls.rsp 响应文件 4、安装weblogic 5、静默创建域 六、启动weblogic 一、weblogic下载 直…

程序员面试中一面、二面、三面有什么区别?

很多公司面试都分一面、二面、三面甚至更多,大家可能会好奇,为什么要面这么多面,每一面又有啥区别呢? 首先我来回答下为什么要这么多面,最核心的是最后3点: 如果光是一个人面,担心会看走眼&…

解决IDEA中ctrl+shift+f快捷键搜索没反应的问题

文章目录0写在前面1 问题解决1.1 直接切换英文输入法1.2 win10 输入法1.3 搜狗输入法1.4 其他2 写在末尾0写在前面 今天想使用《在文件中查询》功能,使用ctrlshiftf进行搜索的时候,疯狂的按组合键一直没用。最后用手点的…… 原因是IDEA的快捷键与输入…

【 java 集合】List接口常用方法总结

📋 个人简介 💖 作者简介:大家好,我是阿牛,全栈领域优质创作者。😜📝 个人主页:馆主阿牛🔥🎉 支持我:点赞👍收藏⭐️留言&#x1f4d…

五、条件构造器和常用接口

文章目录五、条件构造器和常用接口1、wapper介绍2、QueryWrapper2.1 例1:组装查询条件2.2 例2:组装排序条件2.3 例3:组装删除条件2.4 例4:条件的优先级2.5 例5:组装select子句2.6 例6:实现子查询3、UpdateW…

基于opencv的数字识别系统

一、目的 想要实现的功能:帮助我们在泵中扫描燃油,并在应用程序中输入燃油信息。 所需技术:①python程序对于拍摄的汽油泵的图像,尝试从中读取数字。——opencv实现。②先使用python对其进行原型设计,然后将代码转换…

TiDB分布式数据库部署与安装详解

TiUP 是 TiDB 4.0 版本引入的集群运维工具,TiUP cluster 是 TiUP 提供的使用 Golang 编写的集群管理组件,通过 TiUP cluster 组件就可以进行日常的运维工作,包括部署、启动、关闭、销毁、弹性扩缩容、升级 TiDB 集群,以及管理 TiD…

EMQX Enterprise 4.4.124.4.13 发布:集群负载重平衡、TDengine 3.0 适配以及子表批量插入

我们很高兴地告诉大家,EMQX Enterprise 4.4.12 以及 4.4.13 版本正式发布! 在本次发布中,我们带来了集群负载重平衡与节点疏散功能为运维人员提供更灵活的集群管理方式,适配了 TDengine 3.0 版本并新增分表批量插入功能&#xff…

ECMAScript 2022 中的新特性!

新钛云服已累计为您分享718篇技术干货本文盘点ECMAScript 2022 中的新特性,包括顶级等待、RegExp 匹配索引、新的公共和私有类字段等。一、公共和私有实例字段最新的 ES13 规范允许我们将成员字段内联定义为类主体的一部分,我们可以使用#来表示私有字段。…

Python打包(问题记录,带解决)

引言 文章用于测试在Python3.8的版本,打包Obspy地震包,最后集成到PyQt5上。 部署或冻结应用程序是 Python 项目的重要组成部分, 这意味着捆绑所有必需的资源,以便应用程序找到它需要的一切 能够在客户端计算机上运行。 但是&…

Ethereum 基础(一)

以太坊(Ethereum)是社区运行的技术,为加密货币以太币(ETH)和数千个去中心化应用程序提供动力。 ethereum.org是您进入以太坊世界的门户。这项技术是新的、不断发展的——有个向导会有帮助。如果你想深入研究,我们建议你这样做。 …

Linux内核定时器

1.概念 在linux内核内部开发者设计了内核定时器,它的工作原理和硬件定时器一样,使用它不需要关注底层的实现,只需要分配定时器对象,初始化对象,启用定时器即可,当定时时间到达之后执行定时器的处理函数。 …

2022年第十二届APMCM亚太地区数学建模竞赛1月加赛E题翻译以及思路

中文2022年亚洲及太平洋地区建模数学竞赛问题E有多少颗核弹可以摧毁地球?1945年8月6日,第二次世界大战已接近尾声。为了尽快结束战争,美国在日本广岛投下了名为 "小男孩" 的第二颗原子弹。这样一颗原子弹炸死了广岛的200000人&…

硬盘容量计算

硬盘容量(Hard drive capacity)以兆字节(MB)或千兆字节(GB)为单位,主流硬盘容量为500G~2TB,影响硬盘容量的因素有单碟容量和碟片数量。许多人发现,计算机中显…