有 AI,无障碍,AIoT 设备为视障人群提供便利

news2025/7/13 14:04:00

据世界卫生组织统计,全球共 22 亿人视力受损,包含 2.85 亿视障人群和 3,900 万全盲人群。而且,这一数字将随老龄化加剧不断增加。
虽然视障人群面临着诸多不便,但是针对视障人群的辅助设备却存在成本高、维护困难、操作复杂等问题,很难满足他们的生活需求。
为此,广东技术师范大学和武汉科技大学的研究者基于智慧物联网共同开发了一套视障辅助设备,通过 AI 算法和传感器为视障人群的生活带来便利。

作者 | 雪菜

编辑 | 三羊、铁塔

2019 年,世界卫生组织 (WHO) 发布了第一份「世界视力报告」。报告称,全球至少有 22 亿视力受损者,其中 2.85 亿人为视障人群,3,900 万人彻底失明。受全球人口增长和人口老龄化的影响,视障人群的数量在 2040 年可能会增长 3 倍。

![](https://img-blog.csdnimg.cn/img_convert/df37da58b69793dffed98258850eb7e9.jpeg

图 1:全球视力受损者估计人数

视障者无法通过视觉系统接收外界的信息,在日常生活中面临着诸多不便。他们很难躲避附近的障碍物,也无法从书籍或是屏幕中获取信息。

然而,对视障人群进行长期健康监护成本很高,而现有的视障人群辅助设备价格昂贵、比较笨重且交互性差,也很难满足他们的日常需求。

为解决上述问题,广东技术师范大学和武汉科技大学的研究者基于智慧物联网 (AIoT, Artificial Intelligence of Things) 开发了一套视障辅助设备

这套设备主要包括智能眼镜和智能盲杖,总造价约 480 元。它可以通过多种传感器监测使用者和环境的状态,帮助使用者与环境进行交互并在危险状况下发出警报。这一成果已发表于「Electronics」。

在这里插入图片描述

这一成果已发表于 「Electronics」

论文链接:

https://www.mdpi.com/2079-9292/12/18/3760

设备设计

AIoT 架构:感知与交互

视障辅助设备的 AIoT 架构包括 3 层:

1、感知层,即收集外部数据的传感器及模组;

2、网格层,使用窄带物联网 (NB-IoT) 进行数据连接,并使用 HTTP 和 MQTT 协议进行数据传输;

3、应用层,主要通过 APP 和蓝牙音频设备与用户进行交互。

在这里插入图片描述

图 2:AIoT 的架构示意图

智能眼镜YOLO v5 + OCR

视障辅助设备应兼具便利和可靠性,以满足视障人群的日常需要。为此,研究人员通过双目相机收集图像,随后通过轻量级网格模型 YOLO v5 对物体及其距离进行分析,或是通过光学字符识别 (OCR) 阅读文字。

在这里插入图片描述

图 3:智能眼镜的结构示意图

物体识别过程中,YOLO v5 算法会将图片划分为网格,随后预测每个网格单元的边界框,并在创建边界框的同时识别出图片中的不同物体

YOLO v5 网格主要分为 4 层,包括:

1、input:用于对输入图像进行初始定义;

2、backbone:利用卷积神经网络 (CNN) 提取图像特征;

3、neck:整合图像特征,并连接 backbone 层和 output 层;

4、output:利用边界框输入对图像中物体的预测。

在这里插入图片描述

图 4:本研究中 YOLO v5 算法架构

除图像识别外,YOLO v5 算法还能通过对比双目相机的图像计算用户与障碍物之间的距离。

在这里插入图片描述

图 5:YOLO v5 计算障碍物距离的方法

在这里插入图片描述

图 6:YOLO v5 计算障碍物距离的公式

公式中,B 为相机左右镜头间距,f 为相机焦距,d 为对应左右点的视差。

智能眼镜的 OCR 功能通过调用百度 OCR 的 API 实现。OCR 过程包括图像获取、降噪、二值化 (Binarizatoin)、文字区域提取、字符分割、字符识别、优化及音频输出。

在这里插入图片描述

图 7:OCR过程示意图

智能盲杖健康监测与环境感知

智能盲杖的主要功能之一是健康监测,因此在盲杖上集成了心率、体温等传感器和数据收集模组。为实现非接触测量,心率传感器使用光体积变化描记图法 (PPG, Photoplethysmography) 进行监测,体温传感器使用红外辐射进行监测。

在这里插入图片描述

图 8:智能盲杖的结构示意图

此外,为增强视障者对环境的感知,盲杖上还集成了温度、湿度和姿势传感器。姿势传感器由加速度计和陀螺仪组成,通过计算使用者的组合加速度 (ACLR),监测其是否有跌倒的风险。

如果使用者距离障碍物过近,或是姿势传感器察觉到使用者可能会跌倒,盲杖将通过震动和蜂鸣器发出警报。

在这里插入图片描述

图 9:用于跌倒监测的 3 维坐标系

实验结果

图像识别物体与距离

研究人员在常见室内外环境中对设备的物体识别能力进行了 20 次测试。结果显示,室内外环境下 YOLO v5 算法均能比较准确地识别出环境中的物体,并对物体与使用者之间的距离作出判断。

在这里插入图片描述

图 10:室内环境下的测试结果

在这里插入图片描述

图 11:室外环境下的测试结果

然而,随着图像中物体数量增加,错误率会随之提高,尤其是对于具有相似特征的物体,比如电视与显示器,或是自行车与摩托车等。最终,智能眼镜的识别准确率为 92.16%。

即使 YOLO v5 算法认错了物体,它依然能对距离作出判断。与商用的 APP 相比,YOLO v5 算法判断距离的偏离率在 0.28-6.32% 之间,随着距离的增加而增加。

基于这一判断,当使用者与物体之间的距离小于 0.7 m 时,智能盲杖会发出警报,同时接管微控制器以避开障碍物。

OCR正确率接近 100%

同时,研究人员用 10 段文本测试了智能眼镜的 OCR 性能。测试状态下,智能眼镜的 OCR 正确率为 100%。虽然阅读过程中头部移动会导致些许识别错误,但整体 OCR 正确率仍有 99.91%。

在这里插入图片描述

图 12:智能眼镜的 OCR 结果

健康监测:心率与体温

心率监测模组通过 PPG 对用户的心率进行实时记录。测试中,智能盲杖分别记录了不同年龄的被试在静止和行走状态下的心率,结果与商用手环的偏离率在 0.72-3.52% 之间

在这里插入图片描述

表 1:不同实验组的心率监测结果

体温测试中,与医用的前额温度计相比,测试模组的最大偏离率为 0.19% 。这一结果说明即使在智能盲杖上,红外体温传感器也能够准确监测使用者体温,不会受到环境的干扰。
在这里插入图片描述

表 2:不同实验组的体温监测结果

姿势监测行走、上楼与下楼

智能盲杖可以通过加速度计和陀螺仪对使用者的姿势进行监测,并在可能跌倒时发出警报。实验测试了使用者在行走、上楼与下楼时盲杖的监测结果, 并将结果分为 3 类:

1、正确:盲杖监测的结果和使用者状态一致;

2、不正确:盲杖监测到了跌倒风险,但使用者仍为正常状态;

3、无响应:盲杖显示正常状态,但使用者有跌倒风险。

在这里插入图片描述

表 3:不同实验条件下的跌倒监测准确率

在不同场景下,智能盲杖的平均监测正确率为 87.33% ,说明这一设备可以在多数情况下对使用者的状态作出正确判断。

万物互联APP + 蓝牙

最终,所有数据会传输到手机上,并通过 APP 整合。同时,蓝牙音频会将这些数据播报给使用者,帮助他们了解自己的健康状态和外部环境。

在这里插入图片描述

图 13:集成的 APP 界面

关注普遍的眼健康

虽然无障碍设施正在多个场景不断普及,但这些设备更多针对行动不便的人群。对于身处黑暗的视障人群而言,他们需要更多的无障碍设施。

但由于 群体小、设施成本高,这些设施很难普及。盲道、盲文等便利视障人群的设施,则会因缺乏维护和管理,无法发挥效用。

然而,已有相当多的个人和企业参与到了帮助视障人群的行动中。目前绝大多数主流手机品牌已经有了专为视障人群设计的操作方式。

在北京、昆明等城市,开设了专为视障人群讲述电影的「心目影院」,帮助视障人群观赏院线大片。

在「我的世界」、「炉石传说」等游戏社区中,也有热心玩家开发了无障碍的模组 (Mod) 帮助改善视障人群的游戏体验。

在这里插入图片描述

图 14:「心目影院」中的盲人观众

2023 年 6 月 6 日是第 28 个全国爱眼日,主题为「关注普遍的眼健康」。今天是第 23 个世界视力日,希望大家能够关注视力健康,同时向身边的视障人群贡献一臂之力,与 AI 携手构建无障碍世界。

参考链接:

[1]https://www.who.int/zh/news/item/08-10-2019-who-launches-first-world-report-on-vision

[2]https://bjo.bmj.com/content/96/5/614.short

[3]https://www.bilibili.com/video/BV1fs4y1K7Q7

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1086756.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

小流域洪水分析模拟预报设计及代码实现

应用说明: 利用无人机、卫星等技术,获取小流域洪水模拟分析所需的数据,并将其与模型进行结合,提高模拟精度; 探索小流域洪水模拟分析与城市规划、土地利用等方面的关系; 小流域河流洪水模拟计算分析是一项…

Java编程第9讲——CountDownLatch、CyclicBarrier和Semaphore(万字详解)

在JDK的并发包(JUC)里提供了几个非常有用的并发工具类。CountDownLatch、CyclicBarrier和Samaphore工具类提供了一种并发流程控制的手段,这同样也是面试和工作中的一个重要知识点,本文将从它们的定义、常用方法、代码示例及核心源…

STM32Cube高效开发教程<基础篇>(一)----概述

一、 STM32系列器件和开发工具发展历史 1.1 开发工具发展史 2014年HAL/LL库和STM32Cube是ST公司STM32Cube计划的产物,旨在提高开发效率。2019年4月,ST公司退出自己的IDE软件STM32CubeIDE,完善了STM32Cube生态系统。 1.2 STM32系列器件 1.3 器件驱动库 标准外设库( Standar…

Python Django 之连接 Mysql 数据库详解

文章目录 1 概述1.1 Mysql 下载和安装1.2 菜单目录 2 ORM 框架2.1 连接 Mysql 模块:mysqlclient2.2 创建数据库2.3 连接 Mysql2.4 创建表2.5 增删改查 3 扩展3.1 ERROR:2026, SSL connection error: unknown error number 1 概述 1.1 Mysql 下载和安装 …

windows安装nvm

源代码 下载 下一步一下步安装即可 检查是否安装成功 nvm出现上面的代码即可安装成功 常用命令 查看目前安装的node版本 nvm list [available]说明没有安装任何版本,下面进行安装 nvm install 18.14使用该版本 node use 18.14.2打开一个新的cmd输入node -…

Self-Instruct

本篇工作利用LLM的生成能力,来产生大量指令数据集(指令、输入、输出),无需人工标注数据。 其中,在对任务判别的时候,需要区分是输出优先还是输入优先: 输入优先没问题,符合人类直觉…

面试题:说说Java线程的状态及转换

文章目录 为何要了解Java线程状态Java线程状态转换图Java线程有哪些状态?关于wait()放在while循环的疑问BLOCKED 和 WAITING 状态的区别和联系 为何要了解Java线程状态 线程是 JVM 执行任务的最小单元,理解线程的状态转换是理解后续多线程问题的基础。 …

加持智慧医疗,美格智能5G数传+智能模组让就医触手可及

智慧医疗将云计算、物联网、大数据、AI等新兴技术融合赋能医疗健康领域,是提高医疗健康服务的资源利用效率,创造高质量健康医疗的新途径。《健康中国2030规划纲要》把医疗健康提升到了国家战略层面,之后《“十四五”全面医疗保障规划》等一系…

最新AI写作创作系统源码ChatGPT源码,支持AI绘画/支持OpenAI-GPT全模型+国内AI全模型

一、AI创作系统 SparkAi创作系统是基于OpenAI很火的ChatGPT进行开发的Ai智能问答系统AI绘画系统,支持OpenAI GPT全模型国内AI全模型。本期针对源码系统整体测试下来非常完美,可以说SparkAi是目前国内一款的ChatGPT对接OpenAI软件系统。那么如何搭建部署…

池州市的城市环境融合:OLED透明拼接屏展现自然与现代的完美结合

池州是中国安徽省的一个地级市,位于该省的西南部。池州市辖区包括贵池区、东至县、石台县、青阳县等地。 池州市拥有悠久的历史和丰富的文化遗产,同时也以其独特的自然风光而闻名。 首先,让我们来了解一下池州的历史和景点。 池州的历史可…

【TS】笔记-TypeScript环境搭建

TypeScript与JavaScript比较 JavaScript是轻量级的解释性脚本语言,可嵌入到HTML页面中,在浏览器端执行。而TypeScript是JavaScript的超集,即包含JavaScript的所有元素,能运行javaScript的代码,并扩展了JavaScript的语…

竞赛选题 深度学习+opencv+python实现昆虫识别 -图像识别 昆虫识别

文章目录 0 前言1 课题背景2 具体实现3 数据收集和处理3 卷积神经网络2.1卷积层2.2 池化层2.3 激活函数:2.4 全连接层2.5 使用tensorflow中keras模块实现卷积神经网络 4 MobileNetV2网络5 损失函数softmax 交叉熵5.1 softmax函数5.2 交叉熵损失函数 6 优化器SGD7 学…

利达卓越:金融领域的变革者——利达卓越引领行业发展

在过去的几十年里,金融行业面临着经济不确定性、监管压力和竞争加剧等诸多挑战。与此同时,金融领域的迅速发展为行业带来了新的机遇。利达卓越精准地把握了这一机遇,利用先进的科技手段应对挑战。成为金融领域的变革者,引领着金融行业的发展。 利达卓越成立于2015年,至今已有8年…

【Docker】Harbor私有仓库与管理

搭建本地私有仓库 #首先下载 registry 镜像 docker pull registry#在 daemon.json 文件中添加私有镜像仓库地址 vim /etc/docker/daemon.json {"insecure-registries": ["192.168.220.101:5000"], #添加,注意用逗号结尾"registry-mi…

IDEA中创建Web工程流程

第一步:File--》New--》Project 第二步:填写信息,点击Create 第三步:点击File,点击Project Structure 出现该界面 选择相应的版本,这里我用jdk17,点击apply ,点击ok 第三步:右键文件…

【C++】异常处理之throw、catch、try、局部资源管理、标准异常库

一、抛出异常 异常处理机制两个主要成分: 异常的鉴定与发出;异常的处理方式。 C通过throw表达式产生异常: inline void Triangular_iterator:: check_integrity() {if(_index>Triangular::max_elems){throw iterator_overflow(_index,…

打造炫酷效果:用Java优雅地制作Excel迷你图

摘要:本文由葡萄城技术团队原创并首发。转载请注明出处:葡萄城官网,葡萄城为开发者提供专业的开发工具、解决方案和服务,赋能开发者。 前言 迷你图是一种简洁而有效的数据可视化方式,常用于展示趋势和变化。它通常由一…

找单身狗2

一个数组中只有两个数字是出现一次,其他所有数字都出现了两次。编写一个函数找出这两个只出现一次的数字。 例如:有数组的元素是:1,2,3,4,5,1,2,3,4,6,只有5和6只出现1次,要找出5和6。 这里我们不妨回忆一下之前找单身…

VS2022新建项目时没有ASP.NET Web应用程序 (.NET Framework)

问题:如图,VS2022新建项目时没有“ASP.NET Web应用程序 (.NET Framework)”的选项解决方法:点击跳转至修改安装选项界面选择安装该项即可:

金x软件有限公司安全测试岗位面试

目录 一、自我介绍 二、你是网络空间安全专业的,那你介绍下网络空间安全这块主要学习的东西? 三、本科专业是网络工程,在嘉兴海视嘉安智城科技有限公司实习过,你能说下干的工作吗?(没想到问的是本科实习…