Science Robotics 受螳螂视觉启发的立体人工复眼技术及其边缘计算应用

news2024/9/22 15:49:18

在自然界中,生物体的独特生理结构和功能一直是人类技术创新的灵感源泉。节肢动物,尤其是昆虫类生物,高效的视觉系统吸引了众多研究者的关注。所有昆虫当中,螳螂因其独特的视觉机制(左眼和右眼视野重叠形成的立体视觉),成为仿生学领域的一个热点研究对象。
在这里插入图片描述

近日Science Robotics发表了一篇关于《三维空间时空感知的立体人工复眼》文章,该人工复眼由弗吉尼亚大学工程与应用科学学院副教授Kyusang Lee及众多团队成员联合开发,通过与一些精妙的光电工程和创新的“边缘”计算(在捕获数据的传感器内或附近处理数据)相结合,克服了机器目前收集和处理现实世界视觉数据的方式中令人烦恼的限制。这些限制包括准确性问题、数据处理滞后时间以及对大量计算能力的需求。
▍螳螂的视觉系统能够在静止状态下感知深度信息

节肢动物往往拥有更加复杂的视觉系统,视觉器官主要由大量复眼组成,每个复眼内部含有一个感光细胞,能够检测来自视野特定部分的光信号。这种结构赋予了节肢动物宽广的视野(FoV)、高运动灵敏度和无限景深,使其在光流感应和物体跟踪方面表现出色。然而,与哺乳动物不同,大多数节肢动物依靠单眼视觉感知世界,这在一定程度上限制了它们对静态物体深度信息的获取能力。

在这里插入图片描述

研究人员表示,螳螂的视觉系统尤为独特,其左眼和右眼视野之间存在非常大的重叠,这一特征在其他昆虫中较为罕见。视野重叠使得螳螂能够通过双眼视差实现立体视觉,即使在物体静止不动的情况下,也能感知其深度信息。这种能力不仅增强了螳螂在捕食时的精准度,也为科学家提供了一个全新的仿生学研究对象。

▍立体人工复眼硬件设计与软件算法实现

受螳螂立体视觉的启发,研究人员开始探索如何利用人工手段模仿这一高效视觉系统。Byungjoon Bae等人提出的立体人工复眼系统正是这一思路的具体实践。该系统通过模仿螳螂的双眼结构,实现了在三维空间中的物体识别与跟踪,有效拓展机器视觉的应用性能。
在这里插入图片描述

立体人工复眼系统图解

在硬件设计方面,立体人工复眼系统采用了薄膜砷化镓(InGaAs)光电二极管与氧化铪(HfO2)电阻式随机存取存储器(ReRAM)单元相结合的焦平面阵列(FPA)。这种配置不仅模拟了节肢动物视觉系统中的色素细胞和受体功能,还通过微透镜阵列的集成增强了聚焦能力,模拟了复眼的结构和功能。
在这里插入图片描述

立体人工复眼设备特征

为了获得最大化立体视场面积,一对半球形的16×16 FPA被放置在相距2厘米的平面上,实现了约160°的视场。
在这里插入图片描述

人工复眼的视场

这种设计不仅提高了系统的感知范围,还确保了双眼之间视觉信息的有效重叠,为后续的立体视觉处理提供了丰富的数据源。
在这里插入图片描述

FPA 在传感器内计算中的特性

在软件算法方面,Byungjoon Bae研究团队采用了联合分割学习(SL)和联邦学习(FL)相结合的方法来处理来自左右人造眼睛的信息。这种方法不但能够在本地系统有限的计算资源上实现高精度和低延迟,还能够通过分布式客户端的并行处理提高了整体效率。
在这里插入图片描述

基于FSNN的近传感器计算跟踪

具体实现上,左右眼的编码数据分别由两个共享权重值的独立卷积神经网络(CNN)处理,然后将从每个CNN网络获得的特征合并并输入到全连接层(FCL)中进行回归计算。这一过程生成了一个包含物体在三维空间中位置和速度信息的六维输出向量,为实时物体跟踪提供了全面的数据支持。

▍采用边缘计算能够明显提高实时响应能力和数据处理效率

边缘计算是一种将数据处理和应用程序的运算功能从中心服务器分散到网络边缘节点的技术。与传统的云计算模式相比,边缘计算具有更低的延迟、更高的带宽利用率和更好的隐私保护能力。在立体人工复眼系统中引入边缘计算技术,能够明显提高系统的实时响应能力和数据处理效率。

在立体人工复眼系统中,边缘计算技术的应用主要体现在以下几个方面:

实时数据处理:通过集成在像素级的人工突触和本地处理器上的神经网络,系统能够在传感器内直接处理光学信息,减少了数据传输和存储的需求,从而实现了快速的实时响应。

复眼传感器PCB板电路原理图
在这里插入图片描述

低功耗设计:边缘计算通过减少数据传输量和计算单元之间的通信频率,显著降低了系统的能耗。与传统的互补金属氧化物半导体(CMOS)图像传感器相比,立体人工复眼系统在数据采集和处理方面的功耗降低了约75倍。
在这里插入图片描述

复眼的具体结构

高精度跟踪:通过联合分割学习和联邦学习算法的优化,系统在三维空间中的物体跟踪精度得到了显著提升。实验结果表明,系统的均方根误差低于0.3厘米,且时间处理速率达到了1.8毫秒每帧。

立体人工复眼技术结合边缘计算的优势,在多个领域展现出了商业化落地潜力,如无人机避障与导航方面,该技术通过集成立体人工复眼系统,无人机能够在复杂环境中实现精准避障和自主导航,提高飞行安全性和效率。在工业自动化和智能家居等领域,立体人工复眼技术可以赋予机器人更加智能的视觉感知能力,提升其在复杂环境中的作业效率和交互体验。在医疗领域,该技术可用于内窥镜等医疗设备中,实现高精度、低延迟的图像采集和处理,为医生提供更加清晰、准确的病灶信息。
在这里插入图片描述

平面阵列变形为半球形

同时,Byungjoon Bae也指出,目前,立体人工复眼系统的制造成本相对较高,主要受限于光电二极管、ReRAM单元和微透镜等关键部件的制造成本和工艺复杂度。未来需要通过材料科学、微纳加工等领域的创新来降低制造成本并提高生产效率。在算法方面,尽管现有的联合分割学习和联邦学习算法已经取得了显著成效,但在复杂环境和动态变化中的应用仍需进一步优化。为了实现立体人工复眼技术的广泛应用,需要将其与其他传感器、执行器等硬件设备进行有效集成。同时,还需要针对不同应用场景的需求进行定制化开发和优化,以满足不同领域的特定需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2051027.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

网络编程项目篇

一、tftp客户端下载 1)tftp协议概述 简单文件传输协议,适用于在网络上进行文件传输的一套标准协议,使用UDP传输 特点: 是应用层协议 基于UDP协议实现 数据传输模式 octet:二进制模式(常用&#xff0…

【SpringBoot】SpringBoot中分页插件(PageHelper)的使用

目录 1.分页概念 2.原生写法 3.PageHelper插件分页查询 3.1 介绍 3.2 使用 3.3 Page对象和PageInf对象 1.分页概念 用户查询的数据不可能一次性全部展示给用户(如果用户有一万条数据呢),而是分页展示给用户,这就是分页查询。…

Hospital Information System (HIS)

Hospital Information System (HIS) 医院门诊就诊流程

快速体验Ollama安装部署并支持AMD GPU推理加速

序言 Ollama 是一个专注于本地运行大型语言模型(LLM)的框架,它使得用户能够在自己的计算机上轻松地部署和使用大型语言模型,而无需依赖昂贵的GPU资源。Ollama 提供了一系列的工具和服务,旨在简化大型语言模型的安装、…

深入理解JVM运行时数据区(内存布局 )5大部分 | 异常讨论

前言: JVM运行时数据区(内存布局)是Java程序执行时用于存储各种数据的内存区域。这些区域在JVM启动时被创建,并在JVM关闭时销毁。它们的布局和管理方式对Java程序的性能和稳定性有着重要影响。 目录 一、由以下5大部分组成 1.…

【html+css 绚丽Loading】 - 000004 玄天旋轮

前言:哈喽,大家好,今天给大家分享htmlcss 绚丽Loading!并提供具体代码帮助大家深入理解,彻底掌握!创作不易,如果能帮助到大家或者给大家一些灵感和启发,欢迎收藏关注哦 &#x1f495…

STM32 编码器模式详解

编码器模式 stm32的定时器带的也有编码器模式。 所用的编码器是有ABZ三相,其中ab相是用来计数,z相输出零点信号。 AB相根据旋转的方向不同,输出的波形如下图所示: 从图上可以看出来,cw方向A相会超前B相90度左右&#…

egret 拖尾的实现 MotionStreak

背景:egret项目中需要用到拖尾效果,引擎原生没有提供,参考cocos2dx 的 MotionStreak实现拖尾效果。 原理 拖尾的原理很简单,定时记录节点的位置,根据运行的轨迹和指定的拖尾宽度生成拖尾网格,然后将纹理绘…

VS2019开发跨平台(Linux)程序时,怎么配置第三方库的路径

一、问题描述: 使用跨平台编译时,VS2019总是提示链接openssl库有问题; 二、错误时的配置: 1、前提 openssl在Linux系统默认下是1.0.0版本,而自己准备好的是1.1.1版本,并且路径完全不在一个地方&#xf…

【Linux-进程】系统初识:冯诺依曼体系结构

系列文章:《Linux入门》 目录 冯诺依曼体系结构 1)硬件上 🌷1.什么是冯诺依曼体系结构? 🌷2.冯诺依曼结构的五个主要组成部分 1.运算器 2.控制器 3.存储器 4.输入输出 设备 ⁉️3.为什么还需要内存呢&#xf…

c++数据结构算法复习基础-- 4 -- 线性表-单向循环链表-常用操作接口-复杂度分析

1、单向循环链表一 1)特点 每一个节点除了数据域,还有一个next指针域指向下一个节点(存储了下一个节点的地址) 末尾节点的指针域指向了头节点 析构函数思路图 2)代码实现 //定义结点 //单向循环链表 class CircleLink { public://构造函数…

使用python基于fastapi发布接口(一)

FastAPI官网地址 FastAPI基于Python 3.6+和Starlette框架,天生就带着高性能和异步的基因。 FastAPI的文档生成功能简直是开发者的福音! 你不再需要手动编写API文档,FastAPI能自动帮你搞定。 FastAPI还超级灵活,支持各种数据库和认证方式,无论是SQLite、PostgreSQL还是M…

【xilinx】TPM可信平台模块与 Zynq UltraScale+ PS SPI 接口

本博客(Venu Inaganti)介绍了可信平台模块 (TPM) 与 Zynq UltraScale PS SPI 控制器的连接。 目前唯一具有 TPM 的评估板是 KR260/KV260 SOM,因此为了帮助正在试验 Zynq UltraScale 设备的用户,本文介绍了如何通过 PMOD 连接器与…

【MongoDB】Java连接MongoDB

连接URI 连接 URI提供驱动程序用于连接到 MongoDB 部署的指令集。该指令集指示驱动程序应如何连接到 MongoDB,以及在连接时应如何运行。下图解释了示例连接 URI 的各个部分: 连接的URI 主要分为 以下四个部分 第一部分 连接协议 示例中使用的 连接到具有…

计算机视觉中的上采样与下采样:深入浅出实例代码解析

文章目录 一、引言二、下采样(Downsampling)三、上采样(Upsampling)1. 最近邻插值2.双线性插值3.转置卷积(Deconvolution)4.代码部分 四、总结 在计算机视觉领域,尤其是在深度学习和卷积神经网络…

宝塔面板部署webman项目+nginx反向代理

新建站点 新建一个站点,php版本选择纯净态即可,反正都是用不上的,域名填写你申请得到的域名 拉取代码 新建一个目录,然后将代码部署到本地 启动项目 推荐使用宝塔面板的进程守护管理器启动项目,其实就是用superviso…

ATT格式与Intel格式x86汇编指令的区别

AT&T公司 这个公司的创始人就是发明电话的贝尔,而Unix和C语言都是出自贝尔实验室的产物。 Intel公司 世界上第一片CPU是1971年发明的,型号是Intel生产的4004微处理器。 两种格式的区别 AT&T格式Intel格式目的操作数d、源操作数s op s, d 注…

vue2中使用i18n配置elementUi切换语言

1、下载插件 npm i vue-i18n8.22.2 2、新建文件夹i18n 3、编写index.js文件 import Vue from "vue"; import VueI18n from "vue-i18n"; import locale from element-ui/lib/locale; // 引入 elementui 的多语言 import enLocale from element-ui/lib/l…

【MySQL】C/C++连接MySQL客户端,MySQL函数接口认知,图形化界面进行连接

【MySQL】C/C引入MySQL客户端 安装mysqlclient库mysql接口介绍初始化mysql_init链接数据库mysql_real_connect下发mysql命令mysql_query获取出错信息mysql_error获取执行结果mysql_store_result获取结果行数mysql_num_rows获取结果列数mysql_num_fields判断结果列数mysql_field…

域自适应,你适应了嘛?

“最难的深度学习是谁?” “嗯,是迁徙学习吧?” “要分情况,不过,应该是迁徙学习吧? ” “不是迁徙学习嘛?” 目录 域自适应是啥? 域自适应的方法? 基于差异的方法…