模型案例:| 野生鸟类检测模型!

news2025/1/11 0:43:15

导读

2023年以ChatGPT为代表的大语言模型横空出世,它的出现标志着自然语言处理领域取得了重大突破。它在文本生成、对话系统和语言理解等方面展现出了强大的能力,为人工智能技术的发展开辟了新的可能性。同时,人工智能技术正在进入各种应用领域,在智慧城市、智能制造、智慧医疗、智慧农业等领域发挥着重要作用。

柴火创客2024年将依托母公司Seeed矽递科技在人工智能领域的创新硬件,与全球创客爱好者共建“模型仓”,通过“SenseCraft AI”平台可以让使用者快速部署应用体验人工智能技术!

本期介绍:模型案例:| 野生鸟类检测模型!

FairMot

FairMot追踪模型是一个目标追踪框架,旨在通过单次检测同时完成目标检测与行人识别(Re-ID)任务,以提高追踪的精度和速度。在多个MOT挑战赛数据集上,FairMot均表现出色,证明了其在实际应用中的有效性和优越性。

FairMOT模型采用DLA-34作为骨干网络,通过深层聚合技术融合多层特征,以增强对不同尺度目标的处理能力。采用anchor-free的检测方法,在特征图上直接预测目标中心点和边界框,同时并行地估计每个像素的Re-ID特征,用于区分不同目标。

这种设计使得模型能够更有效地平衡检测与Re-ID任务,从而在保持高追踪精度的同时,实现视频速率的实时推理。

FairMOT架构

选择ResNet-34作为基础网络框架,旨在高效平衡模型的精度与计算速度。为进一步提升特征表达能力,引入了增强版深层聚合(DLA)技术,将其融入ResNet-34中,构建了DLA-34模型。与原始的DLA设计不同,在DLA-34中增加了更多跨层级的跳跃连接,这一策略类似于特征金字塔网络(FPN)的构建思路,有效促进了低级与高级特征之间的深度融合与互补。

此外,为了提升模型对不同尺度与姿态目标的适应性,在所有上采样模块中引入了可变形卷积层,这些卷积层能够根据目标的实际大小和姿态动态调整其感受野,从而更精准地捕捉目标特征,同时也有效缓解了特征对齐问题。

在DLA-34骨干网络的顶部集成了3个并行的预测头,每个头分别专注于估计关键信息:

热图(heatmap):用于定位目标中心;

对象中心偏移(center offset):用于精细化中心位置;

边界框大小(bounding box size):以准确描绘目标轮廓。这种设计不仅简化了检测流程,还提高了检测精度。

每个预测头的实现方式简洁而高效:首先,对DLA-34输出的特征图应用一个3×3的卷积层(包含256个通道),以进一步融合和增强特征;随后,通过一个1×1的卷积层,直接生成所需的预测结果。这种“先融合后预测”的策略,确保了每个预测头都能从丰富的多尺度特征中受益,从而提高了整体检测性能。

野生鸟类检测模型

该 AI 模型采用先进的 Swift yolo 算法,专注于野生鸟类识别,可以在实时视频流中准确检测和标记野生鸟类。它特别适用于 Seeed Studio Grove Vision AI (V2) 设备。

应用场景

生态监测:通过识别和监测鸟类种群,研究者可以评估生态环境健康和生物多样性。

保护工作:识别濒危鸟类,可以帮助制定保护措施,监测恢复计划的效果。

鸟类研究:科学家可以研究鸟类的行为、迁徙模式和栖息地选择,为生态学研究提供数据支持。

教育与公众参与:开发移动应用或在线平台,让公众参与鸟类观察和记录,提升人们对自然环境的关注。

农业管理:在农田中监测鸟类活动,了解鸟类对害虫控制的作用,促进可持续农业实践。

城市规划:城市生态评估中,鸟类的分布和种类可以影响城市设计和绿地规划。

鸟类迁徙跟踪:对迁徙鸟类进行实时监测,以了解气候变化对其迁徙模式的影响。

在Grove - Vision AI V2模块上部署此模型

  1. 打开SenseCraft AI平台,如果第一次使用请先注册一个会员账号,还可以设置语言为中文。

平台地址:https://sensecraft.seeed.cc/ai/#/model

2、在公共AI模型第11列表中找到【野生鸟类检测】模型,单击此模型图片,如下图所示。

3、进入【野生鸟类检测】模型介绍页面,单击“部署模型”按钮,如下图所示。

  1. 进入部署【野生鸟类检测】模型页面,按提示步骤先连接摄像头,再连接设备到电脑USB接口上,最后单击【连接设备】按钮,如下图所示。

5、弹出部署模型窗口,单击“确定”按钮,如下图所示。

6、弹出连接到串行端口窗口,选择端口号后单击“连接”按钮,如下图所示。

7、开始进行模型部署、固件下载、设备重启等过程,完后在预览中即可看到当前摄像头视频内容,在“设置”中调整置信率数值可以提供识别率,将摄像头对准野生鸟类相关的图片查看预测效果,如下图所示。

模型推理演示,请看如下视频。

AI模型野生鸟类检测

野生鸟类检测报警装置

硬件清单

保定学院韩君鑫同学利用Grove AI视觉模块V2 和XIAO ESP32S3开发板设计了一个鸟类检测远程报警系统,通过视觉识别技术、嵌入式硬件和云平台,实现对鸟类的准确识别和远程手机报警功能。

韩君鑫-智能化鸟类检测远程报警提醒系统

嵌入式神经网络处理器(NPU)

嵌入式神经网络处理器(NPU)是一种特别设计用于执行神经网络计算的高效率处理器。它主要基于数据驱动并行计算架构,特别擅长处理视频、图像等大量的多媒体数据。NPU模仿了生物神经网络的架构,与CPU、GPU相比,它能够通过更少的指令(一条或几条)完成神经元的处理,因此在深度学习的处理效率方面具有明显优势。

Grove Al视觉模块 V2套装介绍

Grove Al视觉模块 V2

OV5647-62摄像头

Grove - Vision Al Module V2是一款拇指大小的人工智能视觉模块, 配备Himax WiseEye2 HX6538处理器和Arm Ethos-U55嵌入式神经网络加速单元(NPU), 该处理器采用 ArmCortex-M55双核架构。

它具有标准的CSI接口, 并与树莓派相机兼容。它有一个内置的数字麦克风和SD卡插槽。它非常适用于各种嵌入式视觉项目。

有了SenseCraft Al算法平台, 经过训练的ML模型可以部署到传感器, 而不需要编码。它兼容XIAO系列和Arduino生态系统, 是各种物体检测应用的理想选择。

主要硬件配置

- 板卡基于WiseEye2 HX6538处理器, 采用双核ARM Cortex-M55架构

- 配备集成Arm Ethos-U55嵌入式神经网络加速单元(NPU), 兼容的树莓派相机

- 板载PDM麦克风, SD卡插槽, Type-C, Grove接口, 丰富的外设支持样机开发

- Seeed Studio XIAO的可扩展性, SenseCraft Al的现成AI模型用于无代码部署。

- 支持各种有效的模型, 包括MobilenetV1、MobilenetV2、 Eficientnet-Lite、Yolov5和Yolov8.

写在最后

SenseCraft-AI平台的模型仓数量还很少,但是好消息是它支持自定义模型上传并输出推理结果,平台会逐渐增加模型仓的数量,敬请关注!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2205116.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

24.4 基于consul服务发现模式

本节重点介绍 : consul 安装consul go代码注册服务,注销服务,获取服务node_exporter改造为consul服务发现在数量比较大时,在注册服务的时候,关闭check,可以降低consul的压力 consul 安装 准备工作 # 下载consul wge…

实践体验密集小目标检测,以小麦麦穗颗粒为基准,基于YOLOv9全系列【yolov9/t/s/m/c/e】参数模型开发构建智能精准麦穗颗粒检测计数系统

对于常规的目标检测任务来说,诸如:COCO、VOC这类基础的数据场景,涌现出来了一些列性能初衷的检测模型,YOLO系列就是其中的佼佼者,不断地刷榜取得了越来越好的效果,不过这些评测指标是基于COCO、VOC这类公开…

信息系统项目管理师(十大管理域、五大过程组)

前言:信息系统项目管理师重点掌握每个过程中的ITO,即输入(Inputs)、工具(Tools)、输出(Outputs)。还有每个过程属于哪个过程组。 十大管理:整体管理、范围管理、进度管理、成本管理、质量管理、人力资源管理、沟通管理、干系人管理、风险管理…

猫头虎分享:Python库 Django 的简介、安装、用法详解入门教程

猫头虎分享:Python库 Django 的简介、安装、用法详解入门教程 🚀🐍 今天猫头虎收到了一位粉丝的问题:“猫哥,如何在项目中使用Django搭建一个Web应用呢?”。这可是很多刚接触Python开发的朋友常遇到的困惑…

C++和OpenGL实现3D游戏编程【连载14】——VBO、VAO和EBO应用

🔥C和OpenGL实现3D游戏编程【目录】 1、本节实现的内容 我们从一开始学OpenGL到现在,OpenGL的图形绘图必须在glBegin()和glEnd()函数之间完成,在此基础之上,才能进行后续操作功能。但是我们今天要讨论一下OpenGL图形绘制的模式&a…

前端父子传递属性值

1. Vue3.4.X之前  2. Vue3.4.X之后版本 defineModel 父页面  子页面   

Python | Leetcode Python题解之第463题岛屿的周长

题目: 题解: class Solution:def islandPerimeter(self, grid: List[List[int]]) -> int:rowlen(grid)collen(grid[0])nums0c0gridgrid[[0]*col]for i in range(row):grid[i].append(0)for j in range(col):if grid[i][j]1:nums1if grid[i][j]1 and …

跨境独立站还能做多久?谈谈独立站的长期价值

这几年,品牌出海与跨境独立站成了商业圈子的热门话题。伴随而来的则是日益激烈的市场竞争,不少新入局的卖家纷纷抱怨:“现在做独立站已经赚不到钱了!”都发出了灵魂拷问,**跨境独立站还能做几年?**跨境电商…

【hot100-java】合并 K 个升序链表

链表篇 /*** Definition for singly-linked list.* public class ListNode {* int val;* ListNode next;* ListNode() {}* ListNode(int val) { this.val val; }* ListNode(int val, ListNode next) { this.val val; this.next next; }* }*/ class Solu…

基于Python的在线音乐平台

作者:计算机学姐 开发技术:SpringBoot、SSM、Vue、MySQL、JSP、ElementUI、Python、小程序等,“文末源码”。 专栏推荐:前后端分离项目源码、SpringBoot项目源码、Vue项目源码、SSM项目源码、微信小程序源码 精品专栏:…

qemu启动busybox虚拟机网络连接配置

一、busybox文件系统网络问题 由于根文件是用busybox构建,所以很多配置文件是没有的,包括部分网络的默认设置。启动虚拟机后只能使用ip命令和ifconfig命令查看网络状态。 二、开启qemu网络支持 想要使虚拟机上网,最简单的方式可以使用 -netde…

javaweb 文件存储

文件上传,是指将本地图片、视频、音频等文件上传到服务器,供其他用户浏览或下载的过程。 文件上传在项目中应用非常广泛,我们经常发微博、发微信朋友圈都用到了文件上传功能。 上传文件的原始form表单,要求表单必须具备以下三点…

双十一买些提高幸福感的生活单品!五款精选好物推荐~

双十一购物狂欢即将来临,这是一年一度的购物盛宴,家电和数码产品通常会在这个时期提供诱人的折扣。但品牌众多,每款产品又各有千秋,让人难以抉择。今天,我将分享一些在双十一期间值得考虑的高品质好物,让我…

【视频笔记】408新增知识点信号——里昂视频

文章目录 **2.信号****3.信号的实现**4.信号的处理**①忽略信号****②执行信号的默认操作****③捕获井处理信号**几个Linux支持的典型信号: **5.信号的产生**① **通过终端按键(键盘)产生信号**例如,CtrlC发送2号信号SIGINT、Ctrl\发送3号信号SIGQUIT② …

Matlab实现海洋捕食者优化算法优化回声状态网络模型 (MPA-ESN)(附源码)

目录 1.内容介绍 2部分代码 3.实验结果 4.内容获取 1内容介绍 海洋捕食者优化算法(Marine Predators Algorithm, MPA)是一种基于海洋生物捕食行为的新型群体智能优化算法。MPA通过模拟海洋捕食者如鲨鱼、海豚等在寻找猎物时的追踪、包围和攻击行为&…

双十一购买清单,应该如何选购宠物空气净化器,有哪几款推荐

作为一个宠物博主,每天都有人来问我家里养了猫应该怎么样才能清理浮毛,到底有哪些值得推荐。 这我可是有话说,当初就是心血来潮养了两只长毛猫,直到现在都还一直在清理猫咪掉毛的问题。猫咪掉的毛,不仅是会掉在沙发上…

EmEditor传奇脚本编辑器

主程序:EmEditor.exe 目前已有功能 可以自己指定一个快捷键 实现以下功能(默认快捷键为:F1) 以下全功能 都是鼠标所在行 按快捷键 (默认快捷键:F1) 1.在Merchant.txt中 一键打开NPC 没有…

11.Lab Ten —— mmap

内存映射文件(Memory-Mapped File)是一种将文件内容映射到进程的虚拟地址空间的技术,使得文件的内容可以像内存一样被访问。 通过内存映射文件,可以高效地访问和操作文件内容 首先切换到mmap分支 git checkout mmap make clean…

【机器学习】随机森林算法(看我以弱博强)

目录 算法引入: 算法介绍: 1. 集成学习: 2. 训练过程: 3. 分类和回归: 算法优点: 算法缺点: 算法实现: 1. 数据准备 2. 划分数据集 3. 创建随机森林模型 4. 训练模型 5…

Kubesphere4.1版本创建应用Mysql并实现外网访问

目前Kubesphere4.1版本可查创建应用资料较少,特此记录作为参考。 目标 使用Kubesphere4.1完成Mysql服务部署并实现外网访问。 具体流程如下: 1.创建企业空间 2.创建项目 3.创建应用仓库 4.创建应用(mysql) 5.配置外网访…