导读
2023年以ChatGPT为代表的大语言模型横空出世,它的出现标志着自然语言处理领域取得了重大突破。它在文本生成、对话系统和语言理解等方面展现出了强大的能力,为人工智能技术的发展开辟了新的可能性。同时,人工智能技术正在进入各种应用领域,在智慧城市、智能制造、智慧医疗、智慧农业等领域发挥着重要作用。
柴火创客2024年将依托母公司Seeed矽递科技在人工智能领域的创新硬件,与全球创客爱好者共建“模型仓”,通过“SenseCraft AI”平台可以让使用者快速部署应用体验人工智能技术!
本期介绍:模型案例:| 垃圾桶识别模型
YOLO-World 模型
YOLO-World 模型引入了一种先进的、实时的基于 Ultralytics YOLOv8 的方法,用于开放词汇检测任务。这种创新能够根据描述性文本检测图像中的任何对象。通过显著降低计算需求,同时保持有竞争力的性能,YOLO-World 成为众多基于视觉的应用的多功能工具。
YOLO-传统的开放式词汇检测模型通常依赖于需要大量计算资源的繁琐的 Transformer 模型。这些模型对预定义对象类别的依赖也限制了它们在动态场景中的实用性。YOLO-World利用开放式词汇检测功能重振了YOLOv8 框架,采用了视觉语言建模和在大量数据集上进行预训练的方法,能够以无与伦比的效率在零拍摄场景中出色地识别大量物体。
主要功能
实时解决方案:利用 CNN 的计算速度,YOLO-World 可提供快速的开放词汇检测解决方案,满足各行业对即时结果的需求。
效率和性能: YOLO-World 可在不牺牲性能的前提下降低计算和资源需求,提供了一种可替代SAM 等模型的强大功能,但计算成本仅为它们的一小部分,从而支持实时应用。
利用离线词汇进行推理: YOLO-World 引入了 "先提示后检测 "的策略,利用离线词汇进一步提高效率。这种方法可以使用预先计算的自定义提示,包括标题或类别,并将其编码和存储为离线词汇嵌入,从而简化检测过程。
由YOLOv8 支持:基于 Ultralytics YOLOv8YOLO-World 利用实时对象检测方面的最新进展,以无与伦比的准确性和速度促进开放词汇检测。
卓越的基准测试: YOLO在标准基准测试的速度和效率方面,World 超越了现有的开放词汇检测器,包括 MDETR 和 GLIP 系列,展示了YOLOv8 在单个NVIDIA V100GPU 上的卓越能力。
应用广泛: YOLO-World 的创新方法为众多视觉任务带来了新的可能性,与现有方法相比,速度提高了几个数量级。
垃圾桶识别模型
该 AI 模型由 Yolo-Word 算法生成,专为 Seeed Studio Grove Vision AI (V2) 设备设计,能够高效识别和检测垃圾桶。
应用场景
智能城市管理:通过在城市各个角落安装智能垃圾桶,配合垃圾识别技术,可以实时监控垃圾桶的状态(如满溢情况),优化垃圾收集路线和时间,提高城市管理效率。
环保教育:在学校或公共场所使用垃圾桶识别系统,帮助人们正确投放垃圾,提高公众的环保意识和垃圾分类知识。
机器人清扫:垃圾收集机器人可配备垃圾桶识别系统,自动识别和收集可回收物品,减少人工干预,提高垃圾清理效率。
社区管理:在社区中引入智能垃圾桶识别系统,鼓励居民进行垃圾分类,促进社区的环保活动。
商场或公共场所:在商场、机场等公共场所使用垃圾桶识别技术,提升顾客的垃圾投放体验,实现更高效的清理和管理。
智能家居:在家庭中构建垃圾分类系统,提醒用户如何投放垃圾,帮助家庭实现垃圾减量与分类。
在Grove - Vision AI V2模块上部署此模型
1、打开SenseCraft AI平台,如果第一次使用请先注册一个会员账号,还可以设置语言为中文。平台地址:https://sensecraft.seeed.cc/ai/#/model
2、在公共AI模型列表中找到【垃圾桶罐检测】模型,单击此模型图片,如下图所示。
3、进入【垃圾桶罐检测】模型介绍页面,单击“部署模型”按钮,如下图所示。
- 进入部署垃圾桶罐检测模型页面,按提示步骤先连接摄像头,再连接设备到电脑USB接口上,最后单击【连接设备】按钮,如下图所示。
5、弹出部署模型窗口,单击“确定”按钮,如下图所示。
6、弹出连接到串行端口窗口,选择端口号后单击“连接”按钮,如下图所示。
7、开始进行模型部署、固件下载、设备重启等过程,完后在预览中即可看到当前摄像头视频内容,将摄像头对准垃圾桶的图片查看预测效果,如下图所示。
模型推理演示
模型案例-垃圾桶识别模型
Grove Al视觉模块 V2套装介绍
Grove Al视觉模块 V2
OV5647-62摄像头
Grove - Vision Al Module V2是一款拇指大小的人工智能视觉模块, 配备Himax WiseEye2 HX6538处理器, 该处理器采用 ArmCortex-M55双核架构。
它具有标准的CSI接口, 并与树莓派相机兼容。它有一个内置的数字麦克风和SD卡插槽。它非常适用于各种嵌入式视觉项目。
有了SenseCraft Al算法平台, 经过训练的ML模型可以部署到传感器, 而不需要编码。它兼容XIAO系列和Arduino生态系统, 是各种物体检测应用的理想选择。
主要硬件配置
- 板卡基于WiseEye2 HX6538处理器, 采用双核ARM Cortex-M55架构
- 配备集成Arm Ethos-U55微神经网络加速单元, 兼容的树莓派相机
- 板载PDM麦克风, SD卡插槽, Type-C, Grove接口, 丰富的外设支持样机开发
- Seeed Studio XIAO的可扩展性, SenseCraft Al的现成AI模型用于无代码部署。
- 支持各种有效的模型, 包括MobilenetV1、MobilenetV2、 Eficientnet-Lite、Yolov5和Yolov8.
写在最后
SenseCraft-AI平台的模型仓数量还很少,但是好消息是它支持自定义模型上传并输出推理结果,平台会逐渐增加模型仓的数量,敬请关注!