水面垃圾清理机器人的视觉算法研究

news2024/11/20 8:47:03

       卷积神经网络是一种分层的数据表示模型,通常由数据输入层、卷积层、池化层、 非线性激活函数、全连接层以及输出结果预测层等组成,其中卷积层、池化层和非线 性激活函数是卷积神经网络中的重要组成部分。此外,有些模型会增加其他的层(归一 化层等)以满足系统特定功能需求。卷积网络以各个单层为基础,按照一定的规律,一 层一层堆叠,卷积神经网络就可以逼近各种复杂函数的空间分布。

  1. 卷积层

滤波器(也称为卷 积核),滤波器的数量越多,卷积神经网络的深度越深。卷积 层的设计和参数设置,对于卷积神经网络的性能具有重大影响。

卷积核多大,输出就多大。

2.非线性激活函数

       设计卷积神经网络时,以激活函数作为卷积层下一步的运算,可以兼顾计算的 简单性和网络的灵活性。卷积层计算是所有前一层输入的线性组合,这里的激活函数 则是计算所有输入值与非线性激活函数的乘积,这样的安排能够降低网络的运算复杂 度,兼容非线性组合运算。

       要激活函数中包含充分的梯度信息,以便于能从输入的数据中 捕获更多的信息。

       常用的激活函数是 Sigmoid 函 数、ReLU(Rectified Linear Unit,ReLU)函数以SiLU(Sigmoid Linear Unit, SiLU) 函数等,这些函数有更好的光滑性,被广泛应用于卷积神经网络。

3.池化层

池化层的工作原理是定 义多个池化核进行池化运算,池化核的主要参数也包含池化核大小等。

最大池化突出局部区域中最重要的信息,而平均池化 更关注于局部区域的平均效果。

4.卷积神经网络的训练

卷积神经网络工作流程,可分为训练阶段和预测阶段两个阶段。卷积神经网络的 工作流程可分为训练阶段和预测阶段。以图像分类为例,在预测阶段,网络通过卷积 层、激活函数、池化层等操作对数据进行前向计算,从而获取不同的特征图,如相对 简单的纹理特征和更加丰富、抽象的语义信息,最后整合这些特征信息,并执行推理 以获取结果;在训练阶段,利用反向传播算法、损失函数、优化算法,使网络有效学 习图像相关特征及相应映射关系。网络的训练和预测阶段涉及不同的操作和方法,但 都是卷积神经网络的重要组成部分。

5.反向传播算法

误差反向传播算法(Backpropagation,BP)是训练人工神经网络最主要的方法。

6.损失函数

       常见的损失函数有均方误差损失函数、交叉熵损失函数和基于 IOU(Intersection over Union, IOU)的系列损失函数,网络中为更新损失函数(Loss Function)的相关参数, 需要进行偏导计算,通过计算损失函数得到损失值,该值将衡量预测值与真实值之间 的差距。

7.优化算法

       常见的优化算法有 SGD 算法[48]、Momentum 算法[49]以及 Nesterov 算法等,梯度下 降法是深度学习模型最常用的优化算法。

8.基于卷积神经网络的目标检测

目标检测是一种应用广泛的计算机视觉技术,能够对图片、视频中的目标进行分 类和定位,基于卷积神经网络的目标检测算法主要分为 Two-stage 和 One-stage 两种类 型。 Two-stage 算法会先生成一些候选框,再对每个候选框进行分类和定位优化。虽然 它们的准确率通常较高,但需要更多时间和计算资源。而 One-stage 算法则能在特征解码时,一并生成目标所属的种类和区域信息,在执行速度上更具优势,近年来已不断 优化,在检测精度比肩甚至超过了 Two-stage 算法。常见的 Two-stage 算法有 RCNN 系 列,如 R-CNN、Fast-RCNN、Faster-RCN等;常见的 One-stage算法有 YOLO系 列,如 YOLOv1~v8 和 YOLOX 等

9.基于卷积神经网络的图像分割

       采用卷积神经网络进行特征提取,使用反卷积层进行特征恢复,从而实现对图像深层语 义的理解和精确的像素级别分割。其中,三种常见的语义分割模型包括:FCN、UNet 和 DeepLab。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1655095.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

C#贪吃蛇

C#贪吃蛇 文章目录 Program.csText1Game.csISceneUpdate.csText2BeginScene.csBegionOrEndScene.csEndScene.csGameScene.csText3GameObject.csIDraw.csPosition.csText4Food.csSnakeBody.csWall.csText5Map.csText6Snake.csProgram.cs using 贪吃蛇.Text1;Game game = new Ga…

pinia持久化出现store和storage的数据不一致的问题

问题描述 突然发现menu的store异常,pinia中查看到store数据正确,但是localstorage中的数据始终没有同步,但user的store没问题,具体如下: menu的store: user的store: 问题原因 进入系统…

[嵌入式系统-72]:RT-Thread-组件:单元测试框架utest

目录 utest 测试框架 ​编辑 测试用例定义 测试单元定义 utest 应用框图 2. utest API assert 宏 测试单元函数运行宏 测试用例导出宏 测试用例 LOG 输出接口 3. 配置使能 4. 应用范式 5. 测试用例运行要求 6. 运行测试用例 测试结果分析 7. 测试用例运行流程 …

mysql中varchar与bigint直接比较会导致精度丢失以至于匹配到多行数据

在mysql中,我们都知道如果一个索引字段使用了函数或者计算那么查询的时候索引会失效,可是我相信在联表的时候我们只会关注两个表关联字段是否都创建了索引,却没有关注过这两个字段的类型是否一致,如果不一致的话索引是会失效的&am…

uni-app实战在线教育类app开发

随着移动互联网的快速发展,教育行业也在不断向在线化、数字化方向转型。开发一款功能丰富、用户体验优秀的在线教育类 App 对于满足学习者需求、促进教育行业的发展至关重要。本文将介绍如何利用 Uni-App 进行在线教育类 App 的开发,让您快速上手&#x…

Python 全栈体系【四阶】(三十九)

第五章 深度学习 八、目标检测 3. 目标检测模型 3.2 YOLO 系列 3.2.4 YOLOv4(2020 年 4 月) YOLOv4 将最近几年 CV 界大量的研究成果集中在一套模型中,从检测速度、精度、定位准确率上有了明显改善(相对于 YOLOv3&#xff0c…

前端项目加载离线的百度地图,利用工具进行切指定区域的地图影像,自定义图层getTilesUrl

百度地图在开发中我们经常使用,但是有些项目是需要在内网进行,这时候我们不得不考虑项目中一些功能需要请求外网静态资源,比如百度地图。只有把包下载到本地,才能让静态资源文件的正常的访问。 目录 获取百度地图开发秘钥 引入在…

yolov8任务之目标检测

对象检测 对象检测是一项涉及识别图像或视频流中对象的位置和类别的任务。对象检测器的输出是一组包围图像中对象的边界框,以及每个框的类标签和置信度分数。当您需要识别场景中感兴趣的对象,但不需要确切知道对象在哪里或其确切形状时,对象检…

网络安全之ACL

ACL:访问控制列表——控制列表(策略列表),是一个控制工具。 功能:!、定义感兴趣路由(控制层面)。2、定义感兴趣流量(数据层面)。 例如: 假设在该…

AI换脸原理(7)——人脸分割参考文献TernausNet: 源码解析

1、介绍 这篇论文相对来说比较简单,整体是通过使用预训练的权重来提高U-Net的性能,实现对UNet的改进。该方法也是DeepFaceLab官方使用的人脸分割方法。在介绍篇我们已经讲过了UNet的网络结构和设计,在进一步深入了解TernausNet之前,我们先简单回顾下UNet。 U-Net的主要结构…

Django Admin后台管理:高效开发与实践

title: Django Admin后台管理:高效开发与实践 date: 2024/5/8 14:24:15 updated: 2024/5/8 14:24:15 categories: 后端开发 tags: DjangoAdmin模型管理用户认证数据优化自定义扩展实战案例性能安全 第1章:Django Admin基础 1.1 Django Admin简介 Dj…

【爬虫】爬取A股数据写入数据库(二)

前几天有写过一篇 【爬虫】爬取A股数据写入数据库(一),现在继续完善下,将已有数据通过ORM形式批量写入数据库。 2024/05,本文主要内容如下: 对东方财富官网进行分析,并作数据爬取,使…

ORA-28575: unable to open RPC connection to external procedure agent

环境: Oracle 11.2.0.4x64 RAC AIX6.1版本SDE for aix oracle11g版本10.0 x64 sde配置情况如下: 检查oracle和grid用户下的$ORACLE_HOME/hs/admin/extproc.ora文件均包含有如下: SET EXTPROC_DLLSANY 两个节点sde下的user_libraries都正常…

npm安装指定版本,npm删除依赖,卸载依赖

安装指定版本 npm中安装指定的版本号,格式为 ‘包名版本号’ npm install 包名称版本号 --save 例如安装jquery: npm install jquery3.0.0 --save在package.json里面可以看到对应的包: "jquery": "^3.0.0"注意:已有…

Duplicate File Finder Pro for Mac激活版:重复文件清理软件

在繁杂的文件管理中,你是否曾为重复文件而烦恼?Duplicate File Finder Pro for Mac,正是你不可或缺的得力助手。这款专业级工具,能够迅速扫描并定位Mac系统中的重复文件,让你的存储空间恢复清爽。 通过强大的算法支持&…

天诚人脸物联网锁+网约房管理系统为智慧酒店、民宿管理赋能

随着互联网技术的发展,“网约房”逐渐步入受众视野,在改变旅客入住模式和生活方式的同时,为旅客旅游住宿创造了新的选择,也为拥有冗余房间资源的房东提供了新的营收路径。但是,网约房的管理问题频发,需要数…

Android 右键 new AIDL 无法选择

提示 (AIDL File)Requires setting the buildFeatures.aidl to true in the build file) 解决方式: 在app的build.gradl中 adnroid{} 添加: buildFeatures{aidl true}

SpringCloud Alibaba Sentinel 修改Dashboard用户名和密码

目录 一、下载Sentinel的Jar包 二、在启动时修改用户名和密码的命令 三、测试登录成功 在网上找到了一大堆文章,没一个有用的,最终还是通过不断测试找到了这个方法。 一、下载Sentinel的Jar包 Releases alibaba/Sentinel GitHub 二、在启动时修改…

Electron项目中将CommonJS改成使用ES 模块(ESM)语法preload.js加载报错

问题 将Electron项目原CommonJS语法改成使用ES 模块(ESM)语法,preload.js一直加载不到,报错如下: VM111 renderer_init:2 Unable to load preload script: D:\Vue\wnpm\electron\preload.js VM111 renderer_init:2 E…

Postgresql使用dblink实现跨库查询

一、背景介绍 回调表callback,在test数据库下,数据内容如下 公司表company,在release数据库下,数据内容如下 现在的需求是查询company公司下的callback回调数据 二、实现思路 正常的想法直接两张表关联查询即可,很…