商汤科技感知算法一面复盘

news2024/12/26 2:11:51

来源:投稿 作者:LSC
编辑:学姐

自我介绍

介绍自己的项目

Inception网络的核心模块是什么,有什么用

Inception模块的核心思想就是将不同的尺度的信息特征以并行分支的方式结合在一起,经过不同卷积层处理的结果矩阵在深度这个维度拼接起来,形成一个更深的矩阵。Inception模块可以反复叠堆形成更大的网络,它可以对网络的深度和宽度进行高效的扩充,在提升深度学习网络准确率的同时防止过拟合现象的发生。

上采样和下采样

上采样就是放大图像的操作,也叫图像插值。下采样反之,是缩小图像的操作,也叫降采样。

上采样的方法有(1)插值法(最邻近插值、双线性插值等) (2)转置卷积(又称为反卷积) (3)上池化(unpooling)等。

下采样的方法有(1)卷积和(2)池化

https://blog.csdn.net/jackzhang11/article/details/105046217/

反卷积 插值法

反卷积:反卷积就是卷积,只是中间padding了下,然后再做卷积。也叫做转置卷积,只能还原原来的特征图大小,而不是原来的值。在进行反卷积的时候设置的stride并不是指反卷积在进行卷积时候卷积核的移动步长,而是被卷积矩阵填充的padding。通过反卷积并不能还原之间的矩阵,只能从大小上进行还原,反卷积的本质还是卷积,只是在进行卷积之前,会进行一个自动的padding补充0,从而使得输出的矩阵和指定输出的矩阵的shape相同。

https://www.cnblogs.com/eilearn/p/9125177.html

插值法有很多种,最常见的是双线性插值,是对线性插值在二维直角网格上的扩展,用于对双变量函数(例如x 和y)进行插值。其核心思想是在两个方向分别进行一次线性插值。

https://zhuanlan.zhihu.com/p/361430532

https://blog.csdn.net/qq_34919792/article/details/102697817

全局池化

是对[C,W, H]的张量变成[1,1, H]的张量的操作。

Yolo算法中用到的数据增强

  • MixUp,图像对及其标签的凸叠加,构建了虚拟的样本。https://blog.csdn.net/m0_52073096/article/details/120677075
  • CutMix,通过从一个图像中切割一部分并将其粘贴到增强图像上来组合图像,使用了两张图片。
  • Mosaic,将4张图片以随机缩放、随机裁剪、随机排布的方式进行拼接。最主要的方式。
  • 其他常见的数据增强。

Yolov5相比之前的改进之处

采用GIOU_Loss做Bounding box的损失函数。

输入端采用了Mosaic数据增强、自适应锚框计算、自适应图片缩放等tricks。

Yolov5的Neck结构采用FPN+PAN的结构,还采用借鉴CSPnet设计的CSP2结构,加强网络特征融合的能力。

Backbone采用了CSPDarkNet53网络,还使用了focus操作。

https://zhuanlan.zhihu.com/p/172121380

https://zhuanlan.zhihu.com/p/186014243

目标检测中的Presicion和recall怎么算

https://zhuanlan.zhihu.com/p/478461060

目标检测的AP怎么求

AP(Average Precision) 用11点法、近似面积法求得。

以Presicion为纵坐标、以recall为横坐标。将置信度最高到最低的值排序将其离散化,对应的bbox对应的p和r标在图上,进行计算。

用代码计算IOU

def IOU(A, B):
x1, y1, x2, y2 = A[0], A[1], A[2], A[3]
a1, b1, a2, b2 = B[0], B[1], B[2], B[3]
xmin = max(x1, a1)
xmax = min(x2, a2)
ymin = max(y1, b1)
ymax = min(y2, b2)
if xmin > xmax or ymin > ymax:
return 0
SI = (xmax - xmin + 1) * (ymax - ymin + 1)
SU = (x2 - x1 + 1) * (y2 - y1 + 1) + (a2 - a1+ 1) * (b2 - b1 + 1) - SI
return SI / SU
# 测试
import numpy as np
A = np.array([[2, 4, 5, 6], [1, 2, 3, 4]])
B = np.array([[2, 4, 5, 6]])


iou = []
for i in A:
result = []
for j in B:
print(IOU(i, j))
result.append(IOU(i, j))
iou.append(result)
iou

问了行业的前景、求职规划,实习能学到什么东西

如果没有顶会论文,不要冲计算机视觉,建议换一个赛道。

除非有很优秀的竞赛、实习经历或者大型项目,可以试一下。

点击卡片关注👇

回复“500”即可领取论文复现视频及代码资料

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/126674.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

免费开源的箱包制造行业ERP管理系统介绍

用Odoo免费开源ERP按需打造可持续商业模型 广东百立皮具是一家集生产、采购、定制、销售为一体的箱包及配饰贸易公司,专营各类箱包皮革制品,产品业务规模遍布全世界。百立皮具距今运营已有十余年之久,拥有千余名员工,且在多国都开…

反向传播算法和计算图详细介绍及其原理详解

相关文章 梯度下降算法、随机梯度下降算法、动量随机梯度下降算法、AdaGrad算法、RMSProp算法、Adam算法详细介绍及其原理详解反向传播算法和计算图详细介绍及其原理详解 文章目录相关文章前言一、反向传播算法1.1 什么是反向传播算法?1.2 更泛化的例子二、计算图2…

我把这一年学的 CSS 知识点精炼总结成了一篇文档

文章目录一.CSS简介1.什么是CSS?二.CSS语法1.语法规则2.注释三.CSS选择器1.CSS的id选择器2.CSS的class选择器四.CSS创建1.外部样式表2.内部样式表3.内联样式4.多重样式5.多重样式的优先级五.CSS 背景1.背景颜色2.背景图像3.背景图像 - 水平或垂直平铺4.背景图像- 设…

【云原生 | Kubernetes 实战】18、K8s 安全实战篇之 RBAC 认证授权(上)

目录 一、k8s 安全管理:认证、授权、准入控制概述 1.1 认证 认证基本介绍 授权基本介绍 准入控制基本介绍 为什么需要准入控制器呢? k8s 客户端访问 apiserver 的几种认证方式 kubeconfig 文件 1.2 授权 Role、RoleBinding、ClusterRole 和 C…

springboot学习(七十六) springboot中为多个controller添加统一访问URL的前缀

文章目录前言一、配置文件内添加前缀配置二、配置映射的实体三、自定义注解四、自定义PathMatch添加前缀五、测试前言 在某些情况下,服务的controller中前缀是一致的,例如所有URL的前缀都为/context-path/api/v1,需要为某些URL添加统一的前缀…

IFCOpenShell编译经验

IFCOpenShell编译经验 环境准备: Git:官网 CMake:官网 VisualStudio:官网 安装环境后需设置环境变量: C:\Program Files\Git\cmd D:\Program Files (x86)\cmake-3.25.1-x86_64\bin 下载开发包 编译官网 git clone --recursive https://github.com/IfcO…

【LeetCode每日一题】——1539.第 k 个缺失的正整数

文章目录一【题目类别】二【题目难度】三【题目编号】四【题目描述】五【题目示例】六【解题思路】七【题目提示】八【题目进阶】九【时间频度】十【代码实现】十一【提交结果】一【题目类别】 二分查找 二【题目难度】 简单 三【题目编号】 1539.第 k 个缺失的正整数 四…

关于VSCode的三个配置文件

关于VSCode的三个配置文件 若要使用VSCode来开发C程序,则应该了解以下三种配置文件,分别为: tasks.json:编译器相关的配置文件。比如,设置编译指令。 注:对于复杂的编译任务(涉及多个源文件的编…

《Linux运维总结:Centos7.6部署redis6.2.8哨兵集群》

一、部署redis服务 1.1、环境信息 环境信息如下: 主机IP操作系统Redis版本CPU架构端口角色192.168.1.191Centos7.66.2.8x86_647001master192.168.1.192Centos7.66.2.8x86_647002slave192.168.1.193Centos7.66.2.8x86_647003slave192.168.1.191Centos7.66.2.8x86_6…

【嵌入式·单片机】老生常谈:学习单片机和嵌入式是否需要学习算法?

文章目录前言什么是算法嵌入式是否需要算法如何学习算法参考资料前言 刚学习单片机或嵌入式的同学可能会听说过「算法」这个词,部分电子信息类专业的同学也会在自己的培养计划上看到《数据结构与算法》这门课程,这个时候我们可能会感到疑惑,…

九、Java 16 新特性

九、Java 16 新特性 JDK 16 在 2021 年 3 月 16 号发布!根据发布的规划,这次发布的 JDK 17 是一个长期维护的版本(LTS)。Java 16 提供了数千个性能、稳定性和安全性更新,以及 17 个 JEP(JDK 增强提案)&…

特征工程资料整理,如何从数据中挖掘特征

特征工程资料整理,如何从数据中挖掘特征一、特征工程是什么二、探索性数据分析EDA参考资料:1. pandas_profiling【推荐】2. Sweetviz3. pandasgui4.D-tale【推荐】结论三、特征处理参考资料:1. 数值特征⭐️⭐️⭐️⭐️⭐️数值特征小结&…

用于高精度干涉仪的奇特量子效应

使用物质波放大、跟踪加速度,以前从未以便携式形式实现。(图片来源:网络) 来自法国的一组研究人员开发了第一个三向混合量子惯性传感器,它可以在不使用卫星信号的情况下测量加速度。这个突破性设备的核心是“物质波干涉…

传统目标跟踪——MeanShift算法

目录 一、均值漂移(MeanShift) 二、流程 三、代码 3.1 meanshift+固定框的代码 3.2 优化:meanshift鼠标选择 3.3 meanshift自己实现函数 四、补充知识 4.1 直方图 4.2 归一化 4.3 直方图反投影 一、均值漂移(…

Maven 教程

Maven 教程 Maven 翻译为"专家"、“内行”,是 Apache 下的一个纯 Java 开发的开源项目。基于项目对象模型(缩写:POM)概念,Maven利用一个中央信息片断能管理一个项目的构建、报告和文档等步骤。 Maven 是一…

手把手教你阿里云服务器的购买及环境搭建

1.服务器相关 程序员都需要一个自己的服务器! 用于发布自己的网站和项目!用于操作系统的练习!将自己的远程仓库、远程数据库、远程tomcat… 搭建在服务器上!用于Linux进行任意的环境部署操作! 服务器如何购买 若果你没超过24岁&am…

【Bp2Lua】多返回值和Out参数说明

【Bp2Lua】多返回值和Out参数说明 这块比较繁琐,有四部分需要了解: U蓝图LuaUnLua 最后再解释 Bp2Lua 如何处理,以及后续潜在的风险 Bp2Lua 如何处理 先说结论 统一当作多返回值返回特殊处理了 out参数 不在参数列表最后的情况&#xf…

分布式理论之分布式锁

写在前面 在分布式理论之分布式互斥 一文中我们分析了分布式环境中的分布式互斥问题,其中解决该问题有如下的三种方案: 1:集中式算法 2:分布式算法 3:令牌环算法而本文要分析的分布式锁,就是其中的算法1,…

折腾了我一周,原来Netty网络编程就是这么个破玩意儿!!!

1、阻塞 阻塞模式下,相关方法都会导致线程暂停 ServerSocketChannel.accept 会在没有连接建立时让线程暂停SocketChannel.read 会在通道中没有数据可读时让线程暂停阻塞的表现其实就是线程暂停了,暂停期间不会占用 cpu,但线程相当于闲置 单线…

flowable学习笔记(四):动态多实例

1.定义流程模板 【测试用户任务多实例】任务节点配置了以下属性: 集合(多实例):userList。这个创建流程实例时入参需要加上这个参数。 元素变量(多实例):user。工作流创建多实例时会将集合(多实例)的值拆分成元素变量(多实例),这个…