【没有哪个港口是永远的停留~论文简读】HRNet+OCR

news2025/1/15 13:40:37

一、Deep High-Resolution Representation Learning for Human Pose Estimation (HRNet)

论文:https://arxiv.org/pdf/1902.09212.pdf

代码:https://github.com/leoxiaobin/deep-high-resolution-net.pytorch

二、Deep high-resolution representation learning for visual recognition (HRNetV2)

论文:https://arxiv.org/pdf/1908.07919

代码:https://github.com/HRNet

三、Segmentation Transformer: Object-Contextual Representations for Semantic Segmentation(HRNetV2+OCR)【重要】

论文:https://arxiv.org/pdf/1909.11065.pdf

四、 Hierarchical multi-scale attention for semantic segmentation(HRNetV2+OCR MA)
论文:https://arxiv.org/pdf/2005.10821v1.pdf

二、Deep high-resolution representation learning for visual recognition (HRNetV2)

论文:https://arxiv.org/pdf/1908.07919

代码:https://github.com/HRNet

介绍:

从HRNet中学习到的高分辨率表示不仅在语义上很强,而且在空间上也很精确。这来自于两个方面。

(i)我们的方法是将高到低分辨率的卷积流并行连接,而不是串联连接。因此,我们的方法能够保持高分辨率,而不是从低分辨率中恢复高分辨率,因此,学习到的表示可能在空间上更精确

(ii)大多数现有的融合方案聚合了通过上采样低分辨率表示获得的高分辨率低级和高级表示。相反,我们在低分辨率表示的帮助下,重复多分辨率融合来提高高分辨率表示,反之亦然。因此,所有的高到低分辨率表示都在语义上是强的。

相关工作

学习低分辨率的表征:全卷积得到粗分割图+中低水平中分辨率表示=精细分割,

恢复高分辨率的表示形式:upsample、skipping connection【SegNet ;DeconvNet ; U-Net ; Hourglass】

保持高分辨率的表示形式:interlinked CNNs; GridNet;multi-scale DenseNet

多尺度融合: (1)我们的融合输出四种分辨率的表示,而不是一个;(2)我们的融合模块重复了多次,这是受到深度融合的启发

网络结构

特点

并行地连接从高到低的卷积流。它在整个过程中保持高分辨率的表示,并通过反复融合从多分辨率流中获得的表示,生成具有较强位置灵敏度的可靠的高分辨率表示

(1)我们将HRNetV1扩展到两个版本: HRNetV2和HRNetV2p,它们探索了所有的四分辨率表示。

(2)我们建立了多分辨率融合和规则卷积之间的联系,这为探索HRNetV2和HRNetV2p中所有四分辨率表示的必要性提供了证据。

(3)我们展示了HRNetV2和HRNetV2p相对于HRNetV1的优越性,并介绍了HRNetV2和HRNetV2p在广泛的视觉问题中的应用,包括语义分割和目标检测

三、Segmentation Transformer: Object-Contextual Representations for Semantic Segmentation(HRNetV2+OCR)【重要】

论文:https://arxiv.org/pdf/1909.11065.pdf

介绍

早期的研究主要是关于语境的空间尺度,即空间范围。有代表性:如ASPP、PPM,利用了多尺度的上下文。

最近,一些作品,如DANet、CFNet 、OCNet 。考虑了一个位置其上下文位置之间的关系,并为类似的代表聚合了具有更高权重的上下文位置的表示

GT-OCR通过利用 ground-truth 来估计理想的对象-上下文表示。OCR报告了我们提出的对象-上下文表示的性能。

baseline、OCR、GT-OCR三种方法以输出 stride 8 ResNet-101为骨干的分割结果

如图1所示,经验研究验证了,当给出 ground-truth 对象区域时,这种表示增强方案显著提高了分割质量。

相关工作

多尺度上下文:

  1. PSPNet [80]对金字塔池表示进行常规卷积,以捕获多尺度上下文。
  2. DeepLab系列采用了具有不同稀释速率的平行扩张卷积(每个稀释速率捕获了不同尺度的上下文)。
  3. 最近的工作[24,68,84,72]提出了各种扩展,例如,DenseASPP [68]密度扩展速率,以覆盖更大的尺度范围。
  4. 其他一些研究[7,42,19]构建了encoder-decoder结构,利用多分辨率特征作为多尺度上下文

关系上下文:

  1. DANet 、CFNet、OCNet 通过聚合上下文像素的表示来增强每个像素的表示,其中上下文由所有像素组成。

我们的方法是一种关系上下文方法,并与双重注意和ACFNet有关。区别在于区域的形成和像素-区域关系的计算。我们的方法学习的区域与监督的地面-真实分割。相比之下,以往除ACFNet之外的区域都是在没有监督的情况下形成的。另一方面,像素和区域之间的关系是通过同时考虑像素和区域表示来计算的,而以往研究中的像素和区域之间的关系则仅仅是通过像素表示来计算的。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1340867.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

JAVA——JDBC学习

视频连接:https://www.bilibili.com/video/BV1sK411B71e/?spm_id_from333.337.search-card.all.click&vd_source619f8ed6df662d99db4b3673d1d3ddcb 《视频讲解很详细!!推荐》 JDBC(Java DataBase Connectivity Java数据库连…

并行进位加法器

前言 在文章逻辑运算加法器中,介绍了两种加法运算方式,串行进位加法器和进位选择加法器,我们给出了逻辑门的实现并给出了C语言描述,本篇文章介绍另外一种加法计算方法:并行进位加法器 写在前面 使用 ⨁ \bigoplus ⨁…

rime中州韵 symbols.custom.yaml 配置

今天我们所做的配置,将实现扩展符号的输入效果,如下👇: 基础扩展符号的配置 要实现输入法能够输入扩展的符号,我们需要在输入方案中引入扩展符号集。 如果你使用的输入方案是 wubi_pinyin.schema.yaml,…

计算机中找不到vcruntime140.dll无法启动此程序怎么解决?

无法继续执行代码,因为找不到vcruntime140.dll”。那么,vcruntime140.dll是什么文件?它的作用是什么?当它丢失时会对电脑产生什么影响?本文将为您详细介绍vcruntime140.dll文件的相关知识,并提供五种解决vc…

Rhinos各版本安装指南

下载链接 https://pan.baidu.com/s/1L5qeUPMW32d7zR-GlVVZIw?pwd0531 温馨提示:若您下载的安装包与该安装步骤不同,说明您使用的是之前被淘汰的安装包,请通过该页面的下载链接重新下载。 1.鼠标右击【Rhino8.1(64bit)】压缩包&#xff08…

VuePress、VuePress-theme-hope 搭建个人博客 1【快速上手】 —— 防止踩坑篇

vuePress官网地址 👉 首页 | VuePress 手动安装 这一章节会帮助你从头搭建一个简单的 VuePress 文档网站。如果你想在一个现有项目中使用 VuePress 管理文档,从步骤 3 开始。 步骤 1: 创建并进入一个新目录 mkdir vuepress-starter cd vuepress-star…

模型系列:增益模型Uplift Modeling原理和案例

模型系列:增益模型Uplift Modeling原理和案例 目录 1. 简介1. 第一步2. 指标3. 元学习器 3.1 S-学习器3.2 T-学习器3.3 T-学习器相关模型 简介 Uplift是一种用于用户级别的治疗增量效应估计的预测建模技术。每家公司都希望增加自己的利润,而其中一个…

深度解析 | 什么是超融合数据中心网络?

数据中心网络连接数据中心内部通用计算、存储和高性能计算资源,服务器间的所有数据交互都要经由网络转发。当前,IT架构、计算和存储技术都在发生重大变革,驱动数据中心网络从原来的多张网络独立部署向全以太化演进。而传统的以太网无法满足存…

简述Redis备份策略以及对应的实现机制

引言 Redis作为高性能的内存数据库,数据的安全性至关重要。一旦数据丢失,可能会对业务造成重大影响。因此,备份Redis数据是每个Redis使用者都必须考虑的问题。本文将介绍Redis的备份策略以及对应的实现机制。 一、备份策略 1.1 定期备份 …

视频编辑软件,视频添加图片水印软件

你是否曾经为了制作一个简单的视频而头痛不已?是否觉得视频编辑软件的操作复杂,让人望而却步?【视频剪辑高手】将彻底改变这一现状!它以简单、高效、创意为核心,为用户提供一站式的视频编辑解决方案。 所需工具&#…

du和df

du 和df 不一致的问题: 情况如下: innode 没有满 同事求助, 他在删掉一个很大的文件后, 磁盘空间依旧没释放。上去一看, 果然 df 看到磁盘空间占用依旧是100%,等等 du 看了一把,磁盘空间剩余很…

什么是MLOps?

人工智能(AI)和机器学习(ML)应用激动人心的发展浪潮也许会让人相信,企业交付ML产品的能力也在迅速提高。但现实情况是,ML内部流程很难跟上行业的整体发展……但若以MLOps的形式则有希望解决此问题&#xff…

基于遗传算法的航线规划

MATLAB2016b可以正常运行 基于遗传算法的无人机航线规划资源-CSDN文库

【网络安全 | 扫描器】御剑安装及使用教程详析

御剑是一款传统的Web网络安全综合检测程序,支持对PHP、JSP、ASPX等文件进行扫描,具备全扫描、网络安全扫描和主机安全扫描能力,方便发现网站漏洞。 文章目录 下载使用教程 本文对御剑的安装及使用教程进行详析 下载 下载地址读者可自行上网…

ARM CCA机密计算软件架构之RMI领域管理接口与RSI领域服务接口

领域管理接口 领域管理接口(RMI)是RMM与正常世界主机之间的接口。 RMI允许正常世界虚拟机监视器向RMM发出指令,以管理领域。 RMI使用来自主机虚拟机监视器的SMC调用,请求RMM的管理控制。 RMI使得对领域管理的控制成为可能&…

Python新手上路:“用Python和Pygame创造你的流星雨”

文章目录 一、前言二、下载安装过程1.官网下载安装包2.安装python过程第一步第二步第三步第四步第五步安装完成 3.简单测试Python3.1 检查 Python 版本号3.2 打开 Python 解释器3.3 输入你的第一个代码3.4 运行 Python 脚本 4.安装Pygame4.1 cmd命令安装Pygame4.2 pip升级4.3 安…

所有逐个位置相加的方法

989. 【加法模板】秒杀所有逐位相加 参考教程

python学习14

前言:相信看到这篇文章的小伙伴都或多或少有一些编程基础,懂得一些linux的基本命令了吧,本篇文章将带领大家服务器如何部署一个使用django框架开发的一个网站进行云服务器端的部署。 文章使用到的的工具 Python:一种编程语言&…

桥接模式-举例

概叙:桥接模式用一种巧妙的方式处理多层继承存在的问题, 用抽象关联取代了传统的多层继承, 将类之间的静态继承关系转换为动态的对象组合关系, 使得系统更加灵活,并易于扩展, 同时有效控制了系统中类的个数…

使用pytorch搭建ResNet并基于迁移学习训练

这里的迁移学习方法是载入预训练权重的方法 net resnet34()# load pretrain weights# download url: https://download.pytorch.org/models/resnet34-333f7ec4.pthmodel_weight_path "./resnet34-pre.pth"assert os.path.exists(model_weight_path), "file {}…