人群密度技术人流量检测

news2024/11/26 10:05:24

1.贡献

本文的task还是在synthetic的data上训练,在real data上测试,并且之前的方法主要是先将synthetic的data风格转化成real的风格,再训练,来减轻domain的gap带来的问题,但是之前的这样做存在几个问题,第一,风格迁移本身会对原来的synthetic image造成除了色调以外的结构上的变化,以至于导致其跟对应的gt存在一些mis align的问题,第二,风格迁移会造成对细节的破坏,尤其是密集场景,失去细节是比较严重的问题,第三,real data中存在一些synthetic data里没有的背景元素,这是风格迁移无法弥补的

第一第二都是风格迁移本身的问题,本文借鉴了structure跟texture分离的思想,结合structure跟texture去重建,以求获得更好的风格迁移效果,然后在对synthetic风格迁移到real上之后,再进行普通的counting的training,获得初步的counting 模型。第三是由于没法在real data上训练的问题,本文提出了利用假标签的方法,实现在real data上的训练,假标签来源于利用初步的counting模型real data上测试,然后根据预测结果去制作假标签,再在real data上用假的gt去fine-tune模型。

我觉得本文最大的亮点不是前面的风格迁移的改进,而是后面这种假标签思想吧。

2.方法

(一)概述

本文是一个三阶段的过程,第一个阶段是风格迁移,利用了cycle-gan,目的是为了将Source domain,也就是synthetic的image风格转化为real的风格,以便缩小两个domain的差距,

第二个阶段是在完成风格迁移的synthetic data上初步训练一个counting 模型

第三个阶段是利用初步训练的模型对real data预测一个结果,根据结果制作假的gt,再用假的gt fine-tune模型

(2)第一阶段——风格迁移

本文的风格迁移借鉴了将structure feature跟texture feature分离的思想,即结构信息,比如人的形状等式domain无关的,而背景,颜色,整体风格等texture信息是domain相关的,因此可以用一个公共的encoder去提取structure feature,而texture feature要用不同的encoder去提取,在一篇分割的论文中《All about Structure: Adapting Structural Information across Domains for Boosting Semantic Segmentation》,也运用了此类思想,不同的是,本文只有一个公共的提取structure feature的encoder,即Gc,而domain相关的texture feature默认各自的decoder会自行添加,所以少了提取texture feature的encoder。

两个decoder分别根据structure feature fs去重建原图,或者实现风格迁移。Istos就是从Source domain重建出来的图片,因为它用了source domain的structure feature,又用了目标为source domain的decoder,即Gtos,所以为重建任务,而target domain的structure feature与Gtos结合,就可以输出synthetic风格的real image,即Ittos

为了让structure feature实现domain 无关,对于这个feature加了一个discriminator,来区分feature来自哪个domain,对于重建任务,用了重建的loss,即Lrec,然后对于风格迁移部分,用的是perceptual loss以及adversarial loss去约束,adversial loss对应的dsicriminator是一个全卷积的网络,输出为输入分辨率的1/4,然后计算pixel-level的bce loss,以下是adversarial loss

重建的loss Lrec如下:

风格迁移的perceptual loss参见论文《Perceptual Losses for Real-Time Style Transfer and Super-Resolution》

(3)第二阶段——在synthetic data上初步训练counting model

第一阶段完成风格迁移后,在迁移后的synthetic data上用MSE loss训练counting 模型,其实第一阶段和第二阶段是联合训练的,总的loss如下:

其中Ltask就是训练counting用的MSE loss,Lcons就是上面所说的风格迁移中用的perceptual loss,α=0.01,β=0.1,γ=0.1

(4)第三阶段——制作pseudo gt,fine-tune模型

先用阶段二训练得到的模型去预测real data,获得预测结果,然后对预测结果,每个点处以该点为中心,以一个kxk大小的窗口范围与一个标准的高斯分布比较相似度,来表示该点处存在一个人的可能性,计算方法如下:

本文称为通过以上方式获得的一张图为probablity map,每个点代表了该点处存在一个标准高斯核的可能性,即该点处存在一个人的可能性。这里的W就是一个标准的高斯核。

然后对于probability map,迭代地找出N个可能为人的点,N为初步预测的density map的求和值,算法过程如下:

核心的思想就是不断寻找probablity map中的最大值,然后用一个标准高斯核去填充该点区域,就跟平时制作counting 的gt一样。

这样制作完pesudo gt后,就结合real data fine-tune一下模型。

3.实验

(1)模型结构

其中的C就是counting model,其他都是generator或者discriminator

(2)消融研究

IFS-a,就是风格迁移部分没有对于Gc的feature-level的discriminator,即无法确保structure feature是domain不变的,然后没有用假标签fine-tune模型

IFS-b,用了本文完整的风格迁移方案,但是没有用假标签fine-tune

IFS-b+GPR-a,直接用阶段二模型的预测结果fine-tune,没有用假标签

IFS-b+GPR-b,阶段二模型预测结果只做了pesudo label后,再fine-tune

(3)与之前的domain adaption的方法比较

由于之前这个方向的work比较少,基本上只能跟作者自己之前的work比较了

(4)风格迁移的结果

4.评论

其实本文算是作者在自己之前CVPR2019的work提出的数据集的进一步利用和方法上的改进吧,structure和texture feature分离的思想也不是最新的,最大的创新点是根据density map制作pesudo label的思想,这个思想可以用来做一些density map预测结果的refine,似乎就挺好用的,值得尝试

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/715918.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于HTML的图书管理系统(源码+数据库)

一、相关技术介绍 1.HTML 5技术 HTML5作为构造Web内容的语言描述方式和互联网的规范,为网站设计提供了一种全新的思路。将HTML5引入到网站开发领域中,以提高用户体验度,使网站更具有吸引力,增强搜索引擎收录以及增加浏览次数等功…

B063-基础环境-后端环境 Lombok Restful postman swagger

目录 项目介绍需求分析项目架构项目技术架构前后端分离前后端分离开发模式前后端分离优缺点 后端项目搭建-部门模块项目端口规划创建SpringBoot项目流程整合SSM引用属性传值 LombokRestful风格Postman接口测试swagger接口规范其他 项目介绍 本项目是一个(Online To…

​2023年湖北黄冈安管三类人员个人可以报名吗 ?报名时间是什么时候?

2023年湖北黄冈安管三类人员个人可以报名吗 ?报名时间是什么时候? 个人不可以报名。安管三类人员包括建筑施工企业主要负责人、建筑施工企业项目负责人以及建筑施工企业专职安全生产管理人员,他们是对本企业安全生产工作负责的三类人员&#…

【LInux】简单进度条程序的编写

在进行进度条的程序的编写之前,还有几个问题需要解决。 第一个问题,先来看两段代码: 对比上面两段代码只有一个\n的区别。 左边的代码很简单,就是先打印,然后停顿 3 秒,程序退出。 主要问题是,…

ARM通讯接口

ARM要和传感器等芯片进行通信,需要物理线路.用于传送数据的物理线路,称为总线.根据传送的数据速度 物理线路的多少,有很多不同的总线.最常见的是 串口总线 SPI总线 I2C总线 USB总线等. 我们简单的介绍一下串口和i2c接口. 串口,UART,有两根线,分别为TX RX.TX用于发送本地数据…

SAP从入门到放弃系列之生产订单报工

文章目录导航 一、概述二、订单确认的方式2.1、订单抬头维度确认2.2、工订单序维度确认 三、确认的类型四、工序确认的屏幕界面4.1 设置屏幕格式4.2 订单类型维护确认参数 五、确认产生的数据 一、概述 生产订单下达后,订单的确认是对车间生产进度的体现&#xff0…

三、传播引擎

文章目录 1、约束传播问题的数学表示2、传播引擎3、幂等(idempotent)4、调用事件5、已解决的传播器6、引擎优化THE END 1、约束传播问题的数学表示 \qquad 给定 变量集合 { X i } \{X_i\} {Xi​}和其对应的值域 D ( X i ) D(X_i) D(Xi​);给定…

gnuplot画图

首先,安装gnuplot: sudo apt-get install gnuplot 接着,输入gnuplot,进入gnuplot工作模式: gnuplot 输入下述命令,打开对应的位姿文件,使用XX列数据进行画图: plot poses.txt using 2:3输入下述命令,打开两个不同的位姿文件,同时进行绘图. plot poses.txt using 2:3 with l…

Mac上,flv怎么转换成mp4格式

Mac电脑 怎么把mov格式的视频转换mp4?在进行视频格式转换之前,让我们先了解一下为什么需要将MOV格式转换为MP4格式。mov是由美国Apple公司开发的一种视频格式,主要由Apple QuickTime用于存储视频文件。使用苹果手机的用户可以发现&#xff0c…

AIDL Binder机制和原理

新的Android 通信规范中,C层使用AIDL替代HIDL实现Framework和Vendor层之间调用解耦。 我们知道,Binder之间通信,需要一个服务端和一个客户端. 【Binder】 Binder架构分成四层,应用层,Framework层,Native…

4. 注册machine

数字mic系列&#xff0c;注册machine dts配置如下 digital_mic: digital-mic {status "okay";compatible "simple-audio-card";simple-audio-card,format "i2s";simple-audio-card,mclk-fs <256>;simple-audio-card,name "digit…

你知道2个KT6368A的蓝牙芯片模块如何配对_以及数据传输吗

目录 一、简介你知道2个KT6368A的蓝牙芯片模块如何配对_以及数据传输吗&#xff1f;KT6368A的蓝牙模块之间是可以建立连接&#xff0c;并且全双工数据透传的但是有几点注意事项&#xff0c;一定要选择KT6368A的主机版本&#xff0c;和从机版本&#xff0c;如下图&#xff1a; …

Spring Boot 中的分布式锁

Spring Boot 中的分布式锁 在分布式系统中&#xff0c;多个应用程序可能需要同时对同一个资源进行修改。为了避免数据的不一致性和冲突等问题&#xff0c;我们需要对这些资源进行加锁操作。在本文中&#xff0c;我们将介绍 Spring Boot 中的分布式锁是什么&#xff0c;原理是什…

OpenCV键盘监听函数 cv2::waitKey( delay )

1、函数原型&#xff1a;cv::waitKey( delay ) delay&#xff1a;等待时间(毫秒) 作用&#xff1a;通过 waitKey() 可以获取键盘输入2、示例&#xff1a; 实现键盘输入1&#xff0c;将图像转为灰度图输出&#xff1b; 键盘输入2&#xff0c;将图像转为HSV图输出&#xff1b; …

element ui - el-button 重新渲染后disabled属性失效

element ui - el-button重新渲染后disabled属性失效 场景解决方法 场景 有两组不同的按钮&#xff1a; 不在灰度发布状态下的 disabled 的灰色按钮&#xff1b;灰度发布状态下的 可点击按钮&#xff1b; 发现当再次渲染 灰色按钮 时&#xff0c;disabled 属性失效。 解决方…

7.6 【Linux】文件系统的特殊观察与操作

7.6.1 磁盘空间之浪费问题 从上面的特殊字体部分&#xff0c;那就是每个文件所使用掉 block 的容量&#xff01;举例来说&#xff0c;那个 crontab 虽然仅有 451Bytes &#xff0c; 不过他却占用了整个 block &#xff08;每个 block 为 4K&#xff09;&#xff0c;所以将所有的…

电子企业MES管理系统如何加强生产现场管控

随着数字化时代的到来&#xff0c;中小型电子企业面临着提升生产现场管控的挑战。为了应对这一挑战&#xff0c;许多企业开始采用MES生产管理系统。本文将探讨MES生产管理系统如何帮助电子企业加强生产现场管控&#xff0c;提高生产效率和质量。 在电子企业的生产现场&#xf…

MCU是否会从ADAS域控制器消失

摘要&#xff1a; ADAS架构及MCU功能概览、未来ADAS架构的两种方案、MCU是否从ADAS域消失的一点思考 ADAS的装机量和渗透率再提升&#xff0c;尤其L2及L2级&#xff1b;那么随着ADAS域控制器主控芯片的增强&#xff0c;未来&#xff0c;MCU是否还会存在&#xff1f; 转自佐思汽…

SSM之MyBatis

MyBatis学习笔记 一、入门二、XML配置1、configuration&#xff08;配置&#xff09;2、properties&#xff08;属性&#xff09;3、settings&#xff08;设置&#xff09;4、typeAliases&#xff08;类型别名&#xff09;5、typeHandlers&#xff08;类型处理器&#xff09;6、…

CSS的学习3

什么是CSS CSS是层叠样式表的简称&#xff0c;又称为CSS样式表或级联样式表。CSS是一种标记语言。 主要用于设置HTML页面中的文本内容&#xff08;字体、大小、对齐方式等&#xff09;、图片的外形&#xff08;宽高、边框样式、边距等&#xff09;、版面的布局和外观显示样式…