实验室ICPR 2024论文分享┆FPMT: 基于增强型半监督模型的交通事件检测(含详细视频解读)

news2024/11/16 5:34:05

目录

论文分享简介

1. 会议介绍

2. 研究背景及主要贡献

3. 方法

4. 实验

5. 结论

6. 论文介绍视频


论文分享简介

本推文详细介绍了一篇实验室的最新论文成果《FPMT: Enhanced Semi-Supervised Model for Traffic Incident Detection》,该论文已被第27届国际模式识别大会(ICPR)接收,论文的第一作者为陆新颖。论文提出了一种名为FPMT的增强型半监督模型,专注于交通事件检测任务。结合MixText框架,该模型在数据增强模块中引入生成对抗网络(GANs),以平衡和扩展数据集,并通过隐藏空间中的概率伪混合机制增强正则化效果,从而提升模型的准确性。在训练策略上,FPMT采用了先无监督训练,再对部分标注数据进行监督微调,最终通过半监督学习完成模型训练。通过在四个真实数据集上的实验,FPMT模型在多项指标上展现出色的性能,特别是在低标注率的情况下,依然能够保持高水平的检测能力,展示了其在实际应用中的巨大潜力。本推文由陆新颖撰写,审校为李杨和朱旺。

原文链接:https://arxiv.org/abs/2409.07839

1. 会议介绍

 第27届国际模式识别大会(ICPR)将于2024年12月1日至5日在印度加尔各答隆重举行。ICPR起始于1972年,是国际模式识别联合会(IAPR)组织的模式识别领域的旗舰学术会议,每两年召开一次,主办国家或地区由国际模式识别联合会的理事会提前四年经无记名投票决定。大会涵盖了计算机视觉、机器学习、图像、语音、传感器模式处理等多个热门研究领域。ICPR为中国人工智能学会(CAAI)B类会议,中国计算机学会(CCF)C类会议。

2. 研究背景及主要贡献

交通事件检测在智能交通系统中至关重要,旨在快速识别交通事故、道路维修等事件。然而,由于数据标注的成本高昂,尤其是深度学习方法对大量标注数据的依赖,传统方法面临挑战。为解决此问题,本文提出了一种基于半监督学习的模型——FPMT,利用未标注数据提升模型性能,特别是在低标注率的情况下,表现尤为优异。主要贡献包括:

1)提出了一种新颖的半监督交通事件检测模型,在标注率极低的情况下表现出色。

2)在数据增强模块中引入生成对抗网络( Generative Adversarial Networks,GANs)以平衡和扩展数据集。

3)在MixText框架下优化了隐藏层的插值策略,以增强正则化效果。

4)应用了先进行监督训练,然后进行半监督微调的训练策略,以提高检测率。

5)在四个真实数据集上进行了广泛的实验,验证了所提出的半监督交通事件检测模型的有效性,并验证了每个模块的有效性。

3. 方法

基于MixText框架,本文提出了一种新的半监督交通事件检测模型FPMT,模型框架如图1所示。该模型集成了训练管道融合策略、概率伪混合策略,以及GANs数据平衡和增强策略。训练管道融合策略是指模型首先在所有数据上进行无监督训练,然后在部分标注数据上进行监督微调,最后通过半监督训练进一步提升模型性能。

 提出的FPMT模型整体框架

FPMT模型的半监督微调阶段遵循PTmix模型的框架,如图2所示。最初,使用GANs对数据集进行数据增强,以平衡并扩展数据集。增强后的数据集被划分为标注数据集和未标注数据集。标注数据集和未标注数据集都被输入到PTmix中,分别生成预测标签和混合数据的预测标签。最后再针对不同数据利用不同损失计算策略进行训练。

采用的混合策略为概率伪混合。混合技术最初是为图像数据设计的,考虑到图像数据是连续的,而文本数据具有离散性,无法直接适用。因此,需要在隐藏空间中进行插值。在一个具有H层的BERT模型中,这个过程涉及从数据集中选择两个样本:和并将它们输入到第一层,获得它们的隐藏表示。然后,在一个中间层,使用混合操作对这两个样本的隐藏表示进行混合,生成一个新样本。对于常用的混合操作,每个批次的混合比例,系数是从Beta分布中随机抽取的。而概率伪混合根据置信度的计算决定混合系数的大小,从而决定在混合得到的新样本中,哪一个样本的占比更大增强正则化效果

 2 PTmix框架

4. 实验

由于交通事件检测是一个二分类任务,分类参数固定为2。在PMT中的概率伪混合层选择上,经过单独训练PMT后发现,在第9层进行混合表现更好。模型的解码器基于Bert-base-uncased,并通过一个额外的线性层进行分类。BERT模型编码器的学习率设置为0.00001,额外线性层的学习率设置为0.001。在半监督微调阶段,对于每个数据集,使用GANs来平衡和增强数据集。在增强后的数据集中,每类未标注样本的数量设置为5000,标注样本的数量分别设置为50、100和1500,标注率分别为1%、2%和30%。图3的(a)和(b)比较了FPMT模型在不同标注样本数量(50、100、1500)下与基准模型的表现;(c)则展示了标注样本数量固定为50时的对比情况。

 图3 FPMT模型在不同标注样本数量下与基准模型的表现对比

 在实验中,选择的评估指标包括分类率(CR)、检测率(DR)和F1评分。每类未标注样本数量固定为5000后,在四个真实数据集上分别使用不同的标注样本数量(每类50、100和1500)进行实验,结果如表1和图3所示。FPMT模型在对比的模型中表现优异,即使在标注样本数量极少的情况下也展现了出色的性能。特别是在检测率(DR)方面,即使标注率仅为1%,其性能也超过了BERT在30%标注率下的表现。该模型在提升检测率方面展现了显著的能力。在PeMS数据集中,当标注样本数量最少,仅为50时,FPMT模型的检测率比MixText高出4.4%,表现最佳。在I-880数据集中,检测率比MixText高出5.6%。在另外两个数据集上的提升虽然不如前两个显著,但该模型依然展现了最佳性能。

模型性能对比

5. 结论

论文提出了一种半监督学习的交通事件检测模型FPMT,减少了模型对标注数据的依赖。训练管道包括无监督的预训练,接着进行监督微调,最后进行半监督训练。该模型结合了GANs用于数据集的平衡和扩充,并在隐藏层中采用了概率伪混合的数据增强技术,以提升半监督模型的性能。在四个真实数据集上与近期模型进行的对比实验表明,所提出的模型具有良好的效果。结果显示,即使在标注数据有限的情况下,该模型依然能够达到高水平的性能。

6. 论文介绍视频

论文介绍

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2163166.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

尚硅谷———-乐(智)尚代驾~~--------Day5----司机认证篇~

前言: Hello亲爱的uu们,在读过了一个愉快的周末后(摸鱼了一会),我又回来更新啦,感谢uu们的阅读,话不多说~ 司机认证 当司机点击开始接单的时候,会先判断该司机有没有通过认证&…

关于PCA的一份介绍

在这篇文章中,我将介绍机器学习中的一种无监督学习算法——PCA,因为它主要有两种用途,即降维与特征提取,所以我将将围绕这两种用途来介绍它,包括基本概念,应用与代码实践。 一、 PCA 1.1 概念 PCA&#…

dev containers plugins for vscode构建虚拟开发环境

0. 需求说明 自用笔记本构建一套开发环境,用docker 虚拟插件 dev containers,实现开发环境的构建,我想构建一套LLMs的环境,由于环境配置太多,不想污染本地环境,所以选择隔离技术 1. 环境准备 vscodedocker 2. 步骤…

任意长度并行前缀和 扫描算法 《PMPP》笔记

下面的算法针对于任意长度输入 对于大数据集,首先将输入分为几段,每一段放进共享内存并用一个线程块处理,比如一个线程块使用1024个线程的话,每个块最多能处理2048个元素。 在前面代码中,一个块最后的执行结果保存到了…

桥接模式和NET模式的区别

桥接模式和NET模式的区别 NAT模式: NAT:网络地址转换(模式):借助宿主机来上网,没桥接那么麻烦,只用配置DNS即可。 缺点:扎根于宿主机,不能和局域网内其它真实的主机进行…

用Python实现运筹学——Day 2: 线性规划的基本概念

一、学习内容 线性规划的定义: 线性规划(Linear Programming, LP)是一种用于求解约束条件下线性目标函数最优解的方法。线性规划问题通常涉及最大化或最小化一个线性目标函数,目标函数的变量受一组线性不等式或等式的约束。 目标…

C语言 | Leetcode C语言题解之第435题无重叠区间

题目: 题解: int cmp(int** a, int** b) {return (*a)[1] - (*b)[1]; }int eraseOverlapIntervals(int** intervals, int intervalsSize, int* intervalsColSize) {if (intervalsSize 0) {return 0;}qsort(intervals, intervalsSize, sizeof(int*), cm…

【React】Ant Design 5.x版本drawer抽屉黑边问题

环境 antd: ^5.14.1react: ^18 问题情况 <Drawer open{open} closable{false} mask{false} width{680}getContainer{props.getContainer || undefined}><p>Some contents...</p><p>Some contents...</p><p>Some contents...</p> …

[网络] 网络层--IP协议

目录 一、IP协议 1.1 基本概念 1.2 IP协议报头 1.3 如何将报头和有效载荷分离和分用 1.4 分片与组装 1.5 如何减少分片&#xff1f; 1.6 分片和封装的具体过程 二、网段划分 2.1 再次理解IP地址 2.2 了解DHCP 2.3 网络划分方案 2.4 为什么要进行网络划分 2.5 特殊的…

Java基础——字节流和字符流

字节流和字符流的用法几乎完全一样&#xff0c;区别在于字节流和字符流所操作的数据单元不同&#xff0c;字节流操作的单元是数据单元是8位的字节&#xff0c;字符流操作的是数据单元为16位的字符。 为什么要有字符流&#xff1f; Java中字符是采用Unicode标准&#xff0c;Un…

【Go语言】Go语言结构体全面解析

✨✨ 欢迎大家来到景天科技苑✨✨ &#x1f388;&#x1f388; 养成好习惯&#xff0c;先赞后看哦~&#x1f388;&#x1f388; &#x1f3c6; 作者简介&#xff1a;景天科技苑 &#x1f3c6;《头衔》&#xff1a;大厂架构师&#xff0c;华为云开发者社区专家博主&#xff0c;…

基于 Canvas 的可缩放拖动网格示例(Vue3以及TypeScript )

文章目录 1. 基本知识2. Vue33. TypeScript 1. 基本知识 基本知识讲解&#xff1a; Canvas API&#xff1a; 一种用于在网页上绘制图形的 HTML 元素&#xff0c;使用 JavaScript 的 Canvas API 来进行绘制 使用 getContext(2d) 方法获取 2D 绘图上下文&#xff0c;允许开发者绘…

MySQL数据库备份详解

文章目录 引言● 数据库备份的重要性 MySQL数据库备份的基础知识● 备份类型1、完全备份2、增量备份3、差异备份 ● 备份工具与方法1、逻辑备份工具——mysqldump2、物理备份工具——Xtrabackup3、第三方解决方案 MySQL数据库备份的实施步骤1、环境准备2、选择合适的备份工具与…

【Linux基础IO】深入解析Linux基础IO缓冲区机制:提升文件操作效率的关键

&#x1f4dd;个人主页&#x1f339;&#xff1a;Eternity._ ⏩收录专栏⏪&#xff1a;Linux “ 登神长阶 ” &#x1f921;往期回顾&#x1f921;&#xff1a;暂无 &#x1f339;&#x1f339;期待您的关注 &#x1f339;&#x1f339; ❀Linux基础IO &#x1f4d2;1. 什么是缓…

14.第二阶段x86游戏实战2-C++语言开发环境搭建-VisualStudio2017

免责声明&#xff1a;内容仅供学习参考&#xff0c;请合法利用知识&#xff0c;禁止进行违法犯罪活动&#xff01; 本次游戏没法给 内容参考于&#xff1a;微尘网络安全 本人写的内容纯属胡编乱造&#xff0c;全都是合成造假&#xff0c;仅仅只是为了娱乐&#xff0c;请不要…

基于jsonpath_ng的JSON数据查改增删

jsonpath_ng支持JSON数据的读写操作。 安装 pip install jsonpath-ng测试数据 from jsonpath_ng import parse import jsonjson_data { "store": {"book": [ { "category": "reference","author": "Nigel Rees&qu…

数据集-目标检测系列-鲨鱼检测数据集 shark >> DataBall

数据集-目标检测系列-鲨鱼检测数据集 shark >> DataBall 数据集-目标检测系列-鲨鱼检测数据集 shark 数据量&#xff1a;6k 想要进一步了解&#xff0c;请联系。 DataBall 助力快速掌握数据集的信息和使用方式&#xff0c;百种数据集&#xff0c;持续增加中。 示例&…

【自动驾驶】基于车辆几何模型的横向控制算法 | Stanley 算法详解与编程实现

写在前面&#xff1a; &#x1f31f; 欢迎光临 清流君 的博客小天地&#xff0c;这里是我分享技术与心得的温馨角落。&#x1f4dd; 个人主页&#xff1a;清流君_CSDN博客&#xff0c;期待与您一同探索 移动机器人 领域的无限可能。 &#x1f50d; 本文系 清流君 原创之作&…

【Python】探索 Elpy:Emacs 中的 Python 开发环境

可以短时间不开心&#xff0c;但别长时间不清醒。 对于使用 Emacs 编辑器的 Python 开发者来说&#xff0c;Elpy 是一个强大的集成开发环境&#xff08;IDE&#xff09;&#xff0c;它通过整合多个 Emacs Lisp 和 Python 包&#xff0c;提供了一套完整的 Python 编程支持。本文…

丹摩智算平台体验:AI开发从未如此简单

目录 初次接触丹摩智算GPU算力资源表格 轻松创建GPU实例镜像选择 实验过程体验实验中的一些细节 使用后的感受一点小建议总结 最近我一直在学习一些与深度学习相关的知识&#xff0c;准备自己动手做一些模型训练的实验。平时在自己电脑上跑模型总感觉有点吃力&#xff0c;特别是…