【时间序列+CNN】(卷积神经网络)在近年来的深度学习领域中备受关注,它通过将卷积神经网络应用于时间序列数据,显著提升了模型在特征提取和模式识别任务中的表现。时间序列+CNN技术已经在金融预测、健康监测和工业设备故障检测等多个领域取得了显著成果,其独特的方法和有效的表现使其成为研究热点之一。
为了帮助大家全面掌握时间序列+CNN的方法并寻找创新点,本文总结了最近两年【时间序列+CNN】相关的20篇顶会顶刊的研究成果,这些论文的文章、来源以及论文的代码都整理好了,希望能为各位的研究工作提供有价值的参考。
三篇详述
1、DeconfuseTrack: Dealing with Confusion for Multi-Object Tracking
这篇文章介绍了一种名为DeconfuseTrack的新型多目标跟踪方法,旨在解决多目标跟踪(MOT)中的混淆问题。多目标跟踪在计算机视觉领域中非常重要,它在视频监控、自动驾驶和人机交互等多个领域都有广泛应用。该方法的核心是提出了一种简单、通用且高度可解释的数据关联方法,称为分解数据关联(Decomposed Data Association, DDA)。DDA通过一系列非基于学习的模块将传统关联问题分解为多个子问题,并针对每个子问题引入新的线索进行选择性处理,以减少检测、轨迹和关联时的混淆。
文章还引入了一种名为Occlusion-aware Non-Maximum Suppression(ONMS)的方法,它能够保留更多的遮挡检测,从而增加与轨迹关联的机会,并间接减少因漏检而造成的混淆。基于DDA和ONMS,作者设计了DeconfuseTrack跟踪器,专门针对MOT中的混淆问题进行解决。通过在MOT17和MOT20数据集上进行的广泛实验,证明了DDA和ONMS显著提高了几种流行跟踪器的性能。DeconfuseTrack在MOT17和MOT20测试集上达到了最先进的性能,显著优于基线跟踪器ByteTrack,在HOTA、IDF1、AssA等指标上有显著提升,这验证了作者的跟踪设计有效减少了由简单全局关联引起的混淆。
文章还对DDA和ONMS进行了详细的介绍和分析,DDA通过分解全局关联问题为多个子问题,并通过匈牙利算法解决成本矩阵来获得分配结果,然后通过检测消歧模块(DDM)、轨迹消歧模块(TDM)和关联消歧模块(ADM)进一步细化分配结果。ONMS则通过设置两个不同的非极大值抑制阈值来保留更多的遮挡检测框,从而为数据关联阶段保留更多的信息。
此外,文章还进行了消融实验,验证了DDA中各个组件的有效性,并通过调整混淆减少因子κ来展示DeconfuseTrack对不同设置的鲁棒性。最后,作者将DDA和ONMS集成到其他流行的跟踪器中,证明了它们具有强大的通用性,能够轻松集成到现有的跟踪系统中并提高性能。文章通过可视化结果展示了DeconfuseTrack在处理遮挡、图像模糊和相机运动等问题时的优势,强调了其在减少ID切换、目标丢失和定位错误等混淆问题上的有效性。
2、Visual Prompt Multi-Modal Tracking
这篇文章提出了一种新颖的视觉提示多模态跟踪方法(Visual Prompt Multi-Modal Tracking, ViPT),旨在通过继承基础模型的强大表征能力来改善多模态跟踪任务。多模态跟踪因其能够利用不同模态间的互补性,提高跟踪的鲁棒性而受到关注。然而,现有的多模态跟踪方法面临下游数据稀缺和迁移能力差的问题。文章的灵感来源于语言模型中提示学习(prompt learning)的最新成功,ViPT通过学习与模态相关的提示(prompts),调整冻结的预训练基础模型,以适应各种下游多模态跟踪任务。
ViPT的核心思想是在保持预训练RGB模型的知识的同时,仅引入少量可训练参数(不到模型参数的1%),从而实现对多模态跟踪任务的适应。具体来说,ViPT在冻结的基础模型中插入了几种简单轻量的模态互补提示器(Modality-Complementary Prompter, MCP)块,这些块能够有效地学习不同模态间的互补性。这种方法不仅在参数效率上具有优势,而且在多个下游跟踪任务上,包括RGB+Depth、RGB+Thermal和RGB+Event跟踪,都超越了全微调(full fine-tuning)范式,实现了最先进的性能。
文章还对ViPT进行了广泛的实验评估,证明了视觉提示学习在多模态跟踪中的潜力。实验结果表明,ViPT在保持参数效率的同时,能够在多个下游任务上达到最先进的性能。此外,作者还探讨了ViPT在不同配置下的性能,包括使用不同数量的MCP块以及在不同训练数据集大小和可训练参数数量下的表现。这些探索性实验进一步验证了ViPT的有效性和泛化能力。
文章的贡献可以总结为:提出了一种新颖的视觉提示跟踪框架,该框架通过学习提示有效地将现成的基础模型适应到下游多模态跟踪任务;设计了模态互补提示器,为任务导向的多模态跟踪生成有效的视觉提示;广泛的实验表明,该方法在多个下游任务上实现了最先进的性能,并且具有参数效率。
最后,文章讨论了ViPT的潜在应用和未来工作,指出尽管ViPT在视觉提示方面取得了成功,但还有扩展到更多跟踪任务的潜力,如视觉-语言跟踪。此外,尽管ViPT为多模态跟踪任务提供了统一的架构,但仍需针对不同的多模态任务分别训练,未来的工作将探索对多种模态进行联合训练的通用模型。
3、Spanning Training Progress: Temporal Dual-Depth Scoring (TDDS) for Enhanced Dataset Pruning
这篇文章提出了一种新的数据集剪枝方法,名为Temporal Dual-Depth Scoring(TDDS),旨在提高数据集的效率,同时保持与完整数据集相当的性能。数据集剪枝的目标是构建一个核心子集(coreset),这个子集能够在减少训练数据的同时,尽可能地保持模型性能。现有方法通常依赖于训练过程中的快照(snapshot)来识别代表性样本,但这些方法在不同的剪枝率和跨架构场景中泛化能力较差。
文章指出,现有研究通过考虑训练动态,例如遗忘事件和概率变化,来解决这一问题,但这些方法通常使用平均方法,难以在不忽略泛化良好的样本的情况下整合更广泛的训练动态。为了应对这一挑战,TDDS采用了双层深度策略,在第一层深度中,估计每个样本在训练过程中的个体贡献,确保全面整合训练动态。在第二层深度中,关注第一层识别出的样本贡献的变异性,以突出泛化良好的样本。
通过在CIFAR和ImageNet数据集上进行的广泛实验,验证了TDDS相较于先前最先进方法的优越性。特别是在CIFAR-100数据集上,TDDS仅使用10%的训练数据就达到了54.51%的准确率,超过了基线方法12.69%以上。文章还提供了代码,以便其他研究者复现和利用这一方法。
文章首先介绍了数据集剪枝的重要性和现有方法的局限性,然后详细介绍了TDDS方法的动机、设计和实现。TDDS方法的核心在于使用时间双重深度评分策略,通过两个层次的评分来平衡训练动态的整合和良好泛化样本的识别。内层(第一层)通过将样本梯度投影到每 epoch 的累积梯度上,来近似每个样本在每个 epoch 的实际贡献。外层(第二层)基于内层计算的投影梯度的变异性来识别泛化良好的样本。
此外,文章还探讨了TDDS方法在不同参数设置下的性能,包括估计范围 T、窗口大小 K 和衰减系数 β。通过消融研究,展示了TDDS的双层深度策略在不同剪枝率下的有效性。最后,文章证明了TDDS在多种现实复杂场景中的鲁棒性,包括图像损坏和标签噪声。
总体而言,这篇文章为数据集剪枝领域提供了一种新的视角和方法,通过精心设计的时间双重深度评分策略,有效地提高了核心子集的泛化能力,为深度学习中的高效数据利用提供了新的途径。