深度学习特征提取魔改版太强了!发文香饽饽!

news2024/9/22 9:35:15

要说CV领域经久不衰的研究热点,特征提取可以占一席,毕竟SLAM、三维重建等重要应用的底层都离不开它。

再加上近几年深度学习兴起,用深度学习做特征提取逐渐成了主流,比传统算法无论是性能、准确性还是效率都更胜一筹。

目前比较常见的深度学习特征提取方法有基于transformer、基于CNN、基于LSTM以及基于GAN,都发展的比较成熟。但为了追求更快速、准确、鲁棒的特征点提取,研究者们开始致力于改进深度学习特征提取技术,所以这方向同样也成了发文热门选择,想发论文的同学可以考虑。

最近这方向一些阶段性的结果已经发表了,如果idea难找可以参考参考,我这边直接帮大家省了查找的时间,已经根据上述四种常用方法分别整理了12篇最新的论文,开源的代码已附,大家别错过哦。

论文原文+开源代码需要的同学看文末

基于transformer

T-frex: A transformer-based feature extraction method from mobile app reviews

方法:论文提出一种基于Transformer的特征提取方法,称为T-FREX。该方法使用大型语言模型(LLMs)对移动应用程序评论进行基于标记分类的方法进行了实证评估,以支持特征提取,在不同的数据配置(领域外 vs 领域内)和多个应用程序类别下探索和讨论了多个模型(BERT,RoBERTa,XLNet)的性能。

创新点:

  • 通过使用LLMs进行基于标记分类的方法,支持移动应用程序评论中的特征提取,提出了一种全新的自动化方法T-FREX。

  • 提出了将特征提取重新定义为NER任务的方法,通过LLMs对移动应用程序评论中的标记进行分类,从而提高了特征提取的性能。

  • 创造性地利用真实用户的地面真实特征注释和外部人员评估,扩展了特征领域的范围和知识体系。

基于CNN

Prosperous Human Gait Recognition: an end-to-end system based on pre-trained CNN features selection

方法:论文提出了一种基于CNN的特征提取方法,用于人体步态识别。该方法包括原始视频帧的预处理、使用预训练的CNN模型Densent-V3进行CNN特征提取、基于混合选择方法对提取的向量进行特征降维,最后使用监督学习方法进行识别。

创新点:

  • 提出了一种新颖的基于深度学习的人体步态识别方法,通过预训练的CNN模型提取特征,并通过融合多个层次的特征和Firefly算法和Skewness方法进行特征选择,最终使用OAMSVM进行识别。

  • 在CASIA B数据集的三个不同角度的评估中,分别获得了94.3%,93.8%和94.7%的识别准确率,相较于现有的技术有显著的提升。

基于LSTM

A RSBU-LSTM network for radio frequency fingerprint identification relying on multiple features

方法:论文提出了一种基于长短期记忆网络的特征提取方法,用于无线电频率指纹识别。RSBU-LSTM网络模型使用了多个特征和多个RSBU来提取信号特征并抑制噪声。同时,采用LSTM提取非相邻周期信号的相关特征,并通过全连接(FC)层进行设备识别。

创新点:

  • 不同于直接将数据输入到卷积神经网络(CNN),该文考虑了信号的实部、虚部和相位信息,使得信号输入更加全面。

  • 通过使用多个残差收缩建模单元(RSBU)抑制噪声并提取相关特征,并结合长短期记忆(LSTM)提取非相邻信号周期和多个信号周期之间的相关特征,实现了对无线设备的个体识别。

基于GAN

Enhancing quality of pose-varied face restoration with local weak feature sensing and gan prior

方法:论文提出了一种基于生成对抗网络(GAN)的特征提取方法,用于盲人脸恢复。该网络利用局部弱特征感知和生成对抗网络(GAN)先验来增强变化姿势人脸图像的质量,采用混合多路径残差块(MMRB)来提取输入图像的弱纹理特征,通过跳跃连接实现不同尺度特征的空间交互和聚合。

创新点:

  • 提出了一个全新的盲目人脸修复网络,结合了生成式人脸先验,可以提高具有复杂面部姿势和严重退化的人脸图像的质量。

  • 设计了一种新颖的自监督训练策略,该策略在StyleGAN2先验模型中冻结了预训练的鉴别器(FreezeD),并与编解码器共同微调生成器。

  • 提出了一种MMRB层,它采用两个分支的稀疏结构来提取不同尺度的特征,并通过跳跃连接实现共享特征的空间交互和聚合。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“改特征提取”获取全部论文+开源代码

码字不易,欢迎大家点赞评论收藏

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2108061.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AAC高级音频编码技术

一、什么是AAC AAC的中文名称是高级音频编码技术,它是基于MPEG-2的一种全新的音频编码技术。随着时代的发展,目前AAC的技术升级到MPEG-4表准。AAC广泛的应用在网络传输、高清录制等领域,而AAC技术的出现就是为了取代之前的MP3格式。 二、为什…

类的加载过程与初始化小记

//部分内容来自“狂神说java” 代码验证 解释 1.加载类的信息,加载到内存中,如例子,将Test05和A类的信息加载到方法区, 2.加载完成后,立马生成一个class对象,如例 java.lang.class对象代表Test05类..., 3…

畅捷通ERP远程访问:使用巴比达内网穿透的体验

ERP系统的应用越来越普遍。畅捷通ERP作为一款优秀的企业资源管理工具,帮助企业整合资源,提高运营效率。然而,很多企业在使用畅捷通ERP时,面临着远程访问的问题。为了有效解决这一问题,我尝试了巴比达内网穿透&#xff…

2024高教社杯全国大学生数学建模竞赛C题保姆级分析完整思路+代码+数据教学

2024高教社杯全国大学生数学建模竞赛C题保姆级分析完整思路代码数据教学 C题题目:农作物的种植策略 今年的题目很有意思,和去年C题题目相关联了,接下来我们将按照题目总体分析-背景分析-各小问分析的形式来 1 总体分析 1.1 问题背景&…

[算法]单调栈解法

目录 739. 每日温度 - 力扣(LeetCode) 42. 接雨水 - 力扣(LeetCode) 84. 柱状图中最大的矩形 - 力扣(LeetCode) 739. 每日温度 - 力扣(LeetCode) 解法: 通常是一维数…

Ubuntu: 配置OpenCV环境

从从Ubuntu系统安装opencv_ubuntu安装opencv-CSDN博客文章浏览阅读2.3k次,点赞4次,收藏14次。开源计算机视觉(OpenCV)是一个主要针对实时计算机视觉的编程函数库。OpenCV的应用领域包括:2D和3D功能工具包、运动估计、面部识别系统、手势识别、人机交互、…

2024 高教社杯 数学建模国赛 (C题)深度剖析|农作物的种植策略|数学建模完整代码+建模过程全解全析

当大家面临着复杂的数学建模问题时,你是否曾经感到茫然无措?作为2022年美国大学生数学建模比赛的O奖得主,我为大家提供了一套优秀的解题思路,让你轻松应对各种难题! CS团队倾注了大量时间和心血,深入挖掘解…

数学专题.

数论 1.判断质数 定义:在大于1的整数中,如果只包含1和本身这两个约数,就称为质数or素数 Acwing 866.试除法判断质数 2.预处理质数(筛质数) Acwing 868.筛质数 3.质因数分解 Acwing 867.分解质因数 4.阶乘分解 5.因…

2024最新软件测试面试题(附答案)来测试下你的水平

1、软件测试的目的是( ) A、试验性运行软件 B、发现软件错误 C、证明软件正确 D、找出软件中全部错误 【答案】B 2、下面说法正确的是( ) A、经过测试没有发现错误说明程序正确 B、测试的目标是为了证明程序没有错误 C、成功的测试是发现了迄今…

数字货币是怎么回事什么是数字货币

数字货币的定义 数字货币是一种基于密码学原理的数字形式表示的货币,通过特定的加密算法和分布式账本技术实现安全交易和流通。它不像传统货币那样具有实体形态,而是以电子方式存在。数字货币可以通过互联网进行转账和交易,通常依赖区块链等分…

OPC DA

默认端口号: TCP 135 参考https://wenku.baidu.com/view/8f2b18a229f90242a8956bec0975f46527d3a7e4.html?_wkts_1725526157944&bdQuery%E6%9F%A5%E7%9C%8B%E8%A5%BF%E9%97%A8%E5%AD%90opcDA%E7%AB%AF%E5%8F%A3%E5%8F%B7 OPC DA ,OPC UA简介https://www.cnblogs.com/mi…

Qt 应用程序主界面

主要窗口类的概述 这些类提供了典型现代主应用程序窗口所需的一切,如主窗口本身、菜单和工具栏、状态栏等。 QAction 可以插入小部件的抽象用户界面操作 QActionGroup 将动作组合在一起 QDockWidget 小部件,可以停靠在QMainWindow中,也可以作…

springboot+vue+mybatis计算机毕业设计音乐播放系统+PPT+论文+讲解+售后

音乐播放系统的目的是让使用者可以更方便的将人、设备和场景更立体的连接在一起。能让用户以更科幻的方式使用产品,体验高科技时代带给人们的方便,同时也能让用户体会到与以往常规产品不同的体验风格。 与安卓,iOS相比较起来,音乐…

【JVM】JVM简介|运行流程|内存划分

目录 一、JVM简介 二、JVM运行流程 三、JVM运⾏时数据区(内存划分) 3.1 堆(线程共享) 3.2 栈 3.3 元数据区(方法区)(线程共享) 3.4 程序计数器(线程私有&#xff0…

【学习笔记】5G-A时代物联网应用及策略研究

摘要 海量物联网通信是5G典型应用场景之一,为了实现蜂窝网的全场景物联能力,需要更多的场景化技术,5G-A引入了RedCap(5G Reduced Capability)和Passive IoT。其中,RedCap降低了设备复杂性及成本&#xff0…

js混淆保护在线工具开源项目大全

具体前往:js代码混淆加密保护工具&开源项目大全

指针复习--(笔记整理)

之前出的有指针合集在博客,最近要备考计算机二级,所以复习了一下,有一些容易遗忘的点整理了一下,大家可以有针对性的看一看,后续刷二级真题的时候也会进行题目代练,可以下收藏起来。记得先赞,祝…

力扣96-不同的二叉搜索树(Java详细题解)

题目链接:96. 不同的二叉搜索树 - 力扣(LeetCode) 前情提要: 因为本人最近都来刷dp类的题目所以该题就默认用dp方法来做。 dp五部曲。 1.确定dp数组和i下标的含义。 2.确定递推公式。 3.dp初始化。 4.确定dp的遍历顺序。 …

高并发内存池(一):项目介绍与定长内存池的实现

目录​​​​​​​ 项目介绍 池化技术 内存池 内存碎片 malloc工作原理 定长内存池 申请内存 释放内存 定位new VirtualAlloc函数 封装VirtualAlloc 定长内存池的最终代码 项目介绍 项目原型:goole的开源项目tcmalloc(Thread-Caching Mal…

一种极简的余弦定理证明方法

余弦定理的证明方法有很多种,这里介绍一种极简的证明方法。该方法是本人在工作中推导公式,无意中发现的。证明非常简单,下面简单做下记录。   如上图为任意三角形ABC,以点C为原点,建立直角坐标系(x轴方向…