提效神器!10%标注数据,比肩全量标注的模型效果!

news2024/11/24 17:45:31

46d50dcacde2e53a8b4c8cd605d45713.gif

不知道大家有没有遇到过数据标注成本高、周期长的困扰,有没有那么一种可能,精心标注少量的数据,配合大量的无标注数据,就能达到比肩全量标注的模型精度呢?是的,PaddleX就带来了这样一款提效神器——大模型半监督学习工具。

大模型半监督学习工具利用视觉大模型的强大特征表征能力PaddleX的特色半监督学习方法,其可以在少量有标注数据和大量无标注数据的混合数据上学习到更好的特征,从而得到超高精度的大模型,不仅如此,该工具内置了蒸馏和微调小模型的方法,进一步可以得到精度更高的小模型。为了验证该工具的有效性,我们测试了其在公开数据集的指标。最终,该工具刷新了图像分类(ImageNet 10%有标注)、目标检测(COCO 10%有标注)的半监督学习SOTA精度。

该工具有以下几个特点,如果正合您的需求,欢迎尝试使用!

  • 减少标注数据:该工具对CLIP等视觉大模型的下游任务训练进行了调优,通过相关配置和预训练权重设置,其可以在少量有标注数据上学习到目标场景的图像特征,和其他模型相比,达到相同精度时所需要的有标注的数据更少。且该工具集成了更好的半监督学习算法,可以更好地利用无标注数据从而进一步降低标注数据的需求。

  • 提高模型精度:该工具使用大模型在更多无标签数据循环迭代训练,可以得到精度更高的大模型。与此同时,使用该大模型和无标签数据,可以更好地将大模型学习到的知识传授给小模型,从而提升小模型精度。

  • 减少模型研发成本:该工具提供了UI界面,工具内置算法的很多关键参数均已在前端展现,用户可以直接在前端页面调试参数,通过简单地点击UI页面上的按钮即可完成精度更高的模型的研发,大大提升研发高精度模型的效率。

  • 提升模型推理速度:该工具内置了不同推理耗时的精选小模型,用户可以根据实际需要选择速度更快的小模型,从而提升最终的推理速度(该工具可以得到精度相近但是参数量更小、推理速度更快的模型)。

目前,该工具支持图像分类、目标检测、OCR识别三类视觉任务17个模型,大家无需关心细节,只需提供更多无标注数据,点击两次按钮,即可得到高精度的大模型和小模型。下面我们一起看下三大工具的超能力!

4d8a5e41ab3d2d5516a8ebd94e7901ee.png效果展示

1cd99c90918eb3173d5a8a3af6794c0f.png图像分类-大模型半监督学习工具

公开数据集

该工具在公开数据集ImageNet 10%数据上进行了验证。使用该工具后,在 ImageNet 10% 有标签数据+90%无标签数据上,大模型相比直接训练,精度高1.2个百分点(84.2%->85.4%),不仅如此,同时超越了当前半监督学习SOTA方案(85.1%->85.4%);小模型(ResNet50)相比直接训练,精度高了26个百分点以上(54%->80.3%),即使和当前ResNet50在该数据集的半监督学习SOTA比,也高了将近3个百分点(77.5%->80.3%),不仅如此,甚至比该模型在ImageNet全量数据训练的精度高4个百分点(广泛使用的精度为76.3%)。

23078efd2a963094a530b6edcba0edb6.png

场景数据集

除了验证公开数据集,我们还在8个图像分类的场景数据进行了验证。相比直接训练,使用该工具后,大模型和小模型的精度均有大幅提升。

fd8d260b3a3b316936793898655bc3f1.png

立即在线体验:

https://aistudio.baidu.com/projectdetail/paddlex/7045718

a729c96b7bbf25defba7af990d726e76.png目标检测-大模型半监督学习工具

公开数据集

该工具在公开数据集COCO 10%数据上进行了验证。下图展示了该工具在公开数据集COCO 10%的指标情况。使用该工具后,在COCO 10%有标签数据+90%无标签数据上,大模型(RT-DETR-H)相比直接训练,mAP高了3.5个百分点(47.7%->51.2%),刷新了该数据集的半监督学习SOTA(43.5%->51.2%)。小模型(PP-PicoDet_s_320_LCNet)相比直接训练,mAP高了13个百分点以上(18.3%->32.0%),接近全量有标注数据训练的结果(32.5%)。

c22b48e3f0944ac0d263b4dec1ea3b3d.png

场景数据集

除了验证公开数据集,我们还在3个不同的目标检测的场景数据进行了验证,下面展示了目标检测应用中的3个场景使用该工具后的效果,可以看到,在不同的场景中,大模型和小模型的mAP均有大幅提升。

46e59caef002c3d124b368bd041348b5.png

立即在线体验:

https://aistudio.baidu.com/projectdetail/paddlex/7045736

fe80cc1b2e0151ce23b6cfdf253ea2c1.png文本识别-大模型半监督学习工具

在OCR文本识别中,我们使用该工具验证了两个常见的任务,即手写字体识别和通用OCR识别。使用该工具后,大模型和小模型的精度均有大幅提升。

513e4475188583c86586513c01610b07.png

立即体验:

https://aistudio.baidu.com/projectdetail/paddlex/7045737

7a2a38bada9cc5115e324d42e9326c06.png技术思路

大模型半监督学习工具借助了CLIP等视觉大模型或多模态大模型的强大特征预训练,将其在有标注数据上微调得到一个确定场景的大模型,然后将其不断在无标注数据和有标注数据的混合数据上循环训练,得到一个在该场景中精度高的大模型。在此基础上,通过两阶段知识蒸馏或微调,借助更多的数据,将大模型强大的知识传授给小模型,从而得到一个速度快且精度高的小模型。整体流程如下:

59cae787cfd53d206ca86ffd09928016.png

为了让大模型半监督学习工具在不同任务上有较好的泛化性,PaddleX团队在图像分类、目标检测、OCR识别任务上分别进行了广泛的针对性适配和调优,每个工具的算法细节都不尽相同。不仅如此,为了大家使用方便,我们发布的三个不同视觉任务的大模型半监督学习工具尽可能保持了使用方式上的统一。

382c6812fa01bbce0d94b5b1fcb7bd80.png结语

PaddleX是面向国内外主流AI硬件的,全流程、高效率的飞桨精选AI模型的一站式AI开发套件。PaddleX的使命是助力AI技术快速落地,愿景是使人人成为AI Developer!

大模型半监督学习工具已重磅上线PaddleX!快来体验这款提效神器吧!

点击阅读原文加入PaddleX官方频道,和大家一起讨论开发经验,传送门:

https://aistudio.baidu.com/community/channel/610

a2c294f793cbc5156e3adc7b1e0a057b.png

5375c05d2510ad52316bab57241361c1.jpeg

d126d69885d50c053f5487a0050bcdda.jpeg

9f5a81fbc6934a4875ce22900c5767e7.jpeg

df984d214d2a9e0e3b864a04d117ff92.gif

关注【飞桨PaddlePaddle】公众号

获取更多技术内容~

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1214183.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

超级干货!如何挖公益SRC实战/SQL注入

目录 一、信息收集 二、实战演示 三、使用sqlmap进行验证 四、总结 一、信息收集 1.查找带有ID传参的网站(可以查找sql注入漏洞) inurl:asp idxx 2.查找网站后台(多数有登陆框,可以查找弱口令,暴力破解等漏洞&…

第一百七十四回 如何创建扇形渐变背景

文章目录 1. 概念介绍2. 实现方法3. 代码与效果3.1 示例代码3.2 运行效果 4. 内容总结 我们在 上一章回中介绍了"如何创建线性渐变背景"相关的内容,本章回中将介绍" 如何创建扇形渐变背景"。闲话休提,让我们一起Talk Flutter吧。 …

打开GeoTIFF文件失败:Unknown field with tag

用QGIS输出的数据类型为UInt16的TIFF文件,无法在GIMP中打开。 GIMP消息提示: 调查 用ImageMagick打开TIFF文件,虽然会出现警告,但是最终还是打开了: 在ImageMagick中重新保存后,就可以用GIMP打开了。使用…

Mapstruct 搭配MP分页食用 - 参考自ballcat项目

参考自 ballcat 一键抵达: Gitee GitHub 场景 使用MyBatis Plus的selectPage方法进行分页查询之后,如果需要将Entity对象转换为Vo对象,需要从Page对象中取出集合列表,手动转换成Vo集合列表数据重新放进Page对象中。 取出集合 设置…

使用postman测试

第一步: 第二步: 第三步:添加请求 第四步:填写请求 代码实现自动关联的位置: 为相关联的接口设置环境: 使用设置的环境变量: 参数化实现测试:测试脚本中仅测试数据不一样&#xff…

[答疑]改善系统的性能,用得着业务建模吗

DDD领域驱动设计批评文集 做强化自测题获得“软件方法建模师”称号 《软件方法》各章合集 第五元素 2023-10-27 22:02 潘老师,请教一个实践中遇到的问题: 假设生产人员使用某个工具处理数据,需要10天时间;现在改进了这个工具…

Java排序算法之堆排序

图解 堆排序是一种常见的排序算法,它借助了堆这种数据结构。堆是一种完全二叉树,它可以分为两种类型:最大堆和最小堆。在最大堆中,每个结点的值都大于等于它的子结点的值,而在最小堆中,每个结点的值都小于等…

SpringSecurity6从入门到上天系列第六篇:解决这个问题为什么在引入SpringSecurity之后所有的请求都需要先做登录认证才可以进行访问呢

文章目录 问题引入 1:问题阐述 2:问题分析 一:从SpringBoot的自动装配 1:SpringBootApplication介绍 2:自动装配的核心方法 3:核心方法的调用路径 4:SpringSecurity核心配置 5&#xf…

PMP备考短期极限上岸攻略!

作为一位通过PMP考试成功上岸的3A人士,下面的文章包含了所有PMP考试的实用知识,是一本适合初学者的PMP备考攻略手册。如果你有意向了解或者报考PMP考试,这篇文章肯定会对你有很大的帮助! 对于新手第一个需要知道的就是PMP是什么&…

【python】—— 控制语句和组合数据类型(其一)

🎃个人专栏: 🐬 算法设计与分析:算法设计与分析_IT闫的博客-CSDN博客 🐳Java基础:Java基础_IT闫的博客-CSDN博客 🐋c语言:c语言_IT闫的博客-CSDN博客 🐟MySQL&#xff1a…

Flume(一)【Flume 概述】

前言 今天实在不知道学点什么好了,早上学了3个多小时的 Flink ,整天只学一门技术是很容易丧失兴趣的。那就学点新的东西 Flume,虽然 Kafka 还没学完,但是大数据生态圈的基础组件也基本就剩这倆了。 Flume 概述 生产环境中的数据一…

Sql Prompt 10下载安装图文教程

在操作过程中,请暂时关闭你的防病毒软件,以免其误报导致操作失败。 资源 SQL Prompt 10 https://www.aliyundrive.com/s/QuMWkvE1Sv6 点击链接保存,或者复制本段内容,打开「阿里云盘」APP ,无需下载极速在线查看&…

20 - 欲知JVM调优先了解JVM内存模型

从今天开始,我将和你一起探讨 Java 虚拟机(JVM)的性能调优。JVM 算是面试中的高频问题了,通常情况下总会有人问到:请你讲解下 JVM 的内存模型,JVM 的性能调优做过吗? 1、为什么 JVM 在 Java 中…

Qt高级--(2)自定义标题栏

自定义标题栏 功能点 1.标题栏中最外层布局器使用水平布局器。 2.导航按钮、工具按钮和窗口功能按钮都是用水平布局器,边距和间隔可根据实际情况设置。 3.编写 QSS 样式,并将样式设置到窗口控件中。 4.实现最小化、最大化和关闭窗口按钮功能。 5.实现鼠…

mysql数据库,sql语句中连接查询,连表查询,内连接,外连接,左外连接,右外连接,inner join、left join、right join,全连接

连表查询 现有多张表:员工表 emp(员工编号、姓名、工资、部门号、经理编号)、部门表 dept(部门号、部门名称、部门位置)、工资等级表 salgrade(等级、工资下限、工资上限) 连接查询:…

ClassLoader

Java /Android 默认ClassLoader是PathClassLoader Android 的 PathClassLoader 和DexClassLoader 都是BaseDexClassLoader的子类 BaseClassLoader是ClassLoader的子类,通过loadClass方法加载,Android将Java的ClassLoader简化了,第二个参数arg2 无效 loadClass 通过 findLoad…

搭建知识付费系统的最佳实践是什么

在数字化时代,搭建一个高效且用户友好的知识付费系统是许多创业者和内容创作者追求的目标。本文将介绍一些搭建知识付费系统的最佳实践,同时提供一些基本的技术代码示例,以帮助你快速入门。 1. 选择合适的技术栈: 搭建知识付费…

YOLO目标检测——烟叶病害检测数据集下载分享【含对应voc、coco和yolo三种格式标签】

实际项目应用:烟叶病虫害防治数据集说明:烟叶病害检测数据集,真实场景的高质量图片数据,数据场景丰富,类别分为:轻度病虫、中度病虫、高度病虫标签说明:使用lableimg标注软件标注,标…

微信群BUG大揭秘!开启身份切换神器

前言 最近微信群里出现了一个神秘的BUG,普通群成员竟然可以艾特全体成员。今天,就让我们一起揭秘这个令人震惊的微信群普通成员可全体成员的BUG 复现步骤 复现步骤也很简单,前提条件就是要在PC客户端操作!首先得有个属于自己的群…

OCR文字识别标注小助手

目录 背景 工具界面 操作 1、选择目录 2、更改为正确的信息 3、保存 4、说明 项目 代码 下载 背景 为什么要写这么一个小工具呢?因为要对文字进行标注。 为什么对文字进行标注呢?因为要重新训练识别。 为什么要重新训练识别呢?因…