PP-ChatOCRv2、PP-TSv2、大模型半监督学习工具...PaddleX新特性等你来pick!

news2025/1/23 17:46:12

小A是一名刚刚毕业的算法工程师,有一天,他被老板安排了一个活,要对一批合同扫描件进行自动化信息抽取,输出结构化的分析报表。OCR问题不大,但是怎么进行批量的结构化信息抽取呢?小A陷入了苦苦思索…

小B是一名项目经理,最近他接手了一个紧急的AI项目,客户提供的数据很多,但是标注的样本很少,很难达到客户要求的精度指标。而如果大量标注数据,时间上根本来不及。deadline一天天临近,小B整天愁眉苦脸…

小C是一家小型AI服务提供商的老板,长期做项目下来,他总觉得需要沉淀一套标准化的工具,快速应对多种多样的场景需求,尤其要满足多种复杂环境的模型部署,但公司的研发力量被项目缠身,陷入了恶性循环。小C一筹莫展…

俗话说的好,方法总比困难多,新版本的PaddleX有望解决小A、小B和小C的燃眉之急!

转眼间,距离飞桨AI套件PaddleX的正式发布Run in PaddleX!四步搞定10+任务场景36个精选产业模型开发与部署!已经过去了两个月。两个月期间,PaddleX团队快速响应AI落地的新需求、新功能,以期能在今天新内容发布中给大家交一个满意的答卷!接下来,就让我们看一看PaddleX都带来了什么新内容吧!

四大更新内容速览

强大的大小模型结合特色工具

  • PP-ChatOCRv2: PP-OCR与文心一言强强结合,支持1.5万+大字库解决生僻字、多页pdf、表格识别等难题,无需训练即可在20+场景实现关键信息抽取平均准确率80%以上。
  • PP-TSv2: 支持时序预测时序异常检测任务。在用电负荷预测、预测性维护等多场景任务自适应寻优!电力场景预测误差降低20%以上,设备异常检测场景召回率提升5%。
  • 大模型半监督学习工具: 借助少量有标注数据和大量无标注数据,大大提升模型的精度;在分类、检测、OCR识别3类任务的17个模型上,实现小模型精度提升10%~26%。

40+精选产业高精度模型库

新增RT-DETR-H、TimesNet_AD、PP-HGNetv2-B4等8个精选模型,扩充时序分类、时序异常检测等任务。PaddleX目前已覆盖目标检测、图像分割、3D、OCR、时序预测、图像识别系统、PDF转word等40+精选产业高精度模型库。

低代码工具箱全流程开发

新增数据格式转换、数据划分、评估指标说明等10+界面功能优化,工具箱/开发者双模式高低代码联动功能更丰富,布局更美观!

云端&本地端双平台按需使用

云端和Windows本地端能力同步升级,双平台按需选择!AI Studio云端资源随处可达,实现24小时随处AI开发。为充分利用本地算力,可一键下载本地端软件,满足多样需求。小伙伴们还等什么,来AI Studio云端一键体验吧!这里偷偷爆个料,Linux离线版本地端距离发布很近了呦!

  • PaddleX云端快速体验:

    https://aistudio.baidu.com/intro/paddlex/models

  • PaddleX本地端下载:

    https://aistudio.baidu.com/intro/paddlex

想和志同道合的开发者交流开发经验?想和PaddleX官方开发者交流?欢迎来PaddleX频道交流:https://aistudio.baidu.com/community/channel/610

接下来,让我们详细看一下更新内容吧!

新特性详解

强大的大小模型结合特色工具

PP-ChatOCRv2

相信大家对PP-ChatOCR的惊艳效果还有很深的印象(点击回顾PP-ChatOCR:基于文心大模型的通用图像关键信息抽取利器,开发提效50%!),现在,我们正式迎来了它的第2版。

PP-ChatOCRv2是一个融合了LLM大模型和OCR技术的通用文本图像智能分析系统,覆盖20+高频应用场景,支持5种文本图像智能分析能力和部署,包括通用场景关键信息抽取(快递单、营业执照和机动车行驶证等)、复杂文档场景关键信息抽取(解决生僻字、特殊标点、多页PDF、表格等难点问题)、通用OCR、文档场景专用OCR、通用表格识别。此外针对垂类业务场景,也支持模型训练、微调和Prompt优化。

图片

PP-ChatOCRv2 多场景识别效果PP-ChatOCRv2在PP-ChatOCR的基础上进一步升级,小模型+大模型串联逻辑不变,在通用信息抽取、复杂文档信息抽取、代码拓展性、基础功能完备四个方面做了更新。下面是v2的特性总结:

  • 场景丰富: 支持5种智能文本图像分析能力,覆盖20+高频应用场景,尤其针对复杂文档场景进行了专项优化。
  • 精准度高: 「PP-OCR」与「文心一言」强强结合,支持1.5万+大字库,解决生僻字、多页PDF、表格等难题,无需训练即可在20+场景关键信息抽取平均准确率80%以上。
  • 一键部署: 一键获取PP-ChatOCRv2离线部署SDK,助力企业快速实现工程落地。
  • 便捷开发: 针对垂类业务场景,通过简单点击UI界面按钮,可完成Prompt优化、模型训练和微调。

立即在线体验:

https://aistudio.baidu.com/projectdetail/paddlex/7050167

PP-TSv2

说到时序处理,大家一定还记得PaddleX重磅推出的PP-TS(点击回顾PP-TS基于启发式搜索和集成方法的时序预测模型,使预测更加准确),现在让我们看看v2带来了什么新特性。

图片
PP-TSv2 电力和交通场景落地效果

  • 场景丰富: 支持时序预测时序异常检测两大通用任务,在用电负荷预测、预测性维护、能耗分析、交流流量预估等场景中有重要应用价值。
  • 精准度高: 多场景任务自适应寻优。时序预测,在电力场景预测误差降低20%以上;时序异常检测,在设备异常监控场景相同精度下,召回提升约5%。
  • 便捷开发: 简单点击UI界面即可完数据的预处理一键化去重,数据格式转化以及划分,高精度的自定义训练,研发成本低。
  • 一键部署: 一键获取PP-TSv2离线部署SDK和服务化部署,助力企业快速工程落地。

立即在线体验:

https://aistudio.baidu.com/projectdetail/paddlex/7044307

大模型半监督学习工具

不知道大家有没有遇到过数据标注成本高、周期长的困扰,有没有那么一种可能,精心标注少量的数据,配合大量的无标注数据,就能达到比肩全量标注的模型精度呢?是的,PaddleX就带来了这样一款提效神器——大模型半监督学习工具。

大模型半监督学习工具(LMSSL)利用视觉大模型的强大特征表征能力和PaddleX的特色半监督学习方法,在少量有标注数据和大量无标注数据的混合数据上学习到更好的特征,从而得到超高精度的大模型;该工具还内置了蒸馏和微调小模型的方法,进一步可以得到精度更高的小模型。

为了验证该工具的有效性,我们测试了其在公开数据集的指标。最终,该工具刷新了图像分类-10%ImageNet、目标检测-10%COCO的半监督学习SOTA精度。目前,该工具支持图像分类、目标检测、OCR识别三类视觉任务17个模型,大家无需关心细节,只需提供更多无标注数据,点击两次按钮,即可得到高精度的大模型和小模型。下面列举了使用该工具后,不同场景中大模型和小模型的精度提升情况。

图片

图像分类不同场景和指标提升情况

图片

目标检测不同场景和指标题提升情况

立即在线体验:

  • 图像分类-大模型半监督学习工具:

    https://aistudio.baidu.com/projectdetail/paddlex/7045718

  • 目标检测-大模型半监督学习工具:

    https://aistudio.baidu.com/projectdetail/paddlex/7045736

  • OCR识别-大模型半监督学习工具:

    https://aistudio.baidu.com/projectdetail/paddlex/7045737

以上这些特色工具有没有让大家眼前一亮呢?未来PaddleX将持续推出更多的特色工具,欢迎保持关注哦~

对这些特色工具很感兴趣,想了解得更深入一些?没问题,关注本公众号,后面陆续会有针对性讲解的文章~

40+精选产业高精度模型库

本次更新中,图像分类、目标检测任务方向分别新增了3个精选模型,为大家带来了更多的精度-速度权衡选择。另外,额外覆盖了时序异常检测、时序分类两个任务方向,各自新增一个精选模型。这些精选模型个个都很能打,有下面的实测数据为证。大家的模型选型又有新的选项啦!

图片

PaddleX 本次发版新增模型list

PaddleX已支持的40+算法模型,可参考该链接:

https://aistudio.baidu.com/intro/paddlex/models

后续,PaddleX将持续扩大开发者心心念念的实例分割模型、LLM模型等,欢迎大家进入文章底部的交流频道,反馈对新模型的需求!

低代码工具箱全流程开发

新版PaddleX正式发布以来,用户对工具箱/开发者双模式高低代码联动的开发方式大家赞赏。PaddleX为了做好极致的AI开发全流程, 这次更新增加了数据分析工具、数据格式转换工具、数据划分工具、评估指标说明等10+功能,低代码工具箱模式功能更丰富,布局更美观!

图片

云端&本地端双平台按需使用

云端AI Studio平台,PaddleX可以通过项目大厅和模型库两个入口使用。

Windows本地端PaddleX2.2.0版本也正式发布啦,除特色工具外,云端所有能力实现完全同步。一键下载安装windows本地端,即可完成模型开发全流程。

图片

结语

最后,稍微总结一下:

PaddleX是面向国内外主流AI硬件的,全流程、高效率的飞桨精选AI模型的一站式AI开发套件。PaddleX的使命是助力AI技术快速落地,愿景是使人人成为AI Developer!

在本次更新中,PaddleX带来了强大的大小模型结合特色工具、40+精选产业高精度模型库、低代码工具箱全流程开发、云端&本地端双平台按需使用等特性,希望能给大家带来更大的AI开发效率提升和更好的产品体验!

目前PaddleX依然处在快速迭代中,欢迎大家试用和指正!比心~

添加AI Studio飞桨AI套件官方频道,和大家一起讨论吧,传送门:

https://aistudio.baidu.com/community/channel/610

  • PaddleX云端在线体验:

    https://aistudio.baidu.com/intro/paddlex/models

  • PaddleX Windows本地端下载地址:

    https://aistudio.baidu.com/intro/paddlex

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1209855.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【每日一题】K 个元素的最大和

文章目录 Tag题目来源解题思路方法一:贪心 其他语言Cpython3 写在最后 Tag 【贪心】【脑筋急转弯】【数组】【2023-11-15】 题目来源 2656. K 个元素的最大和 解题思路 方法一:贪心 从第一次操作开始每次选择数组中的最大值,由于最大值在…

原论文一比一复现 | 更换 RT-DETR 主干网络为 【ResNet-50】【ResNet-101】【ResNet-152】| 对比实验必备

本专栏内容均为博主独家全网首发,未经授权,任何形式的复制、转载、洗稿或传播行为均属违法侵权行为,一经发现将采取法律手段维护合法权益。我们对所有未经授权传播行为保留追究责任的权利。请尊重原创,支持创作者的努力,共同维护网络知识产权。 更深层的神经网络更难训练。…

一文讲清生产质量场景的数据分析思路及案例实战

今天,顺着制造业数据分析这个大主题,我们来讲讲质量管理数据分析。   说起质量管理,就是对所生产的产品质量进行管理,其最终目的就是保证客户收到的产品质量,提高客户满意度,减少退货和维修的数量。质量管…

IP-guard flexpaper远程命令执行漏洞复现 [附POC]

文章目录 IP-guard flexpaper RCE漏洞复现 [附POC]0x01 前言0x02 漏洞描述0x03 影响版本0x04 漏洞环境0x05 漏洞复现1.访问漏洞环境2.构造POC3.复现 0x06 修复建议 IP-guard flexpaper RCE漏洞复现 [附POC] 0x01 前言 免责声明:请勿利用文章内的相关技术从事非法测…

首发!动手学大模型应用开发教程来了

大模型正逐步成为信息世界的新革命力量,其通过强大的自然语言理解、自然语言生成能力,为开发者提供了新的、更强大的应用开发选择。随着国内外井喷式的大模型 API 服务开放,如何基于大模型 API 快速、便捷地开发具备更强能力、集成大模型的应…

Windows10下Docker安装Mysql5.7

文章目录 Windows10下Docker安装Mysql5.7环境说明打开命令工具搜索镜像拉取镜像查看所有镜像启动镜像查看容器查看所有容器查看运行中容器 进入容器进入容器命令输入账号命令输入密码 添加mysql的远程账号创建一个数据库 Windows10下Docker安装Mysql5.7 环境说明 docker&…

【VBA】基于EXCEL生成Insert语句工具

工具介绍 基于Excel生成INSERT语句工具是一个辅助工具,用于帮助用户根据Excel数据生成INSERT语句。通常,在数据库中插入大量数据时,手动编写INSERT语句会非常繁琐和耗时。而使用这个工具,可以通过Excel中的数据自动生成相应的INS…

【模板】单源最短路径(弱化版)P3371

【模板】单源最短路径(弱化版) 题目背景 本题测试数据为随机数据,在考试中可能会出现构造数据让SPFA不通过,如有需要请移步 P4779。 题目描述 如题,给出一个有向图,请输出从某一点出发到所有点的最短路…

116.飞行员兄弟

题目链接 思路 明天补 代码 #include<bits/stdc.h> using namespace std; const int N 10; char g[N][N]; char backup[N][N]; int ans 0x3f3f3f3f; vector<pair<int, int>> v; int get(int x, int y) {return x * 4 y; } void turn (int x, int y) {i…

02 # 类型基础:强类型与弱类型

宽泛的定义 在强类型语言中&#xff0c;当一个对象从调用函数传递到被调用函数时&#xff0c;其类型必须与被调用函数中声明的类型兼容 – Liskov, Zilles 1974 通俗定义 强类型语言不允许改变变量的数据类型&#xff0c;除非进行强制类型转换 比如下面 Java 里不能将布尔类…

Python-Python高阶技巧:HTTP协议、静态Web服务器程序开发、循环接收客户端的连接请求

版本说明 当前版本号[20231114]。 版本修改说明20231114初版 目录 文章目录 版本说明目录HTTP协议1、网址1.1 网址的概念1.2 URL的组成1.3 知识要点 2、HTTP协议的介绍2.1 HTTP协议的概念及作用2.2 HTTP协议的概念及作用2.3 浏览器访问Web服务器的过程 3、HTTP请求报文3.1 H…

深入学习 Android Framework 之 SystemServer 进程启动详解

深入学习 Android Framework 第三&#xff1a;深入学习 Android Framework 之 SystemServer 进程启动详解 文章目录 深入学习 Android Framework前言一、Android 系统的启动流程1. 流程图2. 启动流程概述 二、源码详解1. 时序图2. 源代码1、ZygoteInit # main()2、ZygoteInit …

Ubuntu 17.10 “Artful Aardvark” 发布首个 Beta

Ubuntu 17.10 “Artful Aardvark” 首个 Beta 版已发布。 按照 Ubuntu 17.10 的发布日程 &#xff0c;Ubuntu 17.10 首个 beta 版按时发布了。不过参与本次测试版的没有 Ubuntu 官方风味版本&#xff08;要尝试的话可以考虑每日构建 ISO&#xff09;&#xff0c;包括了 Kubunt…

MySQL学习day02

一、SQL通用语法 1&#xff09;SQL语句可以单行或多行书写&#xff0c;以分号结尾 2&#xff09;SQL语句可以使用空格/缩进来增强语句的可读性 3&#xff09;MySQL数据库的SQL语句不区分大小写&#xff0c;关键字建议使用大写 4&#xff09;注释&#xff1a; a)单行注释&#x…

Day30力扣打卡

打卡记录 最长回文子序列&#xff08;区间DP&#xff09; 链接 class Solution:def longestPalindromeSubseq(self, s: str) -> int:n len(s)f [[0] * n for _ in range(n)]max lambda x, y: x if x > y else yfor i in range(n - 1, -1, -1):f[i][i] 1for j in ra…

leetcode二分查找算法题

目录 1.二分查找2.在排序数组中查找元素的第一个和最后一个位置3.x的平方根4.搜索插入位置5.山脉数组的峰顶索引6. 寻找峰值7.寻找旋转排序数组中的最小值8.8.0~n-1中缺失的数字 1.二分查找 二分查找 class Solution { public:int search(vector<int>& nums, int …

掉瓶子小游戏

欢迎来到程序小院 掉瓶子 玩法&#xff1a;旋转的瓶子&#xff0c;根据瓶子方向&#xff0c;点击鼠标左键瓶子掉落&#xff0c;从桌面中间掉下即得1分&#xff0c;卡在桌边瓶子碎了游戏结束&#xff0c;快去掉瓶子吧^^。开始游戏https://www.ormcc.com/play/gameStart/203 htm…

第1关:简单查询

任务描述相关知识 检索数据表的内容编程要求测试说明 任务描述 本关任务&#xff1a; 用 SELECT 语句检索数据表中指定字段的数据&#xff1b; 用 SELECT 语句检索数据表中所有字段的数据。 相关知识 为了完成本关任务&#xff0c;你需要掌握&#xff1a;1.如何获取数据表…

从0到0.01入门 Webpack| 001.精选 Webpack面试题

&#x1f90d; 前端开发工程师&#xff08;主业&#xff09;、技术博主&#xff08;副业&#xff09;、已过CET6 &#x1f368; 阿珊和她的猫_CSDN个人主页 &#x1f560; 牛客高级专题作者、在牛客打造高质量专栏《前端面试必备》 &#x1f35a; 蓝桥云课签约作者、已在蓝桥云…

深度学习 植物识别算法系统 计算机竞赛

文章目录 0 前言2 相关技术2.1 VGG-Net模型2.2 VGG-Net在植物识别的优势(1) 卷积核&#xff0c;池化核大小固定(2) 特征提取更全面(3) 网络训练误差收敛速度较快 3 VGG-Net的搭建3.1 Tornado简介(1) 优势(2) 关键代码 4 Inception V3 神经网络4.1 网络结构 5 开始训练5.1 数据集…