【数据集】最近开源的一些多模态图表理解数据集

【数据集】最近开源的一些多模态图表理解数据集

news2025/2/23 7:03:10

1. CharXiv

现有数据集通常关注过于简化和同质化的图表，并且问题往往基于模板生成，这导致了对MLLMs图表理解能力的过度乐观评估。为了解决这个问题，作者提出了一个新的评估套件CharXiv，它包含了从arXiv论文中精选的2323个自然、具有挑战性和多样性的图表，并设计了两种类型的问题：描述性问题和推理问题，以全面评估MLLMs在图表理解方面的能力。

paper：Charting Gaps in Realistic Chart Understanding in Multimodal LLMs
link：https://arxiv.org/abs/2406.18521
dataset：https://huggingface.co/datasets/princeton-nlp/CharXiv

2. OneChart

数据集类型：图表结构提取、图表推理

paper：OneChart: Purify the Chart Structural Extraction via One Auxiliary Token
link：https://arxiv.org/abs/2404.09987
dataset：https://github.com/LingyvKong/OneChart

3. ChartLlama

paper：ChartLlama: A Multimodal LLM for Chart Understanding and Generation
link：https://arxiv.org/pdf/2311.16483
dataset：https://huggingface.co/datasets/listen2you002/ChartLlama-Dataset

4. ChartX

ChartX & ChartVLM: A Versatile Benchmark and Foundation Model for Complicated Chart Reasoning
link：https://arxiv.org/pdf/2402.12185
dataset：https://github.com/UniModal4Reasoning/ChartVLM

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/1891634.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

相关文章

昇思25天学习打卡营第10天|linchenfengxue

昇思25天学习打卡营第10天|linchenfengxue

基于MobileNetv2的垃圾分类通过读取本地图像数据作为输入，对图像中的垃圾物体进行检测，并且将检测结果图片保存到文件中。 MobileNetv2模型原理介绍 MobileNet网络是由Google团队于2017年提出的专注于移动端、嵌入式或IoT设备的轻量级CNN网络&#x…

阅读更多...

【产品运营】Saas的核心六大数据

【产品运营】Saas的核心六大数据

国内头部软件公司的一季度表现惨不忍睹，为啥美国的还那么赚钱呢？其实核心是，没几个Saas产品经理是看数据的，也不知道看啥数据。 SaaS 行业，天天抛头露面、名头叫的响的 SaaS 产品，真没有几个赚钱的。那为…

阅读更多...

# mysql 中文乱码问题分析

# mysql 中文乱码问题分析

mysql 中文乱码问题分析一、问题分析： MySQL 中文乱码通常是因为字符集设置不正确导致的。MySQL 有多种字符集，如 latin1、utf8、utf8mb4 等，如果在创建数据库、数据表或者字段时没有指定正确的字符集，或者在插入数据时使用了与…

阅读更多...

Excel中按列的首行字母顺序，重新排列(VBA脚本)

Excel中按列的首行字母顺序，重新排列(VBA脚本)

排序前要求对4列数据按照第一行abcd的顺序排列 VB脚本如下： 要使用这个脚本，请按照以下步骤操作： 打开Excel，然后按下 Alt F11 打开VBA编辑器。在VBA编辑器中，选择“插入” > “模块”，在打开的模块…

阅读更多...

C语言课设--读取文件并统计数据

C语言课设--读取文件并统计数据

读取文件并统计数据 // 统计记事本英文字符数 //功能 ： 读文件 a.txt 统计出各种数字大写字母小写字母 0~9 A~Z a ~z各有多少个程序主体框架如下： #include<stdio.h> int a[128]{0};//其中数组元素a[i]保存 ASCII 码为i的字符的数量 v…

阅读更多...

安装Intel Realsense D435i驱动与ROS包报错

安装Intel Realsense D435i驱动与ROS包报错

1.下载安装realsense SDK 1.1 安装依赖 sudo apt install libudev-dev pkg-config libgtk-3-dev sudo apt install libusb-1.0-0-dev pkg-config sudo apt install libglfw3-dev sudo apt install libssl-dev1.2 权限 cd librealsense/ sudo cp config/99-realsense-libusb.…

阅读更多...

7 动态规划

7 动态规划

下面的例子不错： 对于动态规划，能学到不少东西； 你要清楚每一步都在做什么，划分细致就能够拆解清楚！ xk. - 力扣（LeetCode） labuladong的算法笔记-动态规划-CSDN博客动态规划是…

阅读更多...

VulnHub靶场之DarkHole_1

VulnHub靶场之DarkHole_1

1 信息收集 1.1 主机发现 arp-scan -l 主机IP地址为：192.168.1.17 1.2 端口和服务扫描 nmap -sS -sV -A -T5 -p- 192.168.1.17 开放22，80端口 1.3 目录扫描 dirsearch -u 192.168.1.17 2 渗透 2.1 访问端口 2.2 注册账号暴力破解不现实&#…

阅读更多...

大语言模型在时空分析中的能力评估

大语言模型在时空分析中的能力评估

这篇论文的标题是《STBench: Assessing the Ability of Large Language Models in Spatio-Temporal Analysis》，由Wenbin Li等人撰写。本文提出了一个名为STBench的基准，用于评估大型语言模型（LLMs）在时空分析中的能力。以下是对论…

阅读更多...

ESP32CAM物联网教学04

ESP32CAM物联网教学04

ESP32CAM物联网教学04 给小车配个显示屏小智决定给小车增加一块显示屏，让小车看起来更好看一些。点灯物联控制小车的行驶方向淘宝上面可以使用的液晶显示屏种类非常多，（输入OLED搜索）经过挑选，选中了这一块&#…

阅读更多...

FlinkSQL 开发经验分享

FlinkSQL 开发经验分享

作者：汤包最近做了几个实时数据开发需求，也不可避免地在使用 Flink 的过程中遇到了一些问题，比如数据倾斜导致的反压、interval join、开窗导致的水位线失效等问题，通过思考并解决这些问题，加深了我对 Flink 原理与机…

阅读更多...

学习笔记——动态路由——OSPF（邻接/邻居）

学习笔记——动态路由——OSPF（邻接/邻居）

十、OSPF的邻接/邻居 1、OSPF路由器之间的关系 (1)基本介绍在OSPF网络中，为了交换链路状态信息和路由信息，邻居设备之间首先要建立邻接关系，邻居(Neighbors)关系和邻接(Adjacencies)关系是两个不同的概念。 OSPF路由器的两种关系&#x…

阅读更多...

《操作系统真象还原》学习笔记：第1章部署工作环境

《操作系统真象还原》学习笔记：第1章部署工作环境

**提示：**这篇文章是根据学长提供的教程《操作系统真象还原》第一章部署工作环境来完成的，我按照学长给的教程一步一步做下来，再结合《操作系统真象还原》这本书，对实验环境进行了配置。以下是我按照教程进行搭建的记录&#xff…

阅读更多...

【RocketMQ】记录一次RocketMQ消费延迟问题排查思路

【RocketMQ】记录一次RocketMQ消费延迟问题排查思路

文章目录背景问题排查Consumer负载均衡机制订阅关系的一致背景业务团队反馈使用我提供的RocketMQ集群，上游生产的消息，部分消息，消费程序需要等1分钟，甚至几分钟后，才能收到。问题排查见怪不怪，大部…

阅读更多...

构建大数据生态：Sqoop、Hadoop、IDEA和Maven的完整安装与数据预处理指南【实训Day03】

构建大数据生态：Sqoop、Hadoop、IDEA和Maven的完整安装与数据预处理指南【实训Day03】

一、Sqoop安装 1 上传安装包并解压缩(在hadoop101上) # cd /opt/software 点击xftp上传sqoop的安装文件sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz # tar -zxvf sqoop-1.4.6.bin__hadoop-2.0.4-alpha.tar.gz -C /opt/module/ # cd /opt/module/ # mv s…

阅读更多...

Webpack: 三种Chunk产物的打包逻辑

Webpack: 三种Chunk产物的打包逻辑

概述在前文 Webpack: Dependency Graph 管理模块间依赖中，我们已经详细讲解了「构建」阶段如何从 Entry 开始逐步递归读入、解析模块内容，并最终构建出模块依赖关系图 —— ModuleGraph 对象。本文我们继续往下，讲解在接下来的「封装」阶段…

阅读更多...

全面解析自然语言处理（NLP）：基础、挑战及应用前景

全面解析自然语言处理（NLP）：基础、挑战及应用前景

自然语言处理 (NLP) 简介与应用前景自然语言处理（NLP）是人工智能和计算语言学的一个分支，致力于使计算机能够理解、解释和生成人类语言。这篇博文将深入探讨自然语言处理的基础知识、挑战、典型任务及其广泛的应用前景。一、自然语言处理的…

阅读更多...

路由的基本使用

路由的基本使用

1.安装 npm i vue-router3 2.引入 import VueRouter from vue-router 3.使用 Vue.use(VueRouter) 4.在src目录下创建router 5.创建两个组件 5.1创建About组件 <template><div> <h1>我是About的内容</h1></div> </template><script> …

阅读更多...

计算机操作系统部分选填及大题整理

计算机操作系统部分选填及大题整理

并发和（ 共享 ） 是操作系统的两个最基本的特征,（ 虚拟 ）和（ 异步 ） 是操作系统的重要特征，并发执行的程序失去可再现性现代操作系统的两个基本特征是（程序的并发执行）和资…

阅读更多...

AC7801时钟配置流程

AC7801时钟配置流程

一默认配置在启动文件中，已经对时钟进行了初始化，默认按外部8M晶振，配置系统时钟为48MHZ，APB为系统时钟的2分频，为24MHZ。在system_ac780x.c文件中，可以找到下面这个系统初始化函数，里面有Se…

阅读更多...

推荐文章

最新文章