VLDB 2024丨与 TiDB 一起探索数据库学术前沿

news2024/12/28 19:02:14

VLDB海报

VLDB 2024 将于2024年8月26日至8月30日在中国广州举行。VLDB 是数据库领域的顶级国际会议,旨在为数据管理、可扩展数据科学、数据库研究者、供应商、从业者、应用开发者和用户提供交流平台。

2024年的VLDB会议涵盖了数据管理、数据库架构、图形数据管理、数据隐私与安全、数据挖掘、机器学习、人工智能和数据库系统研究等领域的问题——这些都是21世纪新兴应用的基本技术基石。

第16届TPC技术会议(TPCTC 2024)将于2024年8月30日与VLDB 2024大会联合举行。本次会议重点讨论包括向量处理、生成式AI、大数据分析、云计算等新兴技术领域,相关论文及成果有机会用于未来的TPC基准开发。

TiDB 将有三篇论文、一个 Demo Paper 亮相本次大会,欢迎大家现场交流。

议题推荐

Machine Learning, AI, and Databases Industry Paper

论文分享: AutoTQA: Towards Autonomous Tabular Question Answering through Multi-Agent Large Language Models

时间: 8 月 26 日,11:00-12:30,B4 会议室

摘要: 在数据分析日益重要的今天,表格问答(TQA)技术正逐渐成为研究的热点。然而,现有的 TQA 方法主要处理单表问题,而现实世界中的 TQA 问题通常涉及多个表格,这带来了扩展性的挑战。为了解决这一问题,我们提出了 AutoTQA,一个自主的多表格问答框架,它利用多智能体大型语言模型(LLMs)来处理来自不同系统(如 TiDB, BigQuery)的多个表格。AutoTQA 由五个智能体组成:用户智能体接收自然语言查询,规划智能体创建执行计划,工程师智能体执行计划,执行智能体提供执行环境,批判智能体评估结果。此外,我们开发了 LinguFlow,一个开源、低代码的可视化编程工具,用于快速构建和调试基于 LLM 的应用程序。AutoTQA 在四个代表性数据集上展现出色性能,标志着向自主表格问答迈出了重要一步。

Demo Paper 展示

Demo 展示:OSSInsight

  • **时间:**8 月 26 日至 8 月 30 日
  • 摘要:OSSInsight 是由 PingCAP 开发的开源工具,旨在提供对 GitHub 数据的深入洞见。该工具利用可扩展的 HTAP 数据库(TiDB)处理实时和历史的 GitHub 数据。OSSInsight 的主要功能包括一个数据浏览器,允许用户使用自然语言查询 GitHub 数据并将其翻译成 SQL;一个仓库和用户指标服务,生成关键指标的可视化;以及允许用户查看、编辑和执行针对 GitHub 数据的自定义 SQL 查询。在浏览器上将自然语言数据查询转换为 SQL,并使用强化学习来验证结果。OSSInsight 提供了比现有 GitHub 分析工具更多的功能,这些工具通常缺乏实时数据、可视化选项或自定义 SQL 支持。

TPCTC 论文分享

论文分享:StarBench: A Fresh Approach On Star Schema Benchmarking**

**时间:**8 月 30 日,14:30-15:00,Great Hall D1

**摘要:**StarBench 是一种新型的星型模式基准测试,它结合了星型模式数据模型的优势和 TPC-H 基准测试的全面工作负载。StarBench 解决了现有星型模式基准测试(SSB)中存在的数据缺失问题,利用了 TPC-H 的实用工具和工作负载,包括所有 22 个查询和刷新功能,为 TPC-H 提供了一个真正的扩展,并为数据库提供了一种新的方式来处理相同的数据。该基准测试可以用于比较数据仓库中广泛使用的星型模式,评估它们在一系列分析查询中的性能。StarBench 为评估如 TiDB 等数据库系统在星型模式下的性能提供了一个全面和标准化的基准测试框架。

**大会官网:**https://vldb.org/2024/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2080961.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

切换JDK版本

JDK(Java Development Kit)是Java开发工具包,它包含了Java的开发环境和运行环境。JDK是整个Java的核心,包括了Java运行环境(Java Runtime Environment, JRE)、Java工具和Java基础的类库(rt.jar&…

九、枚举和注解

文章目录 一、枚举介绍二、自定义类实现枚举三、enum关键字实现枚举3.1 enum案例3.2 enum关键字实现枚举注意事项3.3 enum常用方法说明3.4 enum实现接口 四、JDK内置的基本注解类型4.1 注解的理解4.2 基本的Annotation介绍4.3 Override4.4 Deprecated4.5 SuppressWarnings 五、…

【性能优化】:设计模式与技术方案解析(二)

引言 在 【性能优化】:探索系统瓶颈的根源(一)文章中,我们已经分析了手动结算的弊端和瓶颈,本文来分析下怎么优化系统性能。 需求分析 既然手动结算耗时费力易出错,那么能不能开发一个**程序自动化处理*…

ARM32开发——(十八)RTC实时时表

1. RTC内置实时时钟 1.1 RTC时钟介绍 RTC是实时时钟(Real-Time Clock)的缩写。它是一种硬件模块或芯片,用于提供准确的日期和时间信息。 GD32F407上有RTC的外设,它提供了一个包含日期(年/月/日)和时间(时/分/秒/亚秒)的日历功能。除亚秒用二进制码显示外,时间和日期都以BCD码…

JSP中的动态INCLUDE与静态INCLUDE:简明对比

JSP中的动态INCLUDE与静态INCLUDE:简明对比 1、静态INCLUDE2、动态INCLUDE3、总结 💖The Begin💖点点关注,收藏不迷路💖 在JSP开发中,页面包含分为动态INCLUDE和静态INCLUDE两种,它们各有特点。…

详细分析Oracle中的ALL_TAB_COLUMNS视图语句

目录 1. 基本知识2. Demo 1. 基本知识 ALL_TAB_COLUMNS 是 Oracle 数据库的一个数据字典视图,用于提供关于数据库中所有可见表的列信息 对于数据库管理、开发和调试非常有用 基本的字段描述如下: 字段名描述OWNER列出表所在的所有者(sche…

神经网络——CIFAR10小实战

1.引子 Sequential的使用:将网络结构放入其中即可,可以简化代码。 找了一个对CIFAR10进行分类的模型。 2.代码实战 from torch import nn from torch.nn import Conv2d, MaxPool2d, Flatten, Linearclass Tudui(nn.Module):def __init__(self):super(T…

SOMEIP_ETS_069: Unaligned_SOMEIP_Messages_overUDP

测试目的: 验证设备(DUT)能够处理在单个UDP包中发送的三个SOME/IP消息,并且即使其中一个SOME/IP消息未对齐,DUT仍能对所有三个请求给出正确的响应。 描述 本测试用例旨在检查DUT在通过UDP协议接收到包含一个未对齐S…

【Pytorch】Linear 层,举例:相机参数和Instance Feaure通过Linear层生成Group Weights

背景 看论文看到这个pipeline,对于相机参数和Instance Fature 的融合有点兴趣,研究如下: Linear 层 Linear 层是最基本的神经网络层之一,也称为全连接层。它将输入与每个输出神经元完全连接。每个连接都有一个权重和一个偏置。…

inflight 守恒算法负反馈解析

终于说到这个话题了。 bbr 不好吗,我自己也做过很多关于 bbr 的仿真验证,现网数据分析以及数学建模,结论均指向 bbr 是一个公平高效且天然不会引发 bufferbloat 的算法,但细节值得商榷: 非理想哑铃拓扑下测量误差的叠…

Dubbo3框架概述

1 什么是分布式系统? 《分布式系统原理与范型》定义: “分布式系统是若干独立计算机的集合,这些计算机对于用户来说就像单个相关系统” 分布式系统(distributed system)是建立在网络之上的软件系统。 简单来说:多个(不同职责)人共同来完成一件事! 任何一台服务器都无法…

Dockerfile+私有仓库

使用Dockerfile创建应用镜像 在Docker file中定义所需要执⾏的指令,使⽤ docker build创建镜 像,过程中会按照dockerfile所定义的内容进⾏打开临时性容器,把docker file中命令全部执⾏完成,就得到了⼀个容器应⽤镜像,每…

PHP-开发工具下载-配置-使用

.1.下载 使用各种人工智能工具推荐的php免费开发工具。 文心一言推荐的工具 讯飞星火的回答 kimi的回答 根据自己的了解,最终选择vscode这款开发工具。 .2.配置 文心一言的回答 讯飞星火的回答 kimi的回答 最终选择使用PHP Debug 插件来支持。 安装中文插件。 …

NASA数据集:MetOp-A ASCAT 第 2 级海洋表面风矢量,针对沿岸海洋进行了优化

MetOp-A ASCAT Level 2 Ocean Surface Wind Vectors Optimized for Coastal Ocean 简介 该数据集包含 MetOp-A 上的高级散射计(ASCAT)以 12.5 公里采样分辨率(注:有效分辨率为 25 公里)进行的近实时 2 级沿岸海面风矢…

实战OpenCV之图像的数学运算

基础入门 在OpenCV中,图像的数学运算是一种基本而强大的工具,可以用于多种图像处理任务,包括:图像增强、图像融合、特征提取等。这些运算包括加法、减法、乘法和除法等基本的数学操作。 加法运算:可以用来合并两个图像…

【JS】卢小姐排队问题(100) |思路参考+代码解析(C++)

题目 LYA 的班级要进行一次班级活动,全班同学按照学号从小到大排成一列。但是卢小姐来晚了,没有来得及排队。现在卢小姐想知道,她应该插入到队列的哪个位置,才能保证队列仍然是按照学号从小到大排列的。请你帮助卢小姐找到她应该…

微服务框架之Kitex

Kitex: 高性能的 Golang 微服务框架 Kitex 是由字节跳动(ByteDance)开发并开源的一款高性能微服务框架,专为构建分布式系统和微服务架构设计。Kitex 基于 Golang,旨在提供一个简单、高效、灵活的开发体验,帮助开发者快…

ST表(区间查询

解决的问题&#xff1a; 数组区间查询最大值和最小值对于解决数组的树状数组的区间修改 ------- 线段树倍增思想 核心代码&#xff1a; #include<bits/stdc.h> using namespace std; const int N1e5; int num[N]; int f[N][N]; int main(){int n;cin>>n;//输入默…

无线通信频率分配

首先看看无线电信号的频谱如何划分&#xff1a; 一、5G NR 3GPP已指定5G NR 支持的频段列表&#xff0c;5G NR频谱范围可达100GHz&#xff0c;指定了两大频率范围&#xff1a; ① Frequency range 1 &#xff08;FR1&#xff09;&#xff1a;就是我们通常讲的6GHz以下频段 频率…

Lesson07---STL简介(了解)

1. 什么是STL 2. STL的版本 3. STL的六大组件 4. STL的重要性 5. 如何学习STL 6.STL的缺陷 1. 什么是STL STL(standard template libaray- 标准模板库 ) &#xff1a; 是 C 标准库的重要组成部分 &#xff0c;不仅是一个可复用的组件库&#xff0c;而且 是一个包罗数据结构与…