大模型助力学术图谱挖掘!OAG-Challenge @ KDD Cup 2024正式开始

news2024/11/26 16:52:23

如何用大模型推动学术知识图谱挖掘任务?OAG-Challenge @ KDD Cup 2024 邀你来赛!

竞赛网址:https://www.biendata.xyz/kdd2024/

竞赛背景

自 1997 年创办以来,知识发现和数据挖掘会议 ACM SIGKDD 上举办的 KDD Cup 被誉为全球最具影响力和最受欢迎的数据挖掘竞赛之一。KDD Cup 的主题覆盖了众多领域,包括社交网络、大气科学、城市计算、电子商务等。参赛者需要运用数据挖掘和机器学习技术,从大规模数据中发掘规律和模式,以寻找有效的解决方案。

KDD Cup 预计将持续约 3 个月,获奖者将在 KDD 会议开幕式上接受颁奖,并在会议期间的 KDD Cup Workshop 上展示他们的解决方案。

赛题背景

学术数据挖掘的最终目标是加深我们对科学的发展、本质和趋势的理解,从而发掘科学、技术和教育的巨大价值和潜能。例如,从学术数据中进行深度挖掘可以协助政府制定科学政策,支持公司人才发现,并帮助研究人员更高效并有效地获取新知识。

学术数据挖掘包含很多以学术实体为中心的应用,比如论文检索、专家发现和期刊推荐等。然而,学术知识图谱挖掘相关的数据基准的缺乏严重限制了该领域的发展。

在 KDD Cup 2024,清华大学、智谱AI 联合 Biendata 推出 Open Academic Graph Challenge (OAG-Challenge),这是一个由三个现实而具有挑战性的学术任务组成的赛题,旨在推进学术知识图谱挖掘领域的发展。

赛题介绍

OAG-Challenge 目前包括三个任务,旨在评估学术图谱挖掘的不同侧面,试图涵盖学术图谱挖掘领域的代表性任务。首先,我们确定了学术图谱构建过程中有价值且具有挑战性的任务,例如作者姓名消歧(Author Name Disambiguation, AND)。其次,基于构建的学术知识图谱,学术应用关注用户的知识获取和知识之间的认知关联,例如学术问答(Academic Question Answering, AQA)和论文源头追溯(Paper Source Tracing, PST)。

赛道1:同名消歧错误检测(WhoIsWho-IND)

问题定义:给定每个作者的论文列表和论文元数据,目标是检测每个作者档案中错误分配给该作者的论文。

在这里插入图片描述

赛道2:学术问答 (AQA)

问题定义:给定专业问题和候选论文库,目标是检索最相关的论文来回答这些问题。
在这里插入图片描述

赛道3:论文源头追溯(PST)

问题定义:给定每篇论文的全文,目标是自动追溯启发给定论文的最重要的参考文献(命名为“源头论文”)。

在这里插入图片描述

竞赛日程

2024年3月20日:KDD Cup 2024 正式开始
2024年5月31日:组队截止日期
2024年5月31日:公开测试集数据。所有参赛者将有7天的时间提交结果。
2024年6月7日:所有赛道提交截止
2024年6月14日:宣布 KDD Cup 2024 获奖者名单

奖金

每个赛道的奖金均为 10000 美元。

第一名:3000 美元

第二名:2000 美元

第三名:1000 美元

第四至第十一名:500 美元

大模型和API使用

所有赛道均允许使用比赛结束前已开源的预训练模型。

同名消歧错误检测和论文源头追溯任务允许使用 API。在完成一次验证集的有效提交后,每个参赛队伍可以获得 GLM-4 API 100 万 Token 的免费额度。

由于学术问答数据集是从公开问答平台收集的,该任务不允许使用 API。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1554002.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【微服务】Sentinel(流量控制)

文章目录 1.基本介绍1.Sentinel是什么2.Sentinel主要特性3.Sentinel核心功能1.流量控制2.熔断降级3.消息削峰填谷 4.Sentinel两个组成部分 2.Sentinel控制台显示1.需求分析2.下载3.运行1.进入cmd2.输入java -jar sentinel-dashboard-1.8.0.jar3.查看默认端口8080 4.访问1.账号和…

考研数学|《660》完全不会做怎么办?【注意】

很多人有一个误区: 不仅仅是做660题的误区,很多人做其他的习题册都有这个误区,就是以为太依靠答案,如果一道题目做不出来,也不去思考,就直接去看答案怎么做,然后把答案看会了,就认为…

如何利用OpenCV4.9 更改图像的对比度和亮度

返回:OpenCV系列文章目录(持续更新中......) 上一篇:使用 OpenCV 添加(混合)两个图像 下一篇:如何利用OpenCV4.9离散傅里叶变换 ​目标 在本教程中,您将学习如何: 访问像素值用零…

路由的完整使用

多页面和单页面 多页面是指超链接等跳转到另一个HTML文件,单页面是仍是这个文件只是路由改变了页面的一部分结构. 路由的基本使用 使用vue2,则配套的路由需要是第3版. 1)下载vue-router插件 2)引入导出函数 3)new 创建路由对象 4)当写到vue的router后只能写路由对象,因此只…

Git版本管理使用手册 - 8 - 合并分支、解决冲突

合并整个开发分支 切换到本地test分支,选择右下角远程开发分支,选择Merge into Current。然后提交到远程test仓库。 合并某次提交的代码 当前工作区切换成test分支,选择远程仓库中的dev开发分支,选择需要合并的提交版本右击&a…

cmd小黑框——命令行基础语句与实操效果演示

cmd小黑框——命令行学习 初识cmd小黑框cmd命令缩写含义介绍cmd基础操作cmd实操效果演示cmd命令行快捷键 初识cmd小黑框 CMD,全称Command,是Windows系统中自带的一个命令行解释器,它允许用户通过输入命令来对系统进行各种操作。CMD命令在Win…

从运营层面看财务管理:如何做好项目的财务预算

有效的项目运营是企业发展进步的主要活动,企业管理者的项目财务管理主要针对项目财务预算。项目财务预算管理是企业财务管理的一个分支,也是项目财务管理的核心部分,其表现形式为一个综合性的财务计划,主要包括预算编制、报告、执…

SQL Server 实验二:数据库视图的创建和使用

目录 第一关 相关知识 什么是表 操作数据表 创建数据表 插入数据 修改表结构 删除数据表 编程要求 第一关实验代码: 第二关 相关知识 视图是什么 视图的优缺点 视图的优点 视图的缺点 操作视图 创建视图 通过视图向基本表中插入数据 通过视图修改基本表的…

武汉星起航引领跨境电商新潮流,一站式方案助力创业者快速崛起

在跨境电商领域,武汉星起航电子商务有限公司以其独特的一站式解决方案,为众多创业者提供了通往成功的捷径。该公司凭借专业的团队和丰富的经验,为创业者提供全方位的支持,助力他们在跨境电商领域实现快速发展。 随着全球经济的不…

线性规划-非线性规划-非线性规划遗传算法

遗传算法当前获得的最优值作为非线性寻优的初始解,随后进行求解。

从创意立项到产品赚钱的全调优过程复盘,如何提高产品存活率 | TopOn变现干货

10月28日,由TopOn、罗斯基联合主办的“游戏赛道新机会”主题沙龙在成都举办。活动邀请了国内外多位知名公司及游戏爆款产品的负责人分享,分别从各自的方向及经验出发,以数据、案例、产品分析、行业趋势等多个维度,为行业从业者带来…

C++初阶篇----string类

目录 引言标准库中的string类string类的常用接口string类对象的常见构造string类对象的string类对象的访问及遍历string类对象的修改string类非成员函数 引言 什么是string类? string 类是 C 标准库中的一个类,用于处理字符串。它提供了一系列方法来创建…

北斗激光平地机提高农机耕种效率

北斗激光平地机提高农机耕种效率 湖北省浠水县地处大别山南麓,六成左右的田块都分布在丘陵地带,田块小、高低落差大,给机械化作业带来诸多不便。在今年的春耕中,配备北斗智能检测终端的激光平地机很受当地种粮大户追捧。 稻田平整…

超声波清洗机选购指南:眼镜清洗器哪个好?4款眼镜清洗利器推荐

随着科技的发展,现在就是连洗眼镜都有专门的辅助工具了,没错,就是超声波眼镜清洗机!这种超声波清洗机之所以能够做到清洁眼镜,是因为它利用了超声波振动原理,通过水分子爆破瞬间的冲击力对眼镜上面的污垢进…

2024 年广西职业院校技能大赛高职组《云计算应用》赛项样卷

#需要资源(软件包及镜像)或有问题的,可私博主!!! #需要资源(软件包及镜像)或有问题的,可私博主!!! #需要资源(软件包及镜…

Java八股文(设计模式)

Java八股文の设计模式 设计模式 设计模式 什么是设计模式?请列举一些常见的设计模式。 设计模式是软件设计中常用的一种思维模式,它描述了一类具有相似特征和解决思路的问题。 常见的设计模式包括单例模式、工厂模式、观察者模式、装饰器模式等。 请解释…

简单的LAMP部署

目录 一、准备环境 二、安装apache组件 三、安装mysql组件 四、安装php组件 五、浏览器访问 一、准备环境 iptables -F #清空防火墙规则 systemctl stop firewalld #关闭防火墙 setenforce 0 …

IP/TCP--解决为什么电脑连上了有线网就不能再连WIFI【转载】

文章目录 第一种情况:WIFI与有线网在同一网段下1、查看路由信息2、调整跃点数 第二种情况:WIFI与有线网不在同一网段下跃点数概念路由器设置入口 【注意适用情型:需要同时用到内网(不能上公网的内部网络)和互联网。】 …

PyQt5——QFileDialog 打开文件对话框

概述 打开文件对话框是为了让用户可以自己选择要打开的文件,在 PyQt5 里要打开文件对话框可以使用 QFileDialog。 无父类窗口 Python PyQt5 打开文件对话框要使用 QFileDialog.getOpenFileName(),如果没有父类 Widget 的话,QFileDialog.ge…

Webpack常见插件和模式

目录 目录 目录认识 PluginCleanWebpackPluginHtmlWebpackPlugin自定义模版 DefinePlugin的介绍 ( 持续更新 )Mode 配置 认识 Plugin Loader是用于特定的模块类型进行转换; Plugin可以用于执行更加广泛的任务,比如打包优化、资源管理、环境变量注入等 …