全国大数据与计算智能挑战赛是由国防科技大学系统工程学院大数据与决策实验室组织的年度赛事活动,旨在深入挖掘大数据应用实践中亟需破解的能力生成难题、选拔汇聚数据领域优势团队、促进大数据领域的技术创新和面向需求的成果生成、推动形成“集智众筹、联合攻关、共享共用”的研建用一体迭代演进创新模式。
2023全国大数据与计算智能挑战赛以“发榜挑战、集智攻关”为主题,面向全国大数据与计算智能领域的相关单位,围绕自然语言处理、图像检测识别、时空数据分析、知识建模分析等前沿技术难点开设赛道,以“揭榜打擂”的形式组织创研竞赛,通过线上打榜与现场评审相结合的方式决出优势团队。
组织结构
组织单位
国防科技大学系统工程学院(大数据与决策实验室)
挑战赛发起者
黄宏斌 国防科技大学大数据与决策实验室主任
挑战赛筹划委员会
汤 俊 刘丽华 吴继冰 葛 斌
赵 翔 李 璇 王 懋 肖开明
陈海文 曾维新
竞赛平台
DataFountain
赛题介绍
赛题1:Data-To-Text硬约束下的受控文本生成
赛题链接:https://www.datafountain.cn/competitions/633
赛题任务:设计给定关键词的文本生成技术攻关和给定表格的文本生成技术攻关2个课题,难度递增。初赛要求在一组给定顺序的关键词的情况下,生成一段包含所有关键词的文本,生成文本需要具有领域相关性和表达流畅性。复赛要求在给定一个表格的情况下,生成一段包含表格关键信息的文本,生成文本必须忠实于表格,且满足语法使用正确、表达简洁清晰、语义自然连贯的要求。
赛题2:多粒度时序知识图谱问答
赛题链接:https://www.datafountain.cn/competitions/634
赛题任务:以四元组的形式给定一个时序知识图谱,其格式为[头实体 关系 尾实体 时间]。对于给定的每一个自然语言问题,参赛者需要依据时序知识图谱中的信息进行推理与回答,问题中涉及多种粒度的时间信息,以及多种类型的时间约束条件。
赛题3:基于高分辨率遥感可见光数据的细粒度密集船只目标检测任务
赛题链接:https://www.datafountain.cn/competitions/635
赛题任务:基于高分辨率遥感可见光数据的细粒度密集船只目标检测任务要求对船只目标进行定位,并对船只进行型号识别。遥感场景中,细粒度船只类间差距极小、船只分布密集、船只尺度变化大,如何使用检测方法实现高精度细粒度船只识别是本赛题的研究难点。
赛题4:基于传感器信号的航迹实时关联与轨迹融合任务
赛题链接:https://www.datafountain.cn/competitions/636
赛题任务:赛题提供多个多源传感器(2D雷达与ESM传感器)的实时数据,要求参赛者设计合适的模型以辨别不同舰船目标、识别特殊目标以及实时获取舰船经纬度信息,并对同一舰船的轨迹进行融合。同时,需要保证模型的精度与泛化能力。
赛题5:基于亚米级影像的精细化目标检测
赛题链接:https://www.datafountain.cn/competitions/637
赛题任务:本任务属于目标检测领域中的精细化检测识别问题,不同于普通的图像检测识别任务,精细化检测识别任务的类间差异更小,其目的是定位并识别出常规目标中的子类。该任务对于目标检测识别的要求更高,难度更大,同时具有真实场景下广泛的应用价值。
赛题6:领域多事件信息联合抽取
赛题链接:https://www.datafountain.cn/competitions/638
赛题任务:本次竞赛构建领域新闻篇章级事件抽取数据集(FNDEE)并基于该数据集发布领域多事件信息联合抽取挑战,要求基于篇章级文本尽可能独立、完整、准确地抽取多个事件,包括事件的触发词、事件类型、论元及论元角色。此外,为更好地探索抽取出的多事件之间的关联,本次赛题定义交织论元并鼓励关注交织论元的抽取,交织论元即为同一段文本中属于多个不同事件的论元,要求完整抽取隶属于不同的事件并扮演多种论元角色的交织论元。
赛题7:面向低资源和增量类型的命名实体识别
赛题链接:https://www.datafountain.cn/competitions/639
赛题任务:初赛任务为低资源命名实体识别,即给定一个低资源训练集,其中每种实体类型仅涉及50个左右的样本案例,参赛者需要训练一个命名实体识别模型,使其能在规模更大的测试集上取得较好的性能。复赛任务为持续命名实体识别,参赛者需要设计一个系统化的模型,使其能够连续地学习一个实体识别任务序列,其中每个任务拥有独立的数据集,并且每个任务仅涉及一个实体类型。
赛题8:数据集隐私求交技术
赛题链接:https://www.datafountain.cn/competitions/640
赛题任务:本赛题要求参赛者实现隐私求交技术的应用功能。主办方提供4个数据样本,参与方通过隐私求交的算法计算得到两个数据集配对的交集,在整个计算过程中,不能暴露数据样本的原始数据,并且计算结果仅接收方可知。
整体赛程
大赛赛程共计四个月,采用初赛、复赛、决赛的“三级赛制”,具体赛程安排如下:
初赛阶段
-
5月5日,发布大赛赛题,选手可登录大赛官网报名;
-
5月12日,各赛题陆续开放数据下载和作品提交功能,进行第一轮评测;
-
6月25日(12:00),截止报名组队及团队信息修改;
-
6月28日(24:00),截止初赛作品提交,每道赛题遴选决出前30支团队(各赛题数量不同)入围复赛。
复赛阶段
-
6月30日--7月13日,入围复赛的团队进行第二轮评测,根据赛题设线上和线下(国防科技大学系统工程学院)两个赛道进行;
-
7月中下旬,反作弊审核,作品成绩复现,每道赛题遴选决出5支团队入围决赛。
决赛阶段
-
8月,组织线下专家评审,入围决赛团队现场答辩。适时公布优胜队伍,组织颁奖。
*特别提醒:
-
入围决赛团队确定后,决赛团队须指定代表参与现场答辩。
-
赛程时间与遴选入围数量根据实际情况调整,各赛题赛程有所不同,详情请见 赛题报名 模块各赛题规则。
大赛激励
获得第一、二、三等奖的参赛队所属单位将获得定向项目研究经费资助,用以支撑参赛队成员进一步深化和完善参赛成果,攻克相关技术难题。
奖项 | 数量 (每个赛题) | 奖项激励 |
一等奖 | 1支队伍 | 获奖证书 & 获奖团队所属单位将获得定向项目研究经费支持 |
二等奖 | 2支队伍 | |
三等奖 | 2支队伍 |
报名组队
大赛官网:https://www.datafountain.cn/special/BDSSF
参赛对象:来自全国各工业部门、科研院所、高校、民营企业的业内优势团队。
报名要求
-
参赛队须以单位名义报名,同一单位可有多支参赛队。
-
参赛选手可报名多个赛题,但在同一赛题中仅能报名参加一支团队。
-
报名时所有参赛队成员需实名认证,并确保所提供的单位信息、个人基本信息等的真实性。
-
学生参赛者报名须指定至少一名所在单位任职的具有中级职称以上相关领域科研工作者作为团队指导教师。
组队要求
-
所有报名参加同一赛题的参赛者,可在PC端进行组队操作。
-
所有参赛选手应在截止日期前自行完成组队,每队1-5人(含指导教师),不可重复组队。选手需以团队身份提交各阶段的作品材料,一旦进入团队,不可退出队伍。
-
多个单位的参赛者联合组队时,队长所在单位为该参赛队的第一单位。
-
为保证每支参赛团队享有相对平等的提交机会,各赛题组队需满足组队成员在赛题中的提交总次数≤开赛天数*3次。
队长责任制
各团队队长作为团队的负责人,需自行进行团队内部分工和协调,并承担与大赛组委会对接沟通(包括但不限于晋级入围、团队信息收集、作品审核、线下活动等)的责任。
*详细规则以官网内容为准。
八大赛题等你挑战,快来尽展所长吧!
祝大家都能取得好成绩!
—End—