2016年,教育部高等学校计算机类专业教学指导委员会、教育部高等学校软件工程专业教学指导委员会、教育部高等学校大学计算机课程教学指导委员会、全国高等学校计算机教育研究会联合创办了“中国高校计算机大赛”(China Collegiate Computing Contest,简称C4),目前“中国高校计算机大赛”继续由全国高等学校计算机教育研究会主办。大数据挑战赛是其中的一项重要赛事,在2018-2022年期间均入选全国普通高校学科竞赛排行榜,获得社会各界的高度关注和广泛好评。
2023中国高校计算机大赛——大数据挑战赛(以下简称“大赛”)由清华大学和大数据系统软件国家工程研究中心联合举办,由云智慧(北京)科技有限公司协办,由上海和今信息科技有限公司提供竞赛平台支持。本次大赛是以企业真实场景和实际数据为基础、面向全球开放的高端算法竞赛。大赛旨在通过竞技的方式,提升人们对数据分析与处理的算法研究与技术应用能力,探索大数据的核心科学与技术问题,尝试创新大数据技术,推动大数据的产学研用。
01
参赛对象
本次大赛面向全球开放,不限年龄国籍,高等院校在校学生(包括高职高专、本科、研究生)以及科研机构和企业从业人员均可参赛。具体要求如下:
可以自由组队参赛,具体组队要求见报名&组队的相关说明;
参赛选手应保证报名信息真实准确有效,如队伍中的选手信息不符合要求,组委会有权取消整个队伍的参赛资格及奖励。
为了保证大赛的公平性,大赛主办和协办支持单位如有机会接触赛题和相关数据的人员不允许参赛。
02
赛制说明
本次大赛分为报名&组队、初赛、复赛和决赛等四个阶段,其中初赛阶段由参赛队伍下载数据在本地进行算法设计和调试,并通过大赛指定平台提交结果文件;复赛阶段要求参赛队伍在大赛指定平台上在线提交相关模型文件,测评系统将自动评测得分并同步更新至排行榜;决赛要求参赛者进行现场演示和答辩。
1.报名&组队(6月9日−7月18日)
参赛选手须在大赛官网或“可赛”小程序上报名并且组队参赛(即使单人参赛也要组建单人队伍),大赛不收取任何报名费用。
大赛报名小程序“可赛”
大赛报名系统开放时间为北京时间2023年6月9日10:00,截止时间为北京时间2023年7月18日12:00。
报名方式:登录比赛官网,在大赛小程序上完成个人信息注册和报名;
每个选手在本赛道只能参加一支队伍,可单人成队或2-3人组队参赛;
大赛官方渠道主要包括:
大赛官网:http://nercbds.tsinghua.edu.cn/bdc
大赛小程序:可赛
大赛邮箱:data@tsinghua.edu.cn
大赛QQ群:762146461 / 901317172
报名截止之后,不再允许添加或更改任何队伍成员。如有中途退出情况,只允许在参赛队伍内部更换队长或删除队员,参赛队伍应在决赛开始前向大赛组委会提交成员更换申请,由参赛队伍全部成员签名或邮件同意,经由大赛组委会审核后变更生效。
2.初赛(6月20日−7月19日)
参赛队伍可从大赛指定网站下载数据,在本地进行算法调试,并在线提交结果。若参赛队伍在一天内多次提交结果,新结果版本将覆盖旧版本。
6月20日12:00开始,竞赛平台提供初赛的训练数据,用于参赛队伍训练模型以及制定预估策略;同时平台提供测试数据,用于参赛队伍在比赛中的模型评估和排名。
初赛采用Public-Private榜与实时测评方式,即测试数据中包含了Public排行榜、Private排行榜所采用的数据样本,Public榜测试集与Private榜测试集分布相同,具体分配情况不公开,用于每个队伍评分采用的是相同分配。选手可根据实时更新的Public榜单成绩优化模型,最终有效排名以Private榜为准。
6月20日12:00 – 7月19日20:00,每个参赛队伍拥有每天2次提交与测评排名的机会,系统立即评测并返回Public成绩。排行榜将选择参赛队伍在本阶段的历史最优Public成绩进行排名展示,实时更新排行榜。
在7月19日20:00之前,每个参赛队伍可以从自己的有效提交里,选择2个觉得兼顾了泛化性能与模型评分的提交记录进入Private榜测评。若选手在提交截止时间前没有选择提交到Private榜的提交记录,平台将自动选择选手在Public榜上最高一次得分所对应的提交记录进入 Private榜测评。
初赛结束后,Private榜成绩的TOP100队伍提交代码审核,要求详见“代码规范”文档,代码提交截止时间是7月23日21:00。
组委会将审核并取消存在人工标注以及违反比赛规定等行为队伍的比赛资格,晋级复赛的空缺名额后补。对于初赛成绩符合要求且通过实名认证的参赛队伍,排名前65名的参赛队伍以及排名在66-100之间前15支学生队伍将进入复赛,所有通过审核的队伍将获得初赛名次证书。
3.复赛(7月27日−8月16日)
团队在线提交相关模型文件,测评系统将自动评测得分并同步更新至排行榜。排行榜将记录选手的最高成绩,参赛团队必须自行保存最高成绩作品的源代码以备审核。
复赛采用Public-Private榜与实时测评方式:
7月27日12:00 – 8月16日20:00,每个队伍拥有每天2次提交模型文件参与评测的机会,评测完成之后返回Public成绩。排行榜将选择参赛队伍在本阶段的历史最优Public成绩进行排名展示,实时更新排行榜。参赛团队必须自行保存最高成绩的源代码以备审核。
在8月16日20:00之前,每个参赛队伍可以从自己的有效提交里,选择2个觉得兼顾了泛化性能与模型评分的提交记录进入Private榜测评。若选手在提交截止时间前没有选择提交到Private榜的提交记录,平台将自动选择选手在Public榜上最高一次得分所对应的提交记录进入 Private榜测评。
复赛截止时间是8月16日20:00,所有团队需提交代码审核。组委会将审核并剔除存在人工标注、相互抄袭、未提交代码、结果无法复现以及其他违规等问题队伍。
在TOP20且通过代码审核的队伍中,单独排名第一名和第二名的在校学生队伍直接晋级决赛,其余队伍按照复赛成绩排在前四名的队伍晋级决赛。
4.决赛(8月26-27日)
决赛将以现场答辩会的形式在北京举行,具体要求和安排另行通知。受邀参加决赛的选手在决赛期间的食宿由大赛组委会安排,往返交通费及其他费用自理。
03
奖项设置
大赛的奖金池总额为20万元人民币,所有奖金均为税前金额。
1.初赛奖项
初赛TOP100且通过代码审核的团队将颁发初赛名次证书,此项奖励以大赛官网初赛最终排行榜为准。
2.复赛与决赛奖项
此项奖励以大赛官网复赛最终排行榜和决赛结果为准。
3.在校学生队伍奖项
在校学生队伍要求所有参赛队员必须全部为在校学生,如果队伍中有一名在职人员,则整个队伍视为在职人员队伍。其中中国大陆在校学生提供学信网的教育部学籍在线验证报告编号进行身份验证,其余学生提供相关在读证明进行身份验证,在校学籍以2023年5月31日为准。
此奖项仅颁发给进入复赛的在校学生队伍,要求队伍通过复赛代码审核,并根据在校学生队伍复赛成绩的单独排名结果进行颁发。
4.周周星
在初赛阶段,设立周周星奖励。从初赛第二周开始,以每周一中午12点的排行榜为准,分别取在校生队伍的第一名和在职队伍的第一名发放周周星纪念礼物。对于前面已经获得周周星的队伍,不重复发放,名额按名次顺延。
5.其他激励
清华科研实习机会:决赛队伍的在校学生以及在校学生队伍单独排名前5名队伍的在校学生,将获得参与清华大学软件学院大数据方向科研项目的学术研究和实习机会,具体细则另行通知。
企业招聘绿色通道:复赛排名前20队伍的在校学生以及在校学生队伍单独排名前10名队伍的在校学生,将获得2023年云智慧公司的校园招聘和实习招聘绿色通道资格,具体细则另行通知。
关注微信公众号“数据派THU”,后台回复“20230609”,即可获取“赛题描述”
直播预告
中国高校计算机大赛2023大数据挑战赛 启动会
6月15日 16:30直播
微信扫码预约
扫码关注数据派THU
了解大数据相关研究和大赛动态