kaggle新赛:学生摘要评估大赛赛题解析(NLP)

news2024/11/26 14:28:19

赛题名称:CommonLit - Evaluate Student Summaries

赛题链接: https://www.kaggle.com/competitions/commonlit-evaluate-student-summaries/

赛题背景

摘要写作是所有年龄段学习者的一项重要技能。总结可以增强阅读理解能力,特别是在第二语言学习者和有学习障碍的学生中。摘要写作还可以促进批判性思维,这是提高写作能力的最有效方法之一。然而,学生很少有足够的机会练习这项技能,因为对摘要进行评估和提供反馈对教师来说可能是一个耗时的过程。大型语言模型(LLM)等创新技术可以帮助改变这种状况,因为教师可以使用这些解决方案来快速评估摘要。

赛题方向

自然语言处理、回归

赛题任务

本次比赛的目的是评估 3-12 年级学生撰写的摘要的质量。参赛者将构建一个模型,用于评估学生对源文本的主要思想和细节的表达程度,以及摘要中使用的语言的清晰度、准确性和流畅性。你将有权访问一组真实的学生摘要来训练你的模型。

参赛者的工作将帮助教师评估学生作业的质量,并帮助学习平台为学生提供即时反馈。

评估指标

提交使用 MCRMSE 评分,均值按列均方根误差:

N_t是得分的地面实况目标列的数量,并且y和\hat{y}分别是实际值和预测值。

  • 提交文件

对于测试集中的每一个,必须预测两个分析度量中每个值=。该文件应包含标头并具有以下格式:student_id

student_id,content,wording
000000ffffff,0.0,0.0
111111eeeeee,0.0,0.0
222222cccccc,0.0,0.0
333333dddddd,0.0,0.0
...

数据描述

该数据集包括大约 24,000 个由 3-12 年级学生撰写的关于各种主题和体裁的段落摘要。这些摘要在内容和措辞方面都打分。比赛的目标是预测未见过的主题摘要的内容和措辞分数。

文件和字段信息

  • summaries_train.csv - 训练集中的摘要。
    • student_id- 学生作家的ID。

    • prompt_id- 链接到提示文件的提示的 ID。

    • text- 学生总结的全文。

    • content- 摘要的内容分数。第一个目标。

    • wording- 摘要的措辞分数。第二个目标。

  • summaries_test.csv - 测试集中的摘要。包含除 和 之外的所有上述字段。contentwording

  • prompts_train.csv - 四个训练集提示。每个提示都包括给学生的完整总结作业。
    • prompt_id- 链接到摘要文件的提示的 ID。

    • prompt_question- 要求学生回答的具体问题。

    • prompt_title- 提示的简写标题。

    • prompt_text- 完整的提示文本。

  • prompts_test.csv - 测试集提示。包含与上述相同的字段。此处的提示只是一个示例。完整的测试集具有大量提示。

  • sample_submission.csv - 格式正确的提交文件。有关详细信息,请参阅评估页面。

时间安排

  • 2023 年 7 月 12 日- 开始报名。

  • 2023 年 10 月 4 日- 报名截止。

  • 2023 年 10 月 4 日- 团队合并截止。

  • 2023 年 10 月 11 日- 最终提交截止。

竞赛奖金

排行榜奖金

  • 第一名- $12,000

  • 第二名 - $8,000

  • 第三名 - $5,000

  • 第四名 - $5,000

效率奖

  • 第一名 - $15,000

  • 第二名 - $10,000

  • 第三名 - $5,000

关注下方【学姐带你玩AI】🚀🚀🚀

回复“比赛”获取190+场比赛top方案(kaggle、天池、ccf...)

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/770169.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

SOLIDWORKS工程图模板如何设置?

SOLIDWORKS工程图模板是非常重要的,它可以帮助工程师快速创建符合公司规范的工程图纸。本文将介绍SOLIDWORKS工程图模板的基本知识,包括如何创建和使用模板。 一、创建SOLIDWORKS工程图模板 首先,我们需要打开SOLIDWORKS软件,并选…

MySQL高阶语句之二

目录 ​编辑 一、子查询 1.1语法 1.2select 1.3insert 1.3update 1.4delete 1.5 exists 1.6别名as 二、MySQL视图 2.1功能 2.2区别 2.3联系 2.4 创建视图(单表) 2.5 创建视图(多表) 2.6修改原表数据 2.7修改视图数据 三、NULL值 一、子查询 子查询也被称作内查询…

虚拟机ubuntu1804打开联合标定工具箱的步骤(toolkit)

1、运行roscore roscore 2、进入到calibration文件夹打开终端 source devel/setup.bash3、运行rosrun打开即可 rosrun calibration_camera_lidar calibration_toolkit

iview的表格添加筛选功能需要注意的问题

给table的某列添加筛选功能 在table中通过给columns数据的项,设置 filters,可进行筛选,filters 接收一个数组。 然后再指定一个筛选函数 filterMethod 才可以进行筛选,filterMethod 传入两个参数value和 row。 如果指定 filter…

基于异步FIFO的串口回环测试

文章目录 前言一、异步FIFO简介二、串口简介2.1 数据接收模块(RX)2.1 数据发送模块(TX) 三、IP核说明与配置2.1 PLL IP核2.2 FIFO IP核 四、数据关联 前言 当涉及到串口通信的硬件设计和软件开发时,进行有效的测试是至关重要的。串口回环测试是一种常见的测试方法&a…

GSV6201替代方案|CS5466设计资料|CS5466原理图|typec转HDMI_8k方案芯片

GSV6201是一款高性能、低功耗、高性能的,USB Type-C备用模式显示端口1.4至HDMI 2.1转换器。通过集成增强型微控制器,GSV6201创造了一个经济高效的解决方案提供了上市时间优势。显示端口接收机支持高达32.4Gbps(HBR3,4通道&#xf…

美国SaaS管理平台Zluri完成2000万美元的B轮融资

来源:猛兽财经 作者:猛兽财经 猛兽财经获悉,SaaS运营(SaaSOps)平台Zluri今日宣布获得2000万美元的融资,帮助企业管理SaaS资产并降低风险。B轮融资由Lightspeed领投,参与融资的其他投资者包括MassMutual Ventures、End…

python 数学 中负数的取余的区别

😄 今天发现python中负数的取余操作和数学中的是有区别的,在此记录一下。 文章目录 1、python中负数取余:2、数学中负数取余:3、总结:1、python中负数取余: res = a%b, 例子: -5%7=25%-7=-2-5%-7=-5如果a或b是负数,python则是会让商尽可能的小(即采用的是向下取整的方…

JVM中的堆和栈到底存储了什么

JVM数据区 先上一张Java虚拟机运行时数据区中堆、栈以及方法区存储数据的概要图,如下所示: 然后我们来具体解析一下堆和栈 堆 堆是存储时的单位,对于绝大多数应用来说,这块区域是 JVM 所管理的内存中最大的一块。线程共享&#…

用java实现死锁,并且判断是否产生

目录 锁的概念 锁在多线程环境中的作用是: 在Java中,常见的锁机制有以下几种: 形成死锁的条件 用java写一个死锁 如何避免死锁? 锁的概念 首先我们要明确锁是什么,在Java语言中,锁(Lock&…

think-on-graph: 基于知识图谱的大模型推理

概述 本文的研究背景是大规模语言模型在复杂推理任务中存在困难并展示了较低的性能,特别是在需要知识的追溯能力、及时性和准确性的场景中。 过去的方法主要面临两个问题:推理不负责任容易生成虚构或带有有害文本,以及模型在预训练阶段无法…

个人号的微信API接口,微信机器人二次开发

前段时间应公司需求,要开发一套自定义的微信机器人,具体需求是可以自己批量添加好友、批量打标签等进行好友管理,社群管理需要自动聊天,自动回复,发朋友圈,转发语音,以及定时群发等,…

visio 图片转换到 latex 中

调整图片大小 在Visio中,设计–>页面设置–>大小–>适应绘图,这样会自动去除多余空白,保留部分空白作为边界,无需使用Word。 2. 将新的Visio文件另存为pdf格式文件 3. latex 中插入pdf 格式图片

Python 算法基础篇之数组和列表:创建、访问、添加和删除元素

Python 算法基础篇之数组和列表:创建、访问、添加和删除元素 引用 1. 数组的概念和创建2. 列表的概念和创建3. 访问数组和列表中的元素4. 添加和删除元素 a ) 添加元素 b ) 删除元素 总结 引用 在算法和数据结构中,数组和列表是常见的数据结构&#xff…

MySQL备份与还原/索引/视图

MySQL备份与还原/索引/视图练习 文章目录 一、备份与还原1、使用mysqldump命令备份数据库中的所有表2、备份booksDB数据库中的books表3、使用mysqldump备份booksDB和test数据库4、使用mysqldump备份服务器中的所有数据库5、使用mysql命令还原第二题导出的book表6、进入数据库使…

Spring Cloud+Spring Boot+Mybatis+uniapp+前后端分离实现知识付费平台

Java版知识付费-轻松拥有知识付费平台 多种直播形式,全面满足直播场景需求 公开课、小班课、独立直播间等类型,满足讲师个性化直播场景需求;低延迟、双向视频,亲密互动,无论是互动、答疑,还是打赏、带货、…

简单了解UML类图

前言 大话设计中,多次使用UML类图来表示,并也给了基本的介绍,这里从书中选出UML图和代码做成笔记,以方便查找。 1、类 注意前面的符号: :public -:private #:protected 抽象类&…

华为认证 | 存储专家HCIE-Storage V3.0 正式发布!

华为认证存储专家HCIE-Storage V3.0(中文版)自2023年7月13日起,正式在中国区发布。 01 发布概述 基于“平台生态”战略,围绕“云-管-端”协同的新ICT技术架构,华为公司打造了覆盖ICT领域的认证体系,包含IC…

秋招LeetCode刷题Day1 -- 前缀树专题

一个人的朝圣 — LeetCode打卡第 天 知识总结 Leetcode 208. 实现 Trie (前缀树)题目说明代码说明 Leetcode 211. 添加与搜索单词 - 数据结构设计题目说明代码说明 Leetcode 648. 单词替换题目说明代码说明 知识总结 今天重新学习了一下前缀树以及相关的知识 Leetcode 208. 实…

2023-07-19 平面坐标下判断三角形以及输出周长和面积

平面坐标下判断三角形以及输出周长和面积 前言一. 基本知识总结 前言 平面坐标下判断三角形以及输出周长和面积, 用线性代数的简单知识. 一. 基本知识 在平面坐标, 三个点就是三个向量, 可以通过两个向量同时减去第三个向量, 形成一个顶点在原点的三角形. 我们发现, 只有一种…