kaggle新赛:写作质量预测大赛【数据挖掘】

news2025/1/10 13:53:32

赛题名称:Linking Writing Processes to Writing Quality

赛题链接:https://www.kaggle.com/competitions/linking-writing-processes-to-writing-quality

赛题背景

写作过程中存在复杂的行为动作和认知活动,不同作者可能采用不同的计划修订技术、展示不同的停顿模式或在全过程中策略性地分配时间,这些都可能影响写作质量。过去的研究探索了与停顿、添加删除和修订等行为相关的多种过程特征,但是使用的数据集较小,且只研究了少数特征。

本次竞赛使用键盘日志的数据过程特征来预测总体写作质量,可能识别学习者写作行为与表现之间的关系。鉴于当前写作评估工具主要关注最终产出,这可能帮助学习者关注文本产出过程,增强写作的自主性、元认知意识和自我调节。

赛题任务

本次竞赛的目标是预测写作整体质量。写作方式是否会影响作文结果?参赛者将在一个大规模键盘日志数据集上训练模型,该数据集捕获了书写过程特征。

参赛者的工作将帮助探索学习者的书写行为与书写表现之间的关系,这可能为书写指导、自动书写评估技术和智能辅导系统的发展提供有价值的见解。

评价指标

我们使用均方根误差来评分提交项,定义为:

其中是预测值,是n个实例中每个实例i的原始值。

提交文件

对测试集中的每个id,你必须预测对应的score(参见数据页面的描述)。文件应包含一个表头,格式如下:

id,score
0000aaaa,1.0
2222bbbb,2.0
4444cccc,3.0
...

数据描述

竞赛数据集包含了大约5000份用户输入日志,如键盘和鼠标点击,这些都是在作文过程中捕获的。每篇作文的评分在0到6的范围内。参赛者的目标是根据用户输入日志来预测一篇作文的评分。

文件和字段信息:

  • train_logs.csv - 用于训练的数据输入日志。
    • id - 文章的唯一ID

    • event_id - 事件的索引,按时间顺序排列

    • down_time - 键盘/鼠标按下的时间,毫秒

    • up_time - 键盘/鼠标释放的时间,毫秒

    • action_time - 事件持续时间(down_time和up_time之差)

  • activity - 事件所属的活动类别
    • Nonproduction - 事件不会改变文本

    • Input - 事件向文档添加文本

    • Remove/Cut - 事件从文档中删除文本

    • Paste - 事件通过粘贴输入改变文本

    • Replace - 事件用另一个字符串替换一段文本

  • Move From [x1, y1] To [x2, y2] - 事件将文本从字符索引x1,y1移动到新的位置x2,y2

  • down_event - 键盘/鼠标按下时的事件名称

  • up_event - 键盘/鼠标释放时的事件名称

  • text_change - 事件导致的文本更改(如果有)

  • cursor_position - 事件后文本光标的字符索引

  • word_count - 事件后文档的词数

注意测试集中可能存在训练集中没有出现过的事件。

  • test_logs.csv - 用于测试的数据输入日志。

  • train_scores.csv
    • id - 文章的唯一ID

    • score - 文章的分数(满分6分,预测目标)

  • sample_submission.csv - 正确格式的提交文件示例。

时间安排

  • 2023 年 10 月 2 日 - 开始日期

  • 2024 年 1 月 2 日 - 报名截止日期

  • 2024 年 1 月 2 日 - 合并截止日期

  • 2024 年 1 月 9 日 - 提交截止日期

赛题奖金

排行榜

  • 第一名 - 12,000美元

  • 第二名 - 8,000美元

  • 第三名 - 5,000美元

效率奖

  • 第一名 - 15,000美元

  • 第二名 - 10,000美元

  • 第三名 - 5,000美元

关注下方【学姐带你玩AI】🚀🚀🚀

回复“比赛”获取190+场比赛top方案(kaggle、天池、ccf...)

码字不易,欢迎大家点赞评论收藏!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1082672.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

振弦采集仪应用于隧道安全监测

振弦采集仪应用于隧道安全监测 振弦采集仪是当今必不可少的现代隧道安全监测工具。该设备广泛应用于隧道内部各种安全参数的实时监测,包括但不限于隧道变形、裂缝、压力、温度等。本文详细介绍了振弦采集仪在隧道安全监测中的应用。 首先,我们来了解一下…

nodejs+vue宠物店管理系统

例如:如何在工作琐碎,记录繁多的情况下将宠物店管理的当前情况反应给管理员决策,等等。在此情况下开发一款宠物店管理系统小程序, 困扰管理层的许多问题当中,宠物店管理也是不敢忽视的一块。但是管理好宠物店又面临很多麻烦需要解决,于是乎变得非常合乎时…

科技资讯|微软AR眼镜新专利曝光,可拆卸电池解决续航焦虑

微软正在深入研究增强现实(AR)领域,最近申请了一项“热插拔电池”相关专利。该专利于 2023 年 10 月 5 日发布,描述了采用模块化设计的 AR 眼镜,热插拔电池放置在了镜腿部分,可以直接拿下替换,对…

Linux文件目录总结

众所周知,Linux系统文件目录是树状结构,如下图所示: 英文缩写的目录下到底存放的是什么文件,善于做归纳总结的逍遥哥哥来解释一下: /bin:bin是Binary的缩写,这个目录存放着最经常使用的命令。 …

042:mapboxGL点击某feature点,使其为中心点

第042个 点击查看专栏目录 本示例的目的是介绍演示如何在vue+mapbox中通过鼠标点击某feature点,让其成为中心点。这里用到了click事件和flyTo的方法。 直接复制下面的 vue+mapbox源代码,操作2分钟即可运行实现效果 文章目录 示例效果配置方式示例源代码(共113行)相关API参…

《设计一款2轮车充电桩系统》

以深圳为例,深圳有400万台电动2轮车,以每个月电费20元计算,深圳每个月用在2轮车充电上的费用为8000万左右。1年10个亿的市场规模。 前景可观,竞争也非常激烈。 本文主要讨论技术实现方案。 方法: 24v/36v直流输出 需…

Linux网络和系统管理

网络管理命令 1、ifconfig 命令 作用 ifconfig 命令用于显示或设置网络设备的信息。格式 ifconfig [网卡名字] [参数]可选项 网卡名字:指定要操作的网络设备。参数: up:启动指定网卡。down:关闭指定网卡。-a:显示所有网卡接口的信息,包括未激活的网卡接口。使用示例 1…

至强服务器BIOS/UEFI驱动开发笔记

至强服务器BIOS/UEFI驱动开发笔记 驱动开发基础Hello UEFI Driver 项目选择项目位置初始化驱动代码文件结构驱动程序入口和基本功能导入AMI工程AMI平台Hello UEFI Driver 编译问题测试结果打印设备列表继续开发`HelloWorldSupported`函数依赖配置使用脚本编译编译测试此DXE驱动…

统计子岛屿的数量

统计子岛屿 题目描述 给你两个 m x n 的二进制矩阵 grid1 和 grid2 ,它们只包含 0 (表示水域)和 1 (表示陆地)。一个 岛屿 是由 四个方向 (水平或者竖直)上相邻的 1 组成的区域。任何矩阵以外…

基于SpringBoot的在线试题库系统设计与实现

目录 前言 一、技术栈 二、系统功能介绍 学生管理 教师管理 专业管理 试卷管理 试题管理 考试管理 错题本 考试记录 三、核心代码 1、登录模块 2、文件上传模块 3、代码封装 前言 使用旧方法对作业管理信息进行系统化管理已经不再让人们信赖了,把现在的…

iPhone 如何强制重启

参考iPhone的官方使用手册 传送门 尤其当 iPhone 未响应,也无法将其关机再开机,此方法最有效: 按住调高音量按钮,然后快速松开。按住调低音量按钮,然后快速松开。按住侧边按钮。当 Apple 标志出现时,松开侧…

ODrive移植keil(五)—— 开环控制和电流变换

目录 一、开环控制1.1、控制原理1.2、硬件接线1.3、代码说明1.4、程序演示1.5、程序架构的体现 二、电流变换2.1、理论说明2.2、代码说明 ODrive、VESC和SimpleFOC 教程链接汇总:请点击 一、开环控制 在SimpleFOC系列中有开环控制的教程,SimpleFOC移植S…

Android 免杀教程

免杀练习两年半 目录 msfvenom 自动生成 自带免杀 工具免杀 Thefatrat venom 工具小记 加壳 源码免杀 加壳 源码混淆 数据通信 对抗反编译 反编译工具崩溃 ZIP文件格式对抗 AndroidManifest.xml 对抗反编译小结 VT检测 https://www.virustotal.com/gui/home/up…

Webpack 解决:Error: error:0308010C:digital envelope routines::unsupported 的问题

1、问题描述: 其一、报错为: Error: error:0308010C:digital envelope routines::unsupported 中文为: 错误:错误:0308010C:数字信封例程::不支持 其二、问题描述为: 在项目打包的时候 np…

Mysql-一条查询sql时如何执行的

TOC一条sql是如何执行的 Mysql的基本架构 如图所示,mysql可以分为server层和存储引擎两部分 server层:涵盖着MySQL的大多数核心服务功能,内置函数,存储过程、触发器、视图等存储引擎:数据的存储和提取;支…

K8s Kubernetes Namespave Pod Label Deployment Service 实战

本章节将介绍如何在kubernetes集群中部署一个nginx服务,并且能够对其进行访问。 Namespace Namespace是kubernetes系统中的一种非常重要资源,它的主要作用是用来实现多套环境的资源隔离或者多租户的资源隔离。 默认情况下,kubernetes集群中…

LODOP打印条形码WEB不预览直接打印

一&#xff1a;安装CLodop_Setup_for_Win32NT.exe 二&#xff1a;页面上引用<script src"/JS/LodopFuncs.js"></script> 三&#xff1a;body里加上控件&#xff0c; <body><object id"LODOP1" classid"clsid:2105C259-1E0C-4…

MATLAB算法实战应用案例精讲-【优化算法】树木生长算法(TGA)(附MATLAB代码实现)

前言 Armin Cheraghalipour 根据树木生长的特点于2017 年提出了一种新的元启发式优化算法TGA该算将始定量的群按照解的适应度从高到低排序,分成4组具有不同功能的种群。每次迭代分别进行处理。 算法原理 算法流程图 代码实现 MATLAB TGA.m % "Tree growth algorithm…

STM32:GPIO模拟SPI驱动ADS8361

ADS8361是TI公司开发的一款模拟量输入芯片。ADS8361有四种工作模式&#xff0c;本文主要针对模式三进行通信驱动。官方方案使用两路SPI来通信&#xff0c;一路SPI Master&#xff0c;一路SPI Slave。我在使用STM32主控芯片的两路SPI进行通信的时候&#xff0c;发现只有SPI Mast…

Vuex基础使用存取值+异步请求

一.Vuex简介 vuex是什么&#xff1f; Vuex 是一个专为 Vue.js 应用程序开发的状态管理模式。它采用集中式存储管理应用的所有组件的状态&#xff0c;并以相应的规则保证状态以一种可预测的方式发生变化。 什么情况使用 Vuex&#xff1f; Vuex 可以帮助我们管理共享状态&#…