记录一次“top负1”比赛经历

news2024/9/27 15:30:46

获奖啦!

比赛题目:中文语义病句识别与纠正挑战赛
比赛链接:https://challenge.xfyun.cn/topic/info?type=identification-and-correction&option=phb

“请介绍你们团队”

“各位评委老师,我是来自WOT团队的选手AMBT,口号是将中文语义病句识别与纠正提升到新高度”

“你们参加比赛的初衷是什么?”

“为了中文自然语言处理崛起而奋斗”

“请AMBT务实一点”

“为了参赛拿奖金买坦克”

“请介绍你们解决问题的思路”

“我们将中文语义病句识别与纠正分成【识别】与【纠正】两个流水线任务,先识别出哪些是病句,然后对病句进行修正。识别是否病句基于传统预训练模型+是否为病句进行二分类微调,修正基于端到端以及LLM进行微调,生成病句纠正之后的正确句子”

文字过多,下面直接贴图了:

“你们比赛思路确实很全面,恭喜你们团队获得第一”

醒醒吧!

某日下午,“叮叮叮”,“叮叮叮”,“叮叮叮”,扭头一看桌面上手机响了,接了电话。

“请问你是来自中文语义病句识别与纠正挑战赛的top1团队是吧”

“对,请问你是”

“赛题方审核结果是存在违规使用其他标注数据行为,直接取消比赛成绩”

“请问赛题方检测出什么了”

“你们使用了2022年数据的标注”

后来扯皮了很久,后来苦苦婆心解释了一达通,就是直接取消成绩,对,就是这么残忍。

因为比赛规则里面确实规定了禁用额外标注数据,主办方说取消成绩也只能强忍头皮认了。

感触!

  • 为什么会使用2022年的数据。

一个是没注意到比赛规则。另外一个就是大家可以翻一番这两个比赛任务和主办方是一样的,所以一开始做任务1的时候就理所当然用了去年数据:
2023年比赛链接:https://challenge.xfyun.cn/topic/info?type=identification-and-correction&option=phb
2022年比赛链接:https://challenge.xfyun.cn/topic/info?type=sick-sentence-discrimination


为什么有同样格式的、同样比赛任务、同样出题方的数据,能提升效果为啥不能用呢?是学术倒退还是野鸡反噬?是选手眼瞎还是规则严厉?

都不是!可能就是太“理所当然了”,太小看一个国内比赛剧本精彩程度了!

自己在复现方案里面如实提到了,也不是故意使用的,下面就是提交的复现说明。后来和他们沟通,重新跑一次没有使用去年数据的模型提交也不行,就是直接取消成绩!主办方应该是从这里看到的吧。

  • 主办方与选手的关系

主办方到底有没有认真去复现选手的代码?

结合以往经历选手辛苦准备的从1GB到20GB代码和权重有没有去看过,更有甚者选手准备的百度云文件他们下载次数为0?

主办方确实可以拿着一个规则否定选手几个月的付出,这个时候选手略显苍白无力

你在键盘巧了几百字,几十行微信消息,可能被别人搪塞一句“我和主办方沟通了,确实不行”,其实是不是她下班回家,懒的管你?

  • 选手应该怎么保护自己呢

仔仔细细看好规则,在规则下玩比赛。

野鸡有野鸡的玩法,用平常心态对待比赛,不要拿Kaggle视角对待国内比赛

记录证据,比赛和微信等相关,互联网是有痕迹的?

国内比赛还是挺香的,恰钱是不是挺香的,权衡利弊下好好想想怎么做到高性价比

比赛过程中的隐性利益冲突很多,学会躲避

国内倒霉蛋!

记一次很有趣的数据挖掘竞赛答辩经历

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/929705.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Python|爬虫和测试|selenium框架的安装和初步使用(一)

前言: Python作为一门胶水语言来说,可以说是十分的优秀,什么事情都可以干,并且在某些领域还能干的非常不错,尤其是在爬虫和测试领域,该语言可以说是没有对手。 这么说的原因是因为如果你要使用爬虫爬取某…

4.网络设计与redis、memcached、nginx组件(二)

系列文章目录 第四章 网络设计与redis、memcached、nginx组件(一) 第五章 网络设计与redis、memcached、nginx组件(二) 文章目录 系列文章目录[TOC](文章目录) 前言一、reactor模型?二、Reactor 开发1.建立连接 三、典型reactor 模型单reactor 模型典型 readisradi…

C++避坑——most vexing parse问题

1."坑"的问题是什么&#xff1f; 先看一段代码&#xff1a; class Functor { public:void operator()(){std::cout << "我是线程的初始函数" << std::endl;} };int main() {std::thread t(Functor());// 强制高速编译器这是一个构造函数!t.j…

Linux:权限

目录 一、shell运行原理 二、权限 1.权限的概念 2.文件访问权限的相关设置方法 三、常见的权限问题 1.目录权限 2.umsk(权限掩码) 3.粘滞位 一、shell运行原理 1.为什么我们不是直接访问操作系统&#xff1f; ”人“不善于直接使用操作系统如果让人直接访问操作系统&a…

lnmp架构-nginx

6.nginx基础配置 证书 重定向&#xff08;80重定向到443&#xff09; 当访问http时 直接到 https 自动索引&#xff1a; 下载方便 Nginx缓存配置 &#xff1a;缓存可以降低网站带宽&#xff0c;加速用户访问 日志轮询 禁用不必要的日志记录 以节省磁盘IO的消耗 监控的信息 监…

基于Android的垃圾分类系统 微信小程序 uniapp

随着网络科技的发展&#xff0c;移动智能终端逐渐走进人们的视线&#xff0c;相关应用越来越广泛&#xff0c;并在人们的日常生活中扮演着越来越重要的角色。因此&#xff0c;关键应用程序的开发成为影响移动智能终端普及的重要因素&#xff0c;设计并开发实用、方便的应用程序…

多态(C++)

多态 一、初识多态概念“登场”1>. 多态的构成条件2>. 虚函数3>. 虚函数重写&#xff08;覆盖&#xff09;4>. 虚函数重写的两个例外1. 协变 一 基类和派生类虚函数返回值类型不同2. 析构函数重写&#xff08;基类和派生类析构函数名不同&#xff09; 小结 二、延伸…

JavaScript函数调用其他函数

在JavaScript中&#xff0c;函数可以调用其他函数。这通常被称为函数组合&#xff0c;它允许你通过将较简单的函数组合在一起来创建更复杂的功能。 例如&#xff1a;还是以之前的水果加工举例&#xff0c;但是现在我们需要输出&#xff0c;这个苹果有几块&#xff0c;橘子有几块…

微信小程序分享后真机参数获取不到和部分参数不能获取问题问题解决

微信小程序的很多API&#xff0c;都是BUG&#xff0c;近期开发小程序就遇到了分享后开发工具可以获取参数&#xff0c;但是真机怎么都拿不到参数的问题 一、真机参数获取不到问题解决 解决方式&#xff1a; 在onLoad(options) 中。 onLoad方法中一定要有options 这个参数。…

【论文解读】基于图的自监督学习联合嵌入预测架构

一、简要介绍 本文演示了一种学习高度语义的图像表示的方法&#xff0c;而不依赖于手工制作的数据增强。论文介绍了基于图像的联合嵌入预测架构&#xff08;I-JEPA&#xff09;&#xff0c;这是一种用于从图像中进行自监督学习的非生成性方法。I-JEPA背后的idea很简单&#xff…

博客写作神器:介绍与部署Markdown Nice

作为开发者和写作者&#xff0c;我们经常需要使用Markdown来编写文档、博客和技术文稿。然而&#xff0c;标准的Markdown格式可能显得有些普通&#xff0c;缺乏一些专业的排版效果。在这里&#xff0c;我们将向你介绍一个强大的工具——Markdown Nice&#xff08;mdnice&#x…

Android中的APK打包与安全

aapt2命令行实现apk打包 apk文件结构 classes.dex&#xff1a;Dex&#xff0c;即Android Dalvik执行文件 AndroidManifest.xml&#xff1a;工程中AndroidManifest.xml编译后得到的二进制xml文件 META-INF&#xff1a;主要保存各个资源文件的SHA1 hash值&#xff0c;用于校验…

开始MySQL之路——MySQL安装和卸载

MySQL的介绍 MySQL数据库管理系统由瑞典的DataKonsultAB公司研发&#xff0c;该公司被Sun公司收购&#xff0c;现在Sun公司又被Oracle公司收购&#xff0c;因此MySQL目前属于Oracle旗下产品。 MySQL所使用的SQL语言是用于访问数据库的最常用标准化语言。MySQL软件采用了双授权…

使用VSCode SSH实现公网远程连接本地服务器开发的详细教程

文章目录 前言1、安装OpenSSH2、vscode配置ssh3. 局域网测试连接远程服务器4. 公网远程连接4.1 ubuntu安装cpolar内网穿透4.2 创建隧道映射4.3 测试公网远程连接 5. 配置固定TCP端口地址5.1 保留一个固定TCP端口地址5.2 配置固定TCP端口地址5.3 测试固定公网地址远程 前言 远程…

什么是Sui Kiosk,它可以做什么,如何赋能创作者?

创作者和IP持有者需要一些工具帮助他们在区块链上实现其商业模式。Sui Kiosk作为Sui上的一种原语可以满足这种需求&#xff0c;为创作者提供动态选项&#xff0c;使他们能够在任何交易场景中设置完成交易的条件。 本文将向您介绍为什么要在SuiFrens中使用Sui Kiosk&#xff0c…

数据结构与算法细节篇之最短路径问题:Dijkstra和Floyd算法详细描述,java语言实现。

文章目录 前言一、单源最短路径1、单源最短路径问题2、Dijkstra 初始化a、参数b、初始化参数c、算法步骤 3、Dijkstra 算法详细步骤a、第一轮算法执行b、第二轮算法执行c、第三轮算法执行d、第四轮算法执行e、第五轮算法执行f、第六轮算法执行 4、java算法实现 二、多源最短路径…

怎么把pdf转换成jpg格式?

怎么把pdf转换成jpg格式&#xff1f;在我们日常的办公过程中&#xff0c;PDF文件是一个经常被使用来传输文件的格式。它能够确保我们的文件内容不会混乱&#xff0c;并以更加完美的方式呈现出来。然而&#xff0c;PDF文件也存在一些缺陷。例如&#xff0c;它无法直接编辑&#…

Win10下CCS v5.2.1编译错误Fatal error: could not open source file问题记录

Win10下CCS v5.2.1编译错误Fatal error: could not open source file问题记录 1.问题现象 作者在Win 10系统中使用CCS v5.2.1进行DSP C6678开发&#xff0c;由于更换了新的电脑&#xff0c;所以重新配置了开发环境&#xff0c;但是编译出现错误。输出如下&#xff1a; **** …

网关认证的技术方案

我们认证授权使用springsecurity 和oauth2技术尽心实现具体实现流程见第五章文档&#xff0c;这里就是记录一下我们的技术方案 这是最开始的技术方案&#xff0c;我们通过认证为服务获取令牌然后使用令牌访问微服务&#xff0c;微服务解析令牌即可。但是缺点就是每个微服务都要…

Hystrix: 服务降级

cloud是基础&#xff0c;eureka是服务注册和发现&#xff0c;consumer是消费者去消费provider里的东西&#xff0c;消费方式就是Feign和Ribbon&#xff0c;feign 接口消费&#xff0c;ribbon Rest消费 服务降级发生在客户端&#xff0c;客户端因为请求关闭的服务器&#xff0…