智赋百景|2023-2024年福建省大数据集团数据应用开发大赛重磅开赛!

news2025/2/1 15:35:58

为推动数据要素赋能千行百业,拓展自然语言处理技术在不同业务场景下的落地应用,进一步实现“智赋百景”,由福建省大数据集团有限公司主办,福建大数据一级开发有限公司、福建大数据交易有限公司、福建省数字经济产业工会共同承办的2023-2024年福建省大数据集团数据应用开发大赛——自然语言处理智能算法赛道——智能文本纠错赛”于2023年12月15日正式开赛。

赛题背景

随着人工智能技术不断发展,ChatGPT的出现极大降低了内容生产的门槛。当下已经进入了一个“万物皆可生成”的时代,网络上海量的文本内容迅速涌现。不同于传统媒体,网络上文本内容由于来源多样、审核困难,存在着很多的文本错误和违规违法内容。自然语言处理作为人工智能领域皇冠上的“明珠”,文本纠错作为自然语言处理基础的一个应用模块,是实现语句自动检查、自动纠错的一项重要技术。此技术在各种领域皆有应用,在公文、新闻、财报中都有较好的落地应用价值,其重要程度不言而喻。

​赛题任务

本次赛题着力于社会、政府、企业、经济数字化转型切实需求和实际问题,挖掘智能算法应用,有效解决数字时代发展所遇问题,聚焦智媒与文化领域文本数据,主要应用于媒体内容生产等场景,从中检测错误并纠正,提示修改建议。助力推动数字文化建设和智媒科技领域创新发展。

​数据简介

本赛题提供测试集及少量训练集,会在数据开放下载后陆续公布,总体为低资源的竞赛任务。数据集包含训练集和测试集,训练集用于选手的模型训练,测试集用于最终结果的评测提交。数据样例如下:训练集包含三个字段:id,语句,修改后的语句:

测试集包含三个字段:id,语句,分词后的语句(选手仅需提供id和text列即可,详见提交样例)

本次比赛为低资源的,拟提供训练集4000句,测试集分AB测试集,各3000句。

​​赛程安排

大赛采取线上比赛、线下颁奖的模式。选手于大赛官方网站( datacontest.fjbdg.com.cn ) 报名、组队、提交作品测评。参赛团队根据赛题、数据完成线上提交,获取排行榜客观分数成绩。

赛程安排如下:

2023年12月8日 10:00 - 2024年2月24日 16:00:A榜阶段

2024年2月25日 10:00 - 2024年2月26日16:00:B榜阶段

初审阶段2024年2月27日 00:00 - 2024年2月29日 23:59:选手提交模型源代码进行代码审核,择优选拔10支团队晋级决赛。

初赛结果公布2024年3月1日 10:00决赛阶段2024年3月2日 - 2024年4月6日,地点及形式等具体信息待公告

(以上赛程将根据实际情况进行调整)


组织架构

主办单位

福建省大数据集团有限公司

承办单位

福建大数据一级开发有限公司

福建大数据交易有限公司

福建省数字经济产业工会


报名参赛

本次大赛面向社会各界开放,欢迎全国高校大学生、科技行业从业者和自然语言处理爱好者等登录官方网站(datacontest.fjbdg.com.cn )报名参赛。

点击链接直达赛事官网

福建省大数据集团数据应用开发大赛 (fjbdg.com.cn)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1329311.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【小白专用】php以pdo方式连接sqlserver,开启sqlsrv扩展

一、安装ODBC程序, 下载适用于 SQL Server 的 ODBC 驱动程序 - 适用于 SQL Server 的 ODBC 驱动程序 |Microsoft 学习 运行安装程序,出现如下图所示页面; 选择下一步;选择我同意许可协议中的条款后选择下一步; 点击安…

告别高昂存储,高效灵活管理数据

前言 在当今数字化时代,企业面临着海量数据的挑战,这些数据承载着技术创新和业务发展的重要使命。因此,高效、安全地收集、存储和管理数据成为了企业关注的焦点。对于需要长期储存且低频聚合分析的数据,组织需要更加低成本和便捷…

Android平台RTSP流如何添加动态水印后转推RTMP或轻量级RTSP服务

技术背景 我们在对接外部开发者的时候,遇到这样的技术诉求,客户用于地下管道检测场景,需要把摄像头的数据拉取过来,然后叠加上实时位置、施工单位、施工人员等信息,然后对外输出新的RTSP流,并本地录制一份…

Java中使用JTS实现WKB数据写入、转换字符串、读取

场景 Java中使用JTS实现WKT字符串读取转换线、查找LineString的list中距离最近的线、LineString做缓冲区扩展并计算点在缓冲区内的方位角: Java中使用JTS实现WKT字符串读取转换线、查找LineString的list中距离最近的线、LineString做缓冲区扩展并计算点在缓冲区内…

PlatEMO 源码执行的具体过程

ALGORITHM 类 Algorithm类定义在Algorithms文件夹下。在这个目录中,算法根据分类分成了三种: 多目标算法:Multi-objecitve optimization单目标算法:Single-objective optimization工具算法:Utility functions 工具算法…

系统架构设计师教程(九)软件可靠性基础知识

软件可靠性基础知识 9.1 软件可靠性基本概念9.1.1 软件可靠性定义9.1.2 软件可靠性的定量描述9.1.3 可靠性目标9.1.4 可靠性测试的意义9.1.5 广义的可靠性测试与狭义的可靠性测试 9.2 软件可靠性建模9.2.1 影响软件可靠性的因素9.2.2 软件可靠性的建模方法9.2.3 软件的可靠性模…

02 特征点提取器 ORBextractor

文章目录 02 特征点提取器 ORBextractor2.0 基础知识2.0.1 图像金字塔2.0.2 ORB 特征点的关键点和描述子 2.1 构造函数:ORBextractor()2.2 构建图像金字塔 ComputePyramid()2.3 提取特征点并筛选 ComputeKeyPointsOctTree()2.4 筛选特征点 DistributeOctTree()2.5 计…

C++实现布隆过滤器

目录 一、什么是布隆过滤器 二、布隆过滤器的映射 三、布隆过滤器的作用 四、布隆过滤器的实现 五、总结测试 一、什么是布隆过滤器 之前我们学习了位图,我们知道位图主要是实现了整形的映射bit位,这样可以大幅度的节省空间,那么针对于…

【笔记】Spring是什么

什么是spring&#xff1f; Spring的基础知识铺垫 IOC AOP<-Spring->容器->生态 先说你的认知&#xff0c;总-分结构 spring是一个基础的框架&#xff0c;同时提供了Bean的容器&#xff0c;用来方便装载具体的Bean对象&#xff0c;之前在使用对象的时候必须自己new&…

代码随想录第三十八天(一刷C语言)|零钱兑换II组合总数和 IV

创作目的&#xff1a;为了方便自己后续复习重点&#xff0c;以及养成写博客的习惯。 一、零钱兑换II 思路&#xff1a;参考carl文档 1、确定dp数组以及下标的含义&#xff1a;凑成总金额j的货币组合数为dp[j]。 2、确定递推公式&#xff1a;dp[j] 就是所有的dp[j - coins[i…

中国ESG的新故事:主动、常态与变革

ESG的终局不仅仅是与业务的结合&#xff0c;而是需要将ESG 融入企业价值内核&#xff0c;实现社会价值与商业价值的深度融合&#xff0c;即有意义地盈利。 作者|斗斗 编辑|皮爷 出品|产业家 “到这里来吧&#xff0c;我将帮你们获得这个世界。我的文明已无力解决自己的…

微服务之配置中心与服务跟踪

zookeeper 配置中心 实现的架构图如下所示&#xff0c;采取数据加载到内存方式解决高效获取的问题&#xff0c;借助 zookeeper 的节点监听机制来实现实时感知。 配置中心数据分类 事件调度&#xff08;kafka&#xff09; 消息服务和事件的统一调度&#xff0c;常用用 kafka …

pytorch张量的创建

张量的创建 张量&#xff08;Tensors&#xff09;类似于NumPy的ndarrays &#xff0c;但张量可以在GPU上进行计算。从本质上来说&#xff0c;PyTorch是一个处理张量的库。一个张量是一个数字、向量、矩阵或任何n维数组。 import torch import numpy torch.manual_seed(7) # 固…

linux系统和网络(二):进程和系统时间

本文主要探讨linux系统进程和系统相关知识&#xff0c;本博客其他博文对该文章的部分内容有详细介绍 main函数 int main(int argc,char *argv[],char *envp[]); 操作系统下main执行前先执行引导代码,编译连接引导代码和程序连接在一起构成可执行程序,加载器将程序加载到内存中…

react 2

1.快速搭建开发环境 2.react渲染流程 3.1 jsx基础 概念 3.2 jsx基础 本质 3.3 jsx基础 jsx表达式 3.4 jsx基础 实现列表渲染 3.5 jsx基础 实现条件渲染 3.5 jsx基础 实现复杂的条件渲染 4. react中事件绑定 5.react组建基础使用 6.1 useState 6.2 useState修改状态的规则 7.基础…

渗透测试和漏洞扫描有什么区别

渗透测试和漏洞扫描是网络安全领域中非常重要的两种技术手段&#xff0c;它们都可以帮助组织或企业发现和修复系统中的漏洞和弱点。然而&#xff0c;这两种技术手段在目的、深度、方法和时间和成本等方面存在显著的区别。 首先我们来了解下渗透测试和漏洞扫描分别是什么&#x…

测试开发体系介绍——测试体系介绍-L1

目录&#xff1a; 软件测试基础概念 软件测试:软件测试作用:软件缺陷:软件测试原则:软件测试对象:测试用例软件开发流程 软件:软件生命周期:软件开发流程:瀑布模型:瀑布模型优缺点敏捷开发模型: XP - 极限编程:SCRUM:DevOps&#xff1a;DevOps 生命周期&#xff1a;DevOps 对发…

C语言中关于操作符的理解

本篇文章只会列出大家在生活中经常使用的操作符 算术操作符 在算数操作符中常用的有&#xff0c;&#xff0c;-&#xff0c;*&#xff0c;/&#xff0c;% &#xff0c;我们重点讲一讲 / (除) 和 % (模) " / "运算 #include <stdio.h>int main() {int a5/2;fl…

【Amazon 实验③】使用Amazon WAF做基础 Web Service 防护之速率策略

文章目录 1. 速率策略1.1 介绍 2. 实验步骤2.1 添加规则2.2 测试2.3 结果 通过上一篇文章大家了解到如何使用Amazon WAF做关于自定义规则设置的 Web Service 防护【Amazon 实验②】使用Amazon WAF做基础 Web Service 防护之自定义规则&#xff0c;本篇文章将继续讲解一下关于速…

WebGL开发三维解剖学应用

开发基于 WebGL 的三维解剖学应用通常涉及以下步骤。这些步骤包括创建三维模型、整合交互性、优化性能等&#xff0c;希望对大家有所帮助。北京木奇移动技术有限公司&#xff0c;专业的软件外包开发公司&#xff0c;欢迎交流合作。 1.三维模型创建&#xff1a; 首先&#xff0…