2023语言与智能技术竞赛开辟“双赛道”:寻找“全民测评官”,探索AI多模态能力...

news2025/1/18 18:43:45

550a5a8566d1a1c5979fb886e4a3a04a.png

开年以来,人工智能大语言模型(LLM)掀起新一轮全球科技竞赛,全球科技巨头打响“百模大战”。当大语言模型正深刻改变人类生产生活方式时,该如何进一步释放其潜能,成为业界关注的问题,也成为了2023语言与智能技术竞赛命题的起点。

5月17日,2023语言与智能技术竞赛正式启动,该大赛由中国计算机学会(CCF)和中国中文信息学会(CIPS)联合主办,百度公司、中国计算机学会自然语言处理专委会和中国中文信息学会评测工作委员会承办。本届大赛设置“大语言模型能力评估”和“视频语义理解”两大赛道,立足现实难题,发掘创新人才,助推技术发展。

427871e017e17b4ff0424ba8d7becb9f.png

紧跟技术趋势命题

全球人才集结“揭榜”

语言与智能技术竞赛自2018年开始,已连续举办5届,凭借面向真实应用场景的任务设计和源自真实场景的数据集,获得产学研各界关注,成为全球最权威、最热门的中文自然语言处理赛事之一。

历届竞赛先后组织了阅读理解、人机对话、语义解析、信息抽取等评测任务,覆盖自然语言处理和人工智能领域的重要前沿课题,对于推进相关技术研究及智能搜索、智能推荐、智能交互等人工智能应用发展具有重要意义。每届赛题如同英雄帖,吸引超过2000支队伍前来“揭榜”,其中80%选手来自全球多所顶尖高校和科技企业,覆盖金融、互联网、传媒、通信、工程机械、能源、生物等多个行业。

当前,大语言模型作为“大数据+大算力+强算法”的产物,基于万亿级数据集预训练后能应对多样化需求,被视为 AI 迈向 AGI (通用人工智能)的里程碑技术。本届竞赛紧跟技术趋势,设置“大语言模型能力评估”和“视频语义理解”两大赛道,旨在携手全球创新人才,为推动语言与智能领域技术发展和应用贡献力量。

5b1d05146c70ff67d2e77ca466108e83.png

寻找“全民测评官” 

构建大模型能力评估体系

不同于往届竞赛主要面向专业 AI 开发者,本届大赛第一条赛道“大语言模型能力评估”向所有用户发出邀请。该赛道希望选手从底层能力(生成、逻辑等)、专项能力(创作、问答等)以及在真实场景的应用能力等维度出发,制定评估方案和数据示例,为大语言模型构建能力评估体系(请参考下方示例)。  

daadeb21eb3f4710f71bc28850407f8c.png

评估体系示例

这一赛题的设置让个人用户和中小规模开发团队尤为振奋。一方面,大语言模型扎推问世,出现同质化等问题,亟待提出全面、有效的评估方法;另一方面,模型参数量已激增至万亿级,单次训练成本高昂,仅少数头部企业有能力承担。而通过参加语言与智能技术竞赛,选手只需从自身对大模型的理解出发,建立逻辑顺畅的评估维度和评价标准,就能低成本地参与技术变革。作为承办方,百度将为所有选手提供全新一代知识增强大语言模型文心一言的邀请码,帮助选手更好地建立大模型评估体系。

这也意味着,第一条赛道几乎“零门槛”。不限年龄、不限专业,无需代码基础,只要有理有据就能担任“全民测评官”,帮助人们了解大语言模型在不同场景的适应性和局限性,从而打造得更加安全、可控。

6c6cf6298b16d3b3ec0f42df53c68e46.png

探索多模态能力“天花板”

强化视频语义理解

第二条赛道“视频语义理解”则重点面向专业 AI 开发者,评测任务以互联网视频为输入,需在感知内容分析(如人脸识别、OCR 识别、语音识别等)的基础上,通过融合知识、NLP、语音等多模信息,结合知识图谱计算与推理,为视频生成多知识维度的语义标签。

这一任务,是大赛对 AI 多模态能力及 AGI 的一步初探。多模态被业界认为是大语言模型下一步的发展方向,和人类基于视觉系统进行大部分信息获取类似,AI 也正从文本、语音、视觉等单模态智能向多种模态融合的 AGI 方向发展,GPT-4 的识图能力和文心一言的文生图能力均是多模态能力的体现。

参与第二条赛道的选手,将获得由百度提供的基于飞桨平台的基线系统,以便快速上手,达成最佳竞赛条件。同时,选手还可以基于百度飞桨的人工智能学习与实训社区 AI Studio,使用在线编程环境,获取免费 GPU 算力支持,打破算力桎梏,不断深化对 AI 多模态能力的认知。

“百模大战”现下正酣,AGI 不再遥远。正如百度 CTO 王海峰所说,“大模型的通用性越来越强,AGI 在一定程度上已经实现,但 AI 为人类带来价值才是我们努力的方向”。本届竞赛两大赛道,既联合 AI 时代最广泛的参与者,构建全面、科学的评估体系,也鼓励专业 AI 开发者坚定地朝着下一个技术高点前行,让 AI 服务于人类更美好的生活和社会的发展。同时,百度也通过竞赛、校企合作等方式,持续推进“5年500万 AI 人才”计划,为国家战略科技力量建设持续贡献。

即日起,2023语言与智能技术竞赛报名通道已开放,详情可点击“阅读原文”前往大赛官网查看。大赛还准备了丰厚的赛事奖池,获奖团队将有机会在2023语言与智能高峰论坛与众多领域专家介绍作品。

  • 官网链接

http://lic2023.ccf.org.cn/

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/556588.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

计网之HTTP请求的构造

文章目录 1. form表单请求构造2. ajax请求构造3. Postman的简单使用 常见的构造 HTTP 请求的方式有以下几种: 直接通过浏览器地址栏, 输入一个 URL 就可以构造出一个 GET 请求.直接点击收藏夹, 得到的也是 GET 请求.HTML 中的一些特殊标签也会触发 GET 请求, 如: link, script…

线程池ThreadPoolExecutor底层原理源码分析

线程池执行任务的具体流程是怎样的&#xff1f; ThreadPoolExecutor中提供了两种执行任务的方法&#xff1a; void execute(Runnable command)Future<?> submit(Runnable task) 实际上submit中最终还是调用的execute()方法&#xff0c;只不过会返回⼀个Future对象&am…

【项目实战】基于Vue3+TypeScript+Pinia的后台管理系统(coderwhy)

是基于Vue3、Pinia、VueRouter、Vite、ElementPlus、TypeScript、Echarts等后台系统 效果 项目地址 https://gitee.com/yangyang993/vue3_ts_cms_admin.git 超级管理员 登录 系统总览 侧边栏是动态形成的&#xff1a;动态路由加载。路由地址路径和菜单相匹配。 注意&…

CAN总线上的报文帧类型(N_PCI)

1.四种报文类型&#xff08;简洁明了&#xff09; 请记住对于CAN报文来说&#xff0c;可以通过识别每条CAN的首个字节来确定它的类型&#xff0c;4种&#xff1a; 单帧 0 首帧 1 连续帧 2 流控帧 3 2. 单帧&#xff08;SF&#xff0c;Single Frame&#xff09; 0X 单帧首个…

【Spring MVC】后端处理多文件上传如何保持最大的灵活性

文章目录 前言找文档Spring MVC 如何接收多文件formdata 接收其他传参结论 前言 有一个多文件上传的需求&#xff0c;翻看了Spring MVC的官网&#xff0c;总结一下&#xff1a; 如何根据版本号找官方文档后端如何声明Controller能保持较好的灵活性 找文档 spring-framework…

Hive基础概论

HIVE 基础 Hive基础什么是Hive&#xff1f;为什么用Hive&#xff1f;Hive与Hadoop的关系Hive架构、组件组件用户接口元数据存储Driver驱动程序&#xff0c;包括语法解析器、计划编译器。优化器、执行器执行引擎 数据模型Data ModelDataBase 数据库Tables 表Partitions 分区Buck…

LIMUML04数据标注(note)

数据标注的思维导图 目标&#xff1a;是提升模型还是提升标注&#xff0c;本小节讨论提升标准&#xff0c;提升模型后面介绍。 如果有足够标注&#xff1a;使用半监督学习 没有足够标注&#xff0c;有足够预算&#xff1a;请人标注 没有足够预算&#xff1a;使用弱监督学习 问题…

每日学术速递5.22

CV - 计算机视觉 | ML - 机器学习 | RL - 强化学习 | NLP 自然语言处理 Subjects: cs.CV 1.Drag Your GAN: Interactive Point-based Manipulation on the Generative Image Manifold(SIGGRAPH 2023) 标题&#xff1a;拖动你的 GAN&#xff1a;生成图像流形上基于点的交互…

基础IO(总)

接口介绍 open&#xff1a; #include <sys/types.h> #include <sys/stat.h> #include <fcntl.h> int open(const char *pathname, int flags); int open(const char *pathname, int flags, mode_t mode); pathname&#xff1a;要打开或创建的目标文件 fla…

两数之和 C++实现(力扣题目1)

给定一个整数数组 nums 和一个整数目标值 target&#xff0c;请你在该数组中找出和为目标值 target 的那两个整数&#xff0c;并返回它们的数组下标。 你可以假设每种输入只会对应一个答案。但是&#xff0c;数组中同一个元素在答案里不能重复出现。 你可以按任意顺序返回答案…

SQL案例-高校信息管理系统实现要求

SQL案例-高校信息管理系统实现要求 (1) 建表 stuInfo(学生信息表) 字段名称数据类型说明stuName字符学生姓名&#xff0c;该列必填&#xff0c;要考虑姓氏可能是两个字的&#xff0c;如欧阳俊雄stuNo字符学号&#xff0c;该列必填&#xff0c;学号不能重复&#xff0c;且必须…

AC规则-4-规则和冲突解决

3.3 Introduction to Access Control Rule Conflict Resolution 3.3 访问控制规则冲突解决简介 本节从高层次讨论访问控制规则冲突解决。 本文档稍后会提供更多详细信息。 规则的优先级不是基于它在其他规则中的阅读顺序。 管理冲突规则的策略基于三个基本原则&#xff08;…

linux中 list_entry 设计背景及原理解析

Linux 2.4.22 在这一版本中的 list_entry的宏定义实现如下&#xff1a; #define list_entry(ptr, type, member) \((type *)((char *)(ptr)-(unsigned long)(&((type *)0)->member)))乍一看&#xff0c;会觉得特别复杂&#xff0c;其实分析之后&#xff0c;会发现清晰…

LeetCode高频算法刷题记录8

文章目录 1. 零钱兑换【中等】1.1 题目描述1.2 解题思路1.3 代码实现 2. 最小栈【最小栈】2.1 题目描述2.2 解题思路2.3 代码实现 3. 最长有效括号【困难】3.1 题目描述3.2 解题思路3.3 代码实现 4. 从前序与中序遍历序列构造二叉树【中等】4.1 题目描述4.2 解题思路4.3 代码实…

day8 域名解析与http服务器实现原理

域名解析gethostbyname函数 主机结构在 <netdb.h> 中定义如下 结构的成员包括&#xff1a; h_name &#xff1a;主机的正式名称 h_aliases&#xff1a;主机的备用名称数组&#xff0c;以 NULL 结尾指针 h_addrtype&#xff1a;地址类型;&#xff08;AF_INET或AF_INET…

基础知识6

知乎上的面试题&#xff1a;https://zhuanlan.zhihu.com/p/546032003 一、Topk问题以及变种&#xff0c;各种解法 微博的热门排行就属于 TopK 问题 TopK 一般是要求在 N 个数的集合中找到最小或者最大的 K 个值&#xff0c;通常 N 都非常得大。 算法的优点是不用在内存中读入全…

经典组件知识(kafka,ngix)

消息队列的作用 解耦、削峰、 异步&#xff08;非必要逻辑异步运行&#xff0c;加快响应速度&#xff09; kafka 首先有个topic的概念&#xff0c;类似于表。 Partition 分区&#xff1a;一个topic下面有多个分区&#xff0c;这些分区会存储到不同的服务器上面&#xff0c;或者…

如何使用 Django 进行测试驱动开发,我来告诉你

所谓测试驱动开发(TDD)&#xff0c;就是先编写测试用例&#xff0c;然后编写代码来满足测试用例&#xff0c;具体包含以下步骤&#xff1a; 编写测试用例。编写代码满足测试用例中的需求。运行测试用例。如果通过&#xff0c;说明代码满足了测试用例所定义的需求。如果未通过&…

armday2

.text .global _start _start: bl LED1_INITbl LED1_ONbl delay_1sbl LED1_OFFbl LED2_INITbl LED2_ONbl delay_1sbl LED2_OFFbl LED3_INITbl LED3_ONbl delay_1sbl LED3_OFFbl _start/**********LED1点灯PE10**************/ LED1_INIT:1.通过RCC_HB4_ENSETR寄存器设置GPIOE组…

PoseiSwap:为何青睐 Layer3?又为何选择 Celestia 作为技术伙伴?

自 PoseiSwap 在 Nautilus Chain 上线后&#xff0c;该 DEX 的整体市场进展十分顺利。我们看到&#xff0c;其不仅在 4 月&#xff0c;以 1000万美元的估值&#xff0c; 获得了来自于 Zebec Labs 的首轮 150 万美元的融资。而在本月&#xff0c;在 Zebec 生态的帮助下&#xff…