2022 CNCC 中国计算机大会参会总结

news2024/10/7 10:20:46

前言

第 19 届 CNCC 于2022年12月8-10日召开,本届大会为期三天,首次采取全线上举办形式,主题为“算力、数据、生态”,重点在保持多样性、聚焦热点前沿话题、平衡学术界和产业界参与等维度展开讨论。大会由CCF会士、中国科学院院士、国防科技大学教授王怀民担任主席,共设有 14 个特邀报告、3 场大会论坛、118 个涉及 30 多个领域方向的技术论坛以及特色活动,共有图灵奖获得者、田纳西大学教授Jack Dongarra,中国科学院院士、北京航空航天大学计算机学院教授钱德沛,中国科学院院士、西安交通大学教授管晓宏,中国工程院院士、北京邮电大学教授张平等七百余位计算领域讲者作报告。本文对本次大会中NLP相关的两个报告进行下述总结。

CNCC 2022 中国计算机大会


报告1——少标注NLP讨论

目前主流的自然语言处理模型均高度依赖大规模标注数据,然而由于自然语言处理任务具有标注难度高、任务种类多、领域差异大且层出不穷等特点,导致针对特定任务的标注数据量往往较少。因此,研究如何基于少量标注数据构建高精度自然语言处理系统具有重要意义。但是由于自然语言处理还具有知识的依赖性、表示的符号性、任务的多样性等特点,使得现有少标注学习方法在面向自然语言处理问题时往往显得力不从心。本论坛将邀请多位自然语言处理专家,就少标注自然语言处理理论以及方法的最新研究进展、未来发展方向进行深入探讨。

本报告由哈尔滨工业大学的车万翔教授主持,共有4场子报告,分别由西湖大学张岳教授、浙江大学陈华钧教授、清华大学刘知远教授和复旦大学邱锡鹏教授主讲。

  • 第一场报告中,张岳老师提到语言模型在跨域场景下的鲁棒性问题,首次尝试使用提示学习(Prompt Learning)做命名实体识别工作,此外,使用数据增广的方式可以大大提升模型在同分布和跨分布场景下的小样本学习能力。

    在本报告结束后,车万翔老师提出一个模型能力跃迁的问题:大模型是否会自动处理OOD等问题?张岳老师表示这一问题值得持续关注。

    个人思考:语言模型在训练过程中如果找到Shortcut,就会投机取巧,泛化性则相应下降,那是不是对于安全性较低(如容易植入后门)的模型,根据其泛化性可以对其进行识别?

  • 第二场报告中,陈华钧老师围绕知识图谱(Knowledge Graph)与低资源学习(Low Resource Learning)两个概念延伸出 LRL4KG 以及 KG4LRL 两大任务,并针对 KG4LRL 场景总结为:大样本靠机器学习,小样本靠知识推理,由此可见知识在低资源场景下的重要性。

  • 第三场报告中,刘知远老师围绕“Delta Tuning:大模型的小参数高效微调”这一主题,针对“预训练+微调”这一范式,对 Fine-tuning 与 Prompt-learning 的区别进行对比,就如何在小范围微调参数的前提下将大模型更好地应用于下游任务展开报告。

    关于OpenDelta相关工作,具体论文见:Delta Tuning: A Comprehensive Study of Parameter Efficient Methods for Pre-trained Language Models(arXiv, 2022)

  • 第四场报告中,邱锡鹏老师以“语言模型及服务”(Language Model as a Service,LMaaS)展开报告,主要有两个挑战:(1)构建一个适用于所有nlp任务的模型,即 One Model Fits All 任务(2)设计不同微调方法,如报告中提到的y-Tuning、Black Box-Tuning等研究工作。

    相关论文:

本场报告中,几位老师都不约而同提到了大模型时代,知识对于语言模型的重要性。语言模型的训练离不开支知识的加持,在语言模型尤其是大规模模型发展过程中,大量知识的支撑是必不可少的,这也是大势所趋。


报告2——现代文本摘要技术研究

近些年来预训练语言模型的出现极大推动了自然语言处理领域的进步,文本摘要作为自然语言处理领域最经典任务之一,又发生了哪些技术变革?事实一致性、低资源成为新的研究热点;同时,谷歌、亚马逊等互联网公司相继推出面向不同领域的在线摘要服务,为摘要技术的发展建立了新的应用场景,科研人员也对科学文献、对话等全新领域掀起了新的探索热潮。 本次“现代文本摘要技术研究”论坛即是希望针对摘要技术最新问题进行研讨,也是希望在大模型技术加持下,摘要任务如何构建具有其自身特色的科学问题和方法模型深入挖掘。为此,特邀五位嘉宾从多个维度入手,分别就:自然语言生成技术、科学文献摘要、摘要的事实一致性研究、对话摘要和低资源文本摘要技术等几方面进行交流探讨。

本报告由哈尔滨工业大学的秦兵教授和北京大学的万小军教授共同主持,共有5场子报告,分别由清华大学黄民烈教授、百度肖欣延博士、哈尔滨工业大学冯骁聘教授、北京理工大学高扬副教授和中国人民大学严睿副教授主讲。

  • 第一场报告中,黄民烈老师以ChatGPT开篇,就“自然语言生成的未来”展开报告。大纲如下:

    • NLG 挑战和机遇

      • 挑战:
        1. 难以提高模型性能
        2. 模型的时效性(模型迭代加快)
        3. 资源和时间成本递增
      • 机遇:
        1. 新的任务、应用场景
        2. 新的生成方法
    • Universal LM(预训练语言模型的理解)

      • Understanding:探索预训练语言模型学到的知识,便于更好地完成下游任务
      • Universality:模型的可解释性——为何预训练语言模型能够适配很多下游任务
      • Reliability:Prompt的探索,选择最佳的prompt
    • 长文本生成:面临问题包括(1)可控性(2)重复(3)连贯性(4)冲突

    • 非自回归生成(Non-Autoregressive Text Generation,NATG):生成的文本同时解码,推断速度加快,而且无暴露偏差,更灵活的解码方式
      未来方向:机器翻译 ➡️ 通用文本生成如对话生成

    • Evaluation(文本生成的评估)

    • 总结:

      • 生成模型大规模线上部署面临两大瓶颈:(1)算力消耗(2)解码速度
      • 安全性和可控性问题有待解决:检测算法、生成更安全

此处推荐试玩小程序“AI乌托邦”,人格化AI创建引擎

AI乌托邦,人格化AI创建引擎

  • 第二场报告中,百度肖欣延老师就“面向事实一致性的可靠文本生成”为主题展开报告。事实一致性即可靠性,未来展望:可靠文本生成与评测方法。

  • 第三场报告中,冯骁聘老师就 “知识指导的对话摘要技术研究”为主题展开报告。关于对话摘要,产业界已有一些落地应用如 Google:Conversation Summary & Amazon:Call Summarization & Microsoft:Call Summarization & Headroom:Meeting Summarization.
    开放式文本生成(按文本长度划分)
    对话摘要 = 对话理解 + 摘要生成。对话摘要示例:

    输入文本
    对话摘要输入文本
    输出文本
    对话摘要输出文本
    与传统的文本摘要任务不同,对话摘要面临对话为源内容,数据稀缺、对话建模、场景理解等挑战。此外,报告中提到主题漂移现象,即对于输入的长对话文本,可能具有多个主题,这时首先需要对主题进行提炼。

    未来方向:多模态、多领域、多语言、可靠性对话摘要

  • 第四场和第五场报告中,高扬老师和严睿老师分别就 “面向低资源的文本摘要生成技术”和“Learning towards Abstractive Text Generation”为主题展开报告。由于这两个报告介绍的研究工作比较具象,没有详细记录。


此外,在大会的其他报告中了解到一个概念:MLOps,MLOps 是 Machine Learning Operations 的缩写,是一门工程学科,旨在统一 ML 系统开发(dev)和 ML 系统部署(ops),以标准化过程生产高性能模型的持续交付。详细介绍参见这篇博客。


参考资料

  1. 2022 中国计算机大会(CNCC 2022)
  2. 2022 中国计算机大会(CNCC 2022) 大会手册
  3. 揭秘大模型背后的机理,清华49页长文全方位分析参数高效微调方案Delta Tuning - 腾讯云开发者社区-腾讯云 (tencent.com)
  4. “语言模型即服务”必读论文 - 知乎 (zhihu.com)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/154378.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【SpringBoot】一文带你入门SpringBoot

✅作者简介:热爱Java后端开发的一名学习者,大家可以跟我一起讨论各种问题喔。 🍎个人主页:Hhzzy99 🍊个人信条:坚持就是胜利! 💞当前专栏:【Spring】 🥭本文内…

【职场进阶】做好项目管理,先从明确职责开始

优秀的项目管理一定是高效协调各方资源、反馈及时、调整迅速的。 同时可以做到让参与各方在整个项目过程中张弛有序、愉快合作,最终实现产品项目的效益最大化。 那什么是项目呢? 项目是为向客户提供独特的产品或服务而进行的临时性任务,项目有…

TypeScript 对象key为number时的坑

首先在js的对象中有一个设定,就是对象的key可以是字符串,也可以是数字。 不论key是字符串还是数字,遍历对象key的时候,这个key会变成字符串 通过[] 操作符访问key对应值时候,不论是数字还是字符串都转成了 字符串的k…

Chromedriver安装教程

第一步 查看你当前Chrome浏览器的版本,如下图所示: 第二步 查看当前Chrome浏览器的版本号,如下图所示,版本 108.0.5359.125(正式版本) (64 位)中的,108就是我们的版本号。 第三…

VTK-PointPlacer

前言:本博文主要研究VTK中点转换到曲面上的应用,相关的接口为vtkPolygonalSurfacePointPlacer,为深入研究将基类vtkPointPlacer开始讲解。主要应用为在PolyData表面进行画线。 vtkPointPlacer 描述:将2D display位置转换为世界坐…

ospf知识点汇总

OSPF : 开放式最短路径优先协议使用范围:IGP 协议算法特点: 链路状态型路由协议,SPF算法协议是否传递网络掩码:传递网络掩码协议封装:基于IP协议封装,协议号为 89一.OSPF 特点1.OSPF 是一种典型…

基于javaweb(springboot+mybatis)网上酒类商城项目设计和实现以及文档报告

基于javaweb(springbootmybatis)网上酒类商城项目设计和实现以及文档报告 博主介绍:5年java开发经验,专注Java开发、定制、远程、文档编写指导等,csdn特邀作者、专注于Java技术领域 作者主页 超级帅帅吴 Java毕设项目精品实战案例《500套》 欢迎点赞 收藏…

【Linux】Linux项目自动化构建工具—make/Makefile

目录一.什么是make/MakefileMakefilemake二.Makefile逻辑1.简单依赖2.复杂依赖三.make指令1.make的使用2.clean清理3.伪目标4.make如何确定是否编译访问时间的影响修改时间的影响一.什么是make/Makefile Makefile 在Windows下,我们使用VS、VS Code这些ide编写C/C程…

MySQL的客户端/服务器架构

以我们平时使用的微信为例,它其实是由两部分组成的,一部分是客户端程序,一部分是服务器程序。客户端可能有很多种形式,比如手机APP,电脑软件或者是网页版微信,每个客户端都有一个唯一的用户名,就…

赶紧收藏 | 50个超实用微信小程序,巨好用|||内含免费配音软件

现在App太多了,想用的功能都要下载,但是手机有258g内存不允许这么放肆呀,只能挖掘不占用存的方法了,小程序就解决了这个痛,节省内存,让手机不再卡顿,打游戏也舒服.给大家整理了50个很好用的小程…

【阶段三】Python机器学习11篇:机器学习项目实战:KNN(K近邻)回归模型

本篇的思维导图: 项目实战(KNN回归模型) K近邻算法回归模型则将离待预测样本点最近的K个训练样本点的平均值进行待预测样本点的回归预测。 项目背景 K近邻除了能进行分类分析,还能进行回归分析,即预测连续变量,此时的KNN称为K近邻回归模型。回归问题是一类…

synchronized 重量级锁分析

synchronized 重量级锁分析 1. 背景 在JDK1.6以前,synchronized 的工作方式都是这种重量级的锁。它的实现原理就是利用 kernel 中的互斥量,mutex。主要是内核中的mutex 能够保证它是一个互斥的量。如果线程1拿到了 mutex,那么线程2就拿不到了。这是内核帮我们保证…

二十三、Kubernetes中Pod控制器分类、ReplicaSet(RS)控制器详解

1、概述 Pod是kubernetes的最小管理单元,在kubernetes中,按照pod的创建方式可以将其分为两类: 自主式pod:kubernetes直接创建出来的Pod,这种pod删除后就没有了,也不会重建 控制器创建的pod:kub…

小米应用商店APP侵权投诉流程

目录一、官方指引二、侵权投诉流程1.侵权投诉通知和反通知流程2.受理渠道3.权利人发起侵权通知邮件一、官方指引 https://dev.mi.com/distribute/doc/details?pId1142 二、侵权投诉流程 1.侵权投诉通知和反通知流程 2.受理渠道 对外邮箱:developerxiaomi.com …

云呐|固定资产盘点APP

如果工人想做好他们的工作,他们想做好他们的工作。目前,行政事业单位对固定资产管理进行一物一卡一码管理,根据条形码粘贴和扫码总结,是目前科学完善的总结方法,具有快速、高效、准确的特点。对于这种方法,…

5.6、TCP超时重传时间的选择

超时重传时间的选择是 TCP 最复杂的问题之一 1、超时重传时间RTO的选取 假设主机 A 给主机 B 发送 TCP 数据报文段 000,并记录下当前的时间 主机 B 收到后,给主机 A 发送相应的确认报文段 主机 A 收到确认报文段后,记录下当前的时间 那么…

为什么BI仪表板的共享功能对企业如此重要?

随着大数据的发展,企业逐渐将数据作为其决策的重要组成部分,共享商业智能 (BI) 仪表板显得越来越重要。例如,在员工之间共享BI仪表板,不仅可以做出更好的数据驱动决策,还可以更好地提高工作透明度和问责制,…

Golang时间处理容易踩坑,小心损失百万

简介 在各个语言之中都有时间类型的处理,因为这个地球是圆的(我仿佛在讲废话),有多个时区,每个时区的时间不一样,在程序中有必要存在一种方式,或者说一种类型存储时间,还可以通过一系…

手写RPC框架第8版-通过SpringBoot-Starter接入SpringBoot

源代码地址:https://github.com/lhj502819/IRpc/tree/v9 系列文章: 注册中心模块实现路由模块实现序列化模块实现过滤器模块实现自定义SPI机制增加框架的扩展性的设计与实现基于线程和队列提升框架并发处理能力框架容错性相关设计通过SpringBoot-Starte…

LayoutInflater学习(二)之创建布局View

这篇是在上篇的基础上继续学习LayoutInflater,上篇主要讲了LayoutInflater是怎么解析布局的,但是并没有去仔细地说明LayoutInflater创建View的过程,这篇就补上这部分。 LayoutInflater创建xml布局View是分开创建的: 1. 先创建xml布局最外层的View,也就是布局的根View 2. 递归…