干货!来自北大、KAUST、斯坦福、达摩院的大模型前沿动态:表格推理、代码生成、MiniGPT-4、生成式推理...

news2024/10/6 6:41:45

点击蓝字

bd53667bbedfddd2060b968aa9c44599.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

3a76d4ac1f90a94b39e384cc345956f7.png

cddc6bf78cd809a523b10b90439079df.png

ChatGPT的发布使得国内外众多的研究机构掀起了一股AI热潮,而这也进一步推动了人们对大语言模型的深入研究。2023年4月26日,AI TIME举办的大模型专场四活动邀请了阿里巴巴达摩院NLP研究员惠彬原、北京大学计算机学院软件研究所博士生姜雪、阿卜杜拉国王科技大学博士生朱德尧、斯坦福大学博士生盛颖。四位嘉宾分别介绍了自己在大模型领域的最新研究工作,分享了自己对于大模型的观点看法,并展望了未来人工智能的全新范式。

914e44e617a4944ef1d6a8d2f81a08d5.gif

个人报告

惠彬原:分解,分解,推理!大模型是超越人类的表格推理者

大模型目前已经展现出了在部分能力上超越人类的表现。本次分享中惠彬原首先介绍了表格推理的背景和任务,其次从Program Synthesis和Table Pre-training两个方面阐述了表格推理相关的研究工作并分析了GPT-3发布之后对表格推理的研究产生的影响与变化,提出要解决的两个主要问题:大语言模型如何泛化到多行的巨大表格中以及产生包含与证据信息不一致的误导性思维链,然后重点分享了关键框架Dater的设计思路以及该篇工作的主要贡献,通过实验结果展示了Dater在性能上的显著提升:Dater在TabFact上首次超越人类,最后展望了未来有待进一步解决的研究问题和研究方向。

姜雪:基于自规划和自合作的大模型代码生成技术

编程是一种解决问题强有力的工具,而代码生成是一种能让机器自动编程以满足人类意图或需求的技术。姜雪首先为大家阐明了代码生成的具体含义以及目前的研究发展状况,其次分析了现有代码生成方法中存在的问题,即只能解决函数级代码生成、行级代码补全这种短需求的场景,在面对复杂问题分析以及软件系统设计时则不尽如人意,她进一步提出了研究目标:使大模型在应对用户更复杂的需求时能展现更好的代码生成能力。姜雪介绍了该篇工作的主要思路,即通过引入规划和合作的方法论使得大模型解决更复杂的需求并且进一步提升代码生成的质量,最后通过实验数据展示了所提方法的优越性能

朱德尧:MiniGPT-4: Enhancing Vision-language Understanding with Advanced Large Language Models

GPT-4展示了非凡的多模态能力,例如能够直接从手写文本生成网站和识别图像中的幽默元素等。朱德尧首先表达了该篇工作的研究动机,即期望找到GPT-4视觉语言能力的来源并提升Blip-2整个系统的表现力,然后介绍了MiniGPT-4的设计方案及实验过程,它仅使用一个投影层将冻结的视觉编码器与冻结的LLM Vicuna对齐,最后通过对demo结果的展示表现了MiniGPT-4的新型功能与强大能力,说明了使用对话模板微调模型对增强模型生成可靠性与整体可用性至关重要。

盛颖:单卡上的高吞吐量大语言模型生成式推理

传统意义上,大型语言模型(LLM)推理的高计算和内存要求使其仅在多个高端加速器的情况下才可行,本篇工作研究了使用有限资源的高吞吐量大语言模型生成推理。本次分享中,盛颖首先介绍了语言模型的相关背景及其所需的数据条件,其次表明了工作的研究动机,即希望AI能够被更加民主化地使用,每个人可以拥有自己的大模型,然后阐述了降低大语言模型运行的三种要求,包括:模型压缩、协作推理、存储卸载,最后通过具体分析实验结果,证明了所提方法使得大语言模型在单卡上进行生成式推理的优越性能。

Panel

大模型是否会颠覆传统的软件开发?

姜雪:从某种程度上来讲,大模型确实在改变着软件开发的方式,能够帮助开发人员快速地生成代码,减少人工出错的可能性,并且可以自动地生成文档和测试用例。但是,我认为现在大模型还是不能完全取代传统的软件开发,可能会引发一种新的分工,使得人类更专注于专业化和创业化的工作。因为软件开发需要设计架构、编程、测试维护等各个方面的专业知识。目前大模型在很多情况下是一个比较有利的辅助工具,它并不能解决所有的问题,还是需要人类来提供监督和指导。此外,很多应用程序是依赖于特定的技术和领域知识的,大模型适用性不足,在这种情况下需要专业的人员来完成。

朱德尧:大模型会取代底层重复的没有创造力的工作,但是对于顶层的架构设计,在短期内还是需要人类去完成的。对于底层来讲,大模型具有较大的潜力,在自动化、个人认证等方面展现出较好的逻辑推移能力,如果好好利用大模型将能够提升工作效率,避免重复劳动。

盛颖:传统的软件开发形式会因为大模型的出现有所改变,但是不会被完全取代。目前在软件开发中已有的技术可以自动补全代码,提升开发效率,但是最终的结果还是需要人类进行验证。对于大模型会不会导致开发人员的就业困难这个问题,简单重复的工作被加速之后,能够创造出更多的机会,让大家能够将精力集中在更加有意思的工作中。

申泽楷:大模型能否颠覆传统软件开发没有一个确定的答案。它可能会颠覆一部分,会取代一些基础的架构,同时会产生一些新的软件开发范式。在新时代下AI是无法取代人类的,关键在于人类如何利用大模型的优势克服局限,去提升软件的开发质量和效率。

Panel

我们离真正的AGI有多远?

朱德尧:在短期内可能会出现通用的在感知和决策方面都能做到很好的AGI。从技术层面来讲,随着GPT版本的更新,互联网中的数据库已被大量使用,那么在未来可能会因为高质量数据的缺少而出现一个瓶颈。但是在下一步AI的训练范式又有可能从监督与自监督学习转化为强化学习,由被动地接收转变为主动收集数据并从数据中学习。从这个角度来看,一旦AI能够做到主动地抽取数据,探索学习世界,那么在未来3-5年内建造一个非常通用的能够做出决策的AGI模型时很有可能的。

盛颖:我对AGI的未来偏向乐观,因为他确实已经展现出一些人类无法完全理解的能力。而真正的AGI能否实现取决于两个方面:一是人类能否接受AI拥有自我意识进行主动探索;二是人类有多大的动力耗费代价去实现真正的AGI。我相信这在最终是能够实现的,但是短期来看,它对社会的价值更多的体现在辅助性层面,随着时间的推移,会变得越来越重要甚至不可替代。

姜雪:我对此持中立的态度,既不悲观也不乐观。真正的AGI应该像人类一样去学习,去适应推理解决广泛的任务,而不是局限在某个特定任务上的表现。目前的AI系统在处理一些任务的时候仍然是需要人类的这个干预和指导的,是没有办法完全代替人类的。要实现真正的AGI还是面临着很多挑战的,比如说具备人类的适应能力、创造创新能力、对人类情感和道德的理解。所以要实现真正的AGI不仅要解决计算技术的问题,还会有哲学上的挑战以及很多跨学科、领域的合作,需要很长的时间去发展。

申泽楷:我们在离未来真正的AGI可能还有很长的路要走,或许需要几十年或者更久。短期之内AGI不断涌现,但是在最终还是取决于人类对智能的探索,需要不断地创新和持续的努力。

Panel

大家会更喜欢本地使用或个人专有的模型,还是云端服务的模型?

盛颖:在未来肯定还是会同时存在这两种模式的,但是我更希望在将来每个人都能拥有专有的assistant。当然这也与AI模型架构朝着哪个方向搭建有关,是更应该专注于云端的服务措施还是专注于大模型本身的特色。AI的生态是与物种多样性相类似的,做到普遍性与特殊性的统一才能推动整个AI系统向前发展。

姜雪:如果有计算资源的话,我个人倾向于本地模型,因为我可以做到自由访问,探索资源是如何工作的。但是云端的服务会受到网络或政策的限制,涉及到数据隐私和安全性的问题。现在的大模型只是作为基础设施提供云端服务,在未来我希望有个人的大模型与云端服务的大模型结合,实现超级大模型。

朱德尧:在不关注硬件条件的前提下,由于隐私安全的问题,我会更希望有自己的模型。小模型会因为参数量的受限而缺乏大模型的涌现能力,目前更实际的问题是大模型需要的计算资源太大,所以云端模型会稍占优势,在未来会更倾向于哪一方面主要有两个影响因素确定:一是大型语言模型的规则是否还起作用,二是硬件的发展速度。

申泽楷:大模型的选择不是一个“0-1”问题,一定是各有优点和特色的,在未来一定会有更加灵活或者混合的方案出现,从而呈现“百花齐放”的局面,能够让用户根据自己的需求和偏好选择模型的特性和服务方式。

整理:陈研

审核:惠彬原 姜雪 朱德尧 盛颖

点击“阅读原文”跳转可以查看回放哦!

往期精彩文章推荐

a7febf56233e90bb53a80f4c4c3e8f66.jpeg

记得关注我们呀!每天都有新知识!

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了1100多位海内外讲者,举办了逾550场活动,超600万人次观看。

22608f8cd717acaaeafdebd85471987a.png

我知道你

在看

~

1e77f682760447ec6740ae52c0a964b0.gif

点击 阅读原文 查看回放!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/610458.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

在 IDEA 中配置 JavaFX 11

因为从 Java8/openjdk 之后,javafx 从 jdk 中移除,如果进行 JavaFX 开发需要在 module 中添加 lib,并对 IDE 进行配置,确保 jdk 可以与 javafx 正常调用。 javafx 下载路径,主页网址:https://openjfx.io/ …

开发实践|程序员是如何刷抖音、玩快手、看头条进行赚米的?

欢迎关注「全栈工程师修炼指南」公众号 点击 👇 下方卡片 即可关注我哟! 设为「星标⭐」每天带你 基础入门 到 进阶实践 再到 放弃学习! “ 花开堪折直须折,莫待无花空折枝。 ” 作者主页:[ https://www.weiyigeek.top ] 博客&…

【计算机组成原理与体系结构】数据的表示与运算

目录 一、进位计数制 二、信息编码 三、定点数数据表示 四、校验码 五、定点数补码加减运算 六、标志位的生成 七、定点数的移位运算 八、定点数的乘除运算 九、浮点数的表示 十、浮点数的运算 一、进位计数制 整数部分: 二进制、八进制、十六进制 --…

穿越认知峡谷

十年前,2013 年的这个时候,“互联网思维”在国内大火。我没有认真研究过这件事的来龙去脉,不过印象里 2012 年底《罗辑思维》视频栏目的开播,以及差不多同时小米手机的爆发,对“互联网思维”的大流行应该是起了重要的推…

【ABAP】数据类型(一)「数据类型概要及分类」

💂作者简介: THUNDER王,一名热爱财税和SAP ABAP编程以及热爱分享的博主。目前于江西师范大学本科在读,同时任汉硕云(广东)科技有限公司ABAP开发顾问。在学习工作中,我通常使用偏后端的开发语言A…

Nginx正则表达式、location、rewrite

目录 一、常用的Nginx正则表达式 二:localtion 1、location 分类 2、 location 常用的匹配规则 3、location 优先级 4、 location 示例 5、优先级总结 6、实际网站使用中,至少有三个匹配规则定义 (1)第一个必选规则 &…

深入理解设计原则之接口隔离原则(ISP)【软件架构设计】

系列文章目录 C高性能优化编程系列 深入理解软件架构设计系列 深入理解设计模式系列 高级C并发线程编程 LSP:接口隔离原则 系列文章目录1、接口隔离原则的定义和解读2、案例解读3、如何判断一个接口是否符合接口隔离原则?小结 1、接口隔离原则的定义和…

CVPR 2023 医学图像分割论文大盘点

点击下方卡片,关注“CVer”公众号 AI/CV重磅干货,第一时间送达 点击进入—>【医学图像分割】微信交流群 被催了很久,CVer 正式开启 CVPR 2023 论文大盘点系列!Amusi 一共搜集了13篇医学图像分割论文,这应该是目前各…

HTML 5中的文件处理之FileAPI

在众多HTML5规范中,有一部分规范是跟文件处理有关的,在早期的浏览器技术中,处理小量字符串是js最擅 长的处理之一。但文件处理,尤其是二进制文件处理,一直是个空白。在一些情况下,我们不得不通过Flash/Acti…

GPT国内的一些产品真的比国外的差吗?(篇幅较长,请收藏)

关注并星标 从此不迷路 计算机视觉研究院 公众号ID|ComputerVisionGzq 学习群|扫码在主页获取加入方式 计算机视觉研究院专栏 作者:Edison_G 本次讨论的话题仅限于计算机视觉研究院个人观点,若有说的不对的地方勿喷,有…

k8s之docker-扩展知识(八)

一.Docker的应用场景 Web 应用的自动化打包和发布。 自动化测试和持续集成、发布。 在服务型环境中部署和调整数据库或其他的后台应用。 从头编译或者扩展现有的 OpenShift 或 Cloud Foundry 平台来搭建自己的 PaaS 环境。 二.Docker 的优点 Docker 是一个用于开发&#…

【ChatGPT】Mr. Ranedeer:可定制个性化学习体验的 GPT-4 AI 导师提示

Mr. Ranedeer AI Tutor是一个可定制的提示,为具有不同需求和兴趣的用户提供个性化的学习体验。它使用GPT-4来释放AI的潜力,并允许您调整知识深度以匹配您的学习需求,自定义学习风格,沟通类型,语气和推理框架 。 当您使…

ISO21434 组织网络安全管理(二)

目录 一、概述 二、目标 三、输入 3.1 先决条件 3.2 进一步支持信息 四、要求和建议 4.1 网络安全治理 4.2 网络安全文化 4.3 信息共享 4.4 管理系统 4.5 工具管理 4.6 信息安全管理 4.7 组织网络安全审计 五、输出 一、概述 为了实现网络安全工程,该…

自动驾驶TPM技术杂谈 ———— 车辆分类

文章目录 机动车规格机动车结构机动车使用性质机动车和挂车分类接近角定义离去角定义纵向通过角定义离地间隙定义前后轴之间的离地间隙轴下离地间隙 机动车规格 机动车规格分类 分类 说明 汽车 载客汽车 大型 车长大于或等于 6000mm 或者乘坐人数大于或等于20 人的载客汽车。 …

【微信小程序开发】第 4 节 - 创建小程序项目

欢迎来到博主 Apeiron 的博客,祝您旅程愉快 ! 时止则止,时行则行。动静不失其时,其道光明。 目录 1、缘起 2、点击 “加号” 按钮 3、项目创建完成 4、在模拟器上查看项目效果 5、在真机上预览项目效果 6、主页面的 5 个组…

安卓调试|一文归纳总结adb调试工具常规命令

欢迎关注「全栈工程师修炼指南」公众号 点击 👇 下方卡片 即可关注我哟! 设为「星标⭐」每天带你 基础入门 到 进阶实践 再到 放弃学习! “ 花开堪折直须折,莫待无花空折枝。 ” 作者主页:[ https://www.weiyigeek.top ] 博客&…

FPGA PAL视频BT656解码Video Processing Subsystem去隔行工程源码 TW2867采集4路视频拼接输出 提供技术支持

目录 1、前言2、我这里已有的PAL视频解码方案3、模拟视频概述4、模拟视频颜色空间5、逐行与隔行6、BT656数据与解码BT656数据格式BT656数据解码 7、TW2867芯片解读与配置TW2867芯片解读TW2867芯片配置TW2867时序分析 8、设计思路与框架9、vivado工程详解Block Design设计SDK设计…

chatgpt赋能python:Python奇偶数求和方法详解

Python奇偶数求和方法详解 在日常的编程开发中,经常需要对数字进行分类求和,其中“奇偶数求和”更是最常见的问题之一。而Python作为一种高效、可靠的编程语言,其在求解奇偶数的优秀性能备受瞩目。接下来本篇文章将详细介绍Python奇偶数求和…

Redis为什么会这么快?Redis到底有多快?

文章目录 一、redis到底有多快?二、redis为什么这么快1、内存存储(1)虚拟存储器(虚拟内存Virtual Memory)(2)用户空间和内核空间 2、单线程(1)进程切换(上下文…

Flutter 小技巧之 3.10 全新的 MediaQuery 优化与 InheritedModel

关于 MediaQuery 我们介绍过不少,比如在之前的《MediaQuery 和 build 优化你不知道的秘密》里就介绍过,要慎重在 Scaffold 之外使用 MediaQuery.of(context) ,这是因为 MediaQuery.of 对 BuildContext 的绑定可能会导致一些不必要的性能开销&…