干货|来自新加坡管理大学、KAUST的大模型最新进展:推荐系统、未来AI社会研究……...

news2024/12/26 22:17:01

点击蓝字

b68b514704529fed0706910a6e9474d1.jpeg

关注我们

AI TIME欢迎每一位AI爱好者的加入!

5bb912b2d448c43ee5988f100bdddc63.gif

ChatGPT的横空出世刷新了我们对这个世界的认知和想象,而大型语言模型也逐渐成为学术界的研究热点。在自然语言处理、智能推荐、知识获取、智能对话等领域,大模型发挥着越来越重要的作用。

2023年5月19日,AI TIME举办的大模型专场五活动邀请了新加坡管理大学四年级博士生王磊,KAUST计算机博士李国豪。两位一作学者分享了自己在大模型领域的最新研究进展,并就当下的大模型热点问题展开讨论,给观众带来了一场精彩的科学思辨活动。

王磊:基于大语言模型零样本推理的应用:数学题求解,下一个物品推荐

大型语言模型(LLM)例如GPT-3,在各种自然语言处理(NLP)任务中取得了令人瞩目的成果。许多工作也已经证明,LLM能够在零样本设置下通过特定于任务的提示解决许多已知的NLP问题,即无需任何演示示例或进一步训练。

王磊首先分析了大模型应用在推荐系统任务中存在的问题,即域差距、推荐系统空间过大、建模用户的偏好存在困难等,进而引出该篇工作的研究动机——探索LLM在零样本设置中执行下一项推荐的潜力。然后,重点介绍了该篇工作中提出的三步提示方法执行的三个子任务:捕获用户偏好、提示代表性电影、针对性推荐,并展示了实验的结果,在零样本设置中,基于NIR的提示方法始终优于Simple Prompting和CS-Random-IF/UF。最后,他建议在提示过程中结合用户偏好、代表性电影选择和格式化技术,让GPT-3做出更好的推荐。

李国豪:CAMEL: Communicative Agents for ''Mind'' Exploration of Large Scale Language Model Society

基于对话和聊天的语言模型的快速发展导致了复杂任务解决方面的显著进步。

本次分享中,李国豪首先介绍了该篇工作的研究动机,目前LLM的成功在很大程度上依赖于人类的输入来指导对话,这是具有挑战性和耗时的,所以在此探讨了建立可扩展技术的潜力,以促进交际代理之间的自主合作,并提供对其“认知”过程的洞察力。其次,他介绍了角色扮演的框架结构,然后,深入探讨了框架背后的技术要点并展示了Instruction-following的合作方式,与会话语言模型的其他技术不同,该篇工作的提示工程仅发生在角色扮演的开始,用于任务规范和角色分配。最后,他阐述了为得出最终设计选择而进行的各种实验,直观说明了框架的潜在扩展,并展望了未来人工智能社会可能带来的风险和机遇。

★ Panel ★

多智能体合作和通信

王磊:在多智能体的游戏中,以狼人杀为例,会遇到很多问题。比如说在多人交互的游戏中,信息是如何被存储和调用的以及角色信息的更新等。在未来,对于分布式结构的设计、更大网络的构造,这都需要深入探讨。

贺壮壮:对于一个智能体,需要与它进行反复沟通让其自我反思,而对于多个智能体,在未来则有可能提供一种结构化的方式或者更灵活的方案使其完成任务,从而适应更丰富的应用场景。

李国豪:当大模型的能力强大到一定程度,如何让多个智能体更好地合作是未来很重要的研究方向。当然,合作也不是唯一的方式,也可以竞争,探索智能体之间不同的交互方式也是十分有意义的,这样就能模拟更多的社会场景,将智能体应用到更复杂的任务中。

大语言模型如何更好地解决NLP领域外的任务?比如推荐系统

王磊:Instruction Tuning是一个较好的解决推荐系统的方式,我们可以使用自己研究领域的数据在效果较好的开源模型上进行微调。如果使用大模型的话,对于推荐系统这种任务,需要调用工具结合已有的推荐系统进行合作,而对于其他的任务则可以参考Instruction Tuning以及Tool Transformer的方式。

贺壮壮:推荐任务主要是从用户的影视反馈当中去学习用户的偏好,但是它不同于自然语言处理任务时有明确的文字输入。用大模型解决推荐系统的相关任务,需要根据任务的具体形式,选择能力合适匹配的大模型解决问题。

李国豪:用大模型解决NLP以外的任务需要根据具体的任务形式以及大模型的特性确定。对于科学的问题需要严谨的工具,对于推理的任务则需要更好的验证手段,这要根据不同的任务具体问题具体分析。

大模型时代,普通的科研者应该何去何从?

王磊:大模型未能覆盖到的领域都值得研究者去尝试。在大模型的研究过程中也产生了很多新的问题,这也很值得大家进行探讨。大模型能够对我们的科学研究提供帮助,但是它也不是万能的,也存在着局限性,只是起到一个辅助的作用。

贺壮壮:计算机领域的研究从传统的机器学习到神经网络,再到如今的大模型,会让人感觉很多研究一夜之间变得没有意义。但是大模型可以辅助日常的研究,甚至可能对一些不太热点的研究方向提供帮助。

李国豪:大模型时代,不论是投身于大模型的研究,还是在资源有限的情况下继续解决当下的研究难题,每一个科研工作者可以有自己的选择。不可否认的是,大模型时代让科研方式发生了很大的改变,大模型若是要长远发展下去,我们需要转换研究思路,思考更多关于大模型的安全性问题,使其更符合人类的意图。

整理:陈研

审核:王磊、李国豪

往期精彩文章推荐

a5cefebe482e79021fbfb98898fa7cda.jpeg

记得关注我们呀!每天都有新知识!

 关于AI TIME 

AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。

迄今为止,AI TIME已经邀请了1000多位海内外讲者,举办了逾550场活动,超600万人次观看。

0acfa44d99c900cce3ab7011ad67b6d2.png

我知道你

在看

~

966a006daf2ebc177817be08263f83fe.gif

点击 阅读原文 查看回放!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/656457.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

自然语言处理从入门到应用——词向量的评价方法

分类目录:《自然语言处理从入门到应用》总目录 对于不同的学习方法得到的词向量,通常可以根据其对词义相关性或者类比推理性的表达能力进行评价,这种方式属于内部任务评价方法(Intrinsic Evaluation)。在实际任务中&am…

Linux学习[15]bash学习深入1---bash的功能---变量详解

文章目录 前言:1. bash功能2. 变量2.1 变量赋值2.2 unset取消变量2.3 环境变量 总结 前言: 之前在学树莓派相关内容的时候,对bash脚本的简单上手做了一个总结,并且归纳到下面三个博客。 当时参考的书为《从树莓派开始玩转linux》…

Gitlab CI/CD入门(一)Python项目的CI演示

本文将介绍CI/CD的基本概念,以及如何使用Gitlab来实现CI/CD。   本文介绍的CI/CD项目为个人Gitlab项目:gitlab_ci_test,访问网址为:https://gitlab.com/jclian91/gitlab_ci_test。 CI/CD的含义 在现代软件工程中,CI…

【主跑例子】 Framework01、02;QFramework00(我跟着视频的旧版本,但推荐用最新的)、01(无)、02(无)、03(无)

总体介绍 做的是 00,10,13,考虑做10。 11,12没下载,当时把这两个误认为 00,10 用到了UniRx Framework有2个 00 Unity 游戏框架搭建 2019 第一季 C# 核心知识与简易 Manager Of Managers 框架搭建 120课数 01 Unity 游戏框架搭建 2019 第二季 模块/系统…

前端Vue仿滴滴打车百度地图定位查找附近出租车或门店信息(更新版)

前端vue仿滴滴打车百度地图定位查找附近出租车或门店信息, 下载完整代码请访问uni-app插件市场地址:https://ext.dcloud.net.cn/plugin?id12982 效果图如下: # #### 使用方法 使用方法 <!-- 官方文档&#xff1a; https://dafrok.github.io/vue-baidu-map/#/zh/start/b…

五子棋:起源、原理与游戏规则、vue实现五子棋案例游戏

目录&#xff1a; 引言五子棋的历史背景五子棋的原理五子棋的游戏规则五子棋游戏的实现 5.1 创建 Vue 组件 5.2 初始化棋盘 5.3 下棋与判断胜负 5.4 渲染棋盘与棋子总结 更多知识 学习&#xff1a;https://www.processon.com/view/60504b5ff346fb348a93b4fa#map 引言 五子棋…

解密大型语言模型:从相关性中发现因果关系?

深度学习自然语言处理 原创作者&#xff1a;wkk 因果推理是人类智力的标志之一。因果关系NLP领域近年来引起了人们的极大兴趣&#xff0c;但其主要依赖于从常识知识中发现因果关系。本研究提出了一个基准数据集(CORR2CAUSE)来测试大语言模型(LLM)的纯因果推理能力。其中CORR2CA…

I/O体系结构和设备驱动程序(一)

I/O体系结构 让信息在CPU、RAM和I/O设备之间流动的数据通路称之为总线&#xff0c;即计算机内的主通信通道。所有计算机都有一条系统总线&#xff08;一种典型的系统总线是PCI总线&#xff09;&#xff0c;连接内部大部分的硬件设备。计算机内不同的总线可以通过“桥”进行连接…

lua语言的闭包设计和LClosure解读

什么是闭包 闭包是一种特殊的函数&#xff0c;它可以访问其创建时所处的环境中的变量&#xff0c;即使在函数创建后&#xff0c;环境已经不再存在&#xff0c;这些变量仍然可以被访问。 为了更好地理解闭包&#xff0c;我们可以看一个例子&#xff1a; function counter()lo…

Appium知多少

Appium我想大家都不陌生&#xff0c;这是主流的移动自动化工具&#xff0c;但你对它真的了解么&#xff1f;为什么很多同学搭建环境时碰到各种问题也而不知该如何解决。 appium为什么英语词典查不到中文含义&#xff1f; appium是一个合成词&#xff0c;分别取自“applicatio…

OpenAI官方提示词课(七)制作一个聊天机器人

大型语言模型的一个令人兴奋的方面是&#xff0c;你可以利用它来构建一个定制的聊天机器人&#xff0c;并且只需付出少量的努力。ChatGPT 的网页界面可以让你与一个大型语言模型进行对话。但其中一个很酷的功能是&#xff0c;你也可以利用大型语言模型构建你自己的定制聊天机器…

案例 | 标杆引领!人大金仓智绘数字金融

随着中央数字经济政策推进金融业数字化建设&#xff0c;数字金融已初见成效&#xff0c;但尚存在信息安全缺乏保障、转型覆盖不全面等问题。 为实现金融行业全面数字化转型升级&#xff0c;作为数据库领域国家队&#xff0c;人大金仓紧跟国家战略&#xff0c;自主研发的系列数据…

msvcp110.dll丢失原因——msvcp110.dll丢失怎么修复(最新可修复)

昨天卸载了一个垃圾软件以后&#xff0c;我的其他软件就无法打开运行&#xff0c;提示msvcp110.dll丢失&#xff0c;无法继续执行此代码。今天早上找了很多方法&#xff0c;终于把msvcp110.dll丢失的原因以及修复的方法都弄明白了。msvcp110.dll是一个非常重要的文件&#xff0…

【CVE-2022-0185】Linux kernel [文件系统挂载API] 堆溢出漏洞分析与利用

0x00.一切开始之前 CVE-2022-0185 是 2022 年初爆出来的一个位于 filesystem context 系统中的 fsconfig 系统调用中的一个堆溢出漏洞&#xff0c;对于有着 CAP_SYS_ADMIN 权限&#xff08;或是开启了 unprivileged namespace&#xff09;的攻击者而言其可以利用该漏洞完成本地…

Hugging News #0616: 有几项非常重要的合作快来围观、最新中文演讲视频回放发布!...

每一周&#xff0c;我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新&#xff0c;包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等&#xff0c;我们将其称之为「Hugging News」&#xff0c;本期 Hugging News 有哪些有趣的消息…

【MySQL】SQL的函数用法

文章目录 聚合函数Count()Max()Min()Sum()Avg() 其他常用函数时间函数字符串函数SUBSTRING函数:切割字符串([start:end])SUBSTRING_INDEX函数:切割字符串(split)LOWER&UPPER函数:大小写转化CONCAT&CONCAT_WS函数:连接字符串REPLACE函数:字符串替换 数学函数ROUND函数:四…

rhce8考试

rhce考试模拟环境准备&#xff1a; cat /etc/rht 确认当前是否为294环境&#xff0c;真实考试有5台被管理节点&#xff0c;借助bastion当做第5台。 将考试所需的文件放到这个目录&#xff0c;/content/courses/rh294/rhel8.0/materials目录&#xff0c;虚拟机看br0网卡信息ifc…

使用LOAD DATA INFILE命令加载数据文件到MySQL数据库的方法和常见错误及解决方法

文章目录 使用LOAD DATA INFILE命令加载数据文件到MySQL数据库的方法和常见错误及解决方法LOAD DATA INFILE的语法详细1.创建&#xff08;选择&#xff09;目标数据库和表2.将数据从 CSV 文件导入已创建的表常见错误和解决方法错误1&#xff1a;ERROR 1290 (HY000): The MySQL …

linux_centos7.9/ubuntu20.04_下载镜像及百度网盘分享链接

1、镜像下载站点 网易开源镜像&#xff1a;http://mirrors.163.com/ 搜狐开源镜像&#xff1a;http://mirrors.sohu.com/ 阿里开源镜像&#xff1a;https://developer.aliyun.com/mirror/ 首都在线科技股份有限公司&#xff1a;http://mirrors.yun-idc.com/ 常州贝特康姆软件技…