点击蓝字
关注我们
AI TIME欢迎每一位AI爱好者的加入!
ChatGPT的横空出世刷新了我们对这个世界的认知和想象,而大型语言模型也逐渐成为学术界的研究热点。在自然语言处理、智能推荐、知识获取、智能对话等领域,大模型发挥着越来越重要的作用。
2023年5月19日,AI TIME举办的大模型专场五活动邀请了新加坡管理大学四年级博士生王磊,KAUST计算机博士李国豪。两位一作学者分享了自己在大模型领域的最新研究进展,并就当下的大模型热点问题展开讨论,给观众带来了一场精彩的科学思辨活动。
王磊:基于大语言模型零样本推理的应用:数学题求解,下一个物品推荐
大型语言模型(LLM)例如GPT-3,在各种自然语言处理(NLP)任务中取得了令人瞩目的成果。许多工作也已经证明,LLM能够在零样本设置下通过特定于任务的提示解决许多已知的NLP问题,即无需任何演示示例或进一步训练。
王磊首先分析了大模型应用在推荐系统任务中存在的问题,即域差距、推荐系统空间过大、建模用户的偏好存在困难等,进而引出该篇工作的研究动机——探索LLM在零样本设置中执行下一项推荐的潜力。然后,重点介绍了该篇工作中提出的三步提示方法执行的三个子任务:捕获用户偏好、提示代表性电影、针对性推荐,并展示了实验的结果,在零样本设置中,基于NIR的提示方法始终优于Simple Prompting和CS-Random-IF/UF。最后,他建议在提示过程中结合用户偏好、代表性电影选择和格式化技术,让GPT-3做出更好的推荐。
李国豪:CAMEL: Communicative Agents for ''Mind'' Exploration of Large Scale Language Model Society
基于对话和聊天的语言模型的快速发展导致了复杂任务解决方面的显著进步。
本次分享中,李国豪首先介绍了该篇工作的研究动机,目前LLM的成功在很大程度上依赖于人类的输入来指导对话,这是具有挑战性和耗时的,所以在此探讨了建立可扩展技术的潜力,以促进交际代理之间的自主合作,并提供对其“认知”过程的洞察力。其次,他介绍了角色扮演的框架结构,然后,深入探讨了框架背后的技术要点并展示了Instruction-following的合作方式,与会话语言模型的其他技术不同,该篇工作的提示工程仅发生在角色扮演的开始,用于任务规范和角色分配。最后,他阐述了为得出最终设计选择而进行的各种实验,直观说明了框架的潜在扩展,并展望了未来人工智能社会可能带来的风险和机遇。
★ Panel ★
多智能体合作和通信
王磊:在多智能体的游戏中,以狼人杀为例,会遇到很多问题。比如说在多人交互的游戏中,信息是如何被存储和调用的以及角色信息的更新等。在未来,对于分布式结构的设计、更大网络的构造,这都需要深入探讨。
贺壮壮:对于一个智能体,需要与它进行反复沟通让其自我反思,而对于多个智能体,在未来则有可能提供一种结构化的方式或者更灵活的方案使其完成任务,从而适应更丰富的应用场景。
李国豪:当大模型的能力强大到一定程度,如何让多个智能体更好地合作是未来很重要的研究方向。当然,合作也不是唯一的方式,也可以竞争,探索智能体之间不同的交互方式也是十分有意义的,这样就能模拟更多的社会场景,将智能体应用到更复杂的任务中。
大语言模型如何更好地解决NLP领域外的任务?比如推荐系统
王磊:Instruction Tuning是一个较好的解决推荐系统的方式,我们可以使用自己研究领域的数据在效果较好的开源模型上进行微调。如果使用大模型的话,对于推荐系统这种任务,需要调用工具结合已有的推荐系统进行合作,而对于其他的任务则可以参考Instruction Tuning以及Tool Transformer的方式。
贺壮壮:推荐任务主要是从用户的影视反馈当中去学习用户的偏好,但是它不同于自然语言处理任务时有明确的文字输入。用大模型解决推荐系统的相关任务,需要根据任务的具体形式,选择能力合适匹配的大模型解决问题。
李国豪:用大模型解决NLP以外的任务需要根据具体的任务形式以及大模型的特性确定。对于科学的问题需要严谨的工具,对于推理的任务则需要更好的验证手段,这要根据不同的任务具体问题具体分析。
大模型时代,普通的科研者应该何去何从?
王磊:大模型未能覆盖到的领域都值得研究者去尝试。在大模型的研究过程中也产生了很多新的问题,这也很值得大家进行探讨。大模型能够对我们的科学研究提供帮助,但是它也不是万能的,也存在着局限性,只是起到一个辅助的作用。
贺壮壮:计算机领域的研究从传统的机器学习到神经网络,再到如今的大模型,会让人感觉很多研究一夜之间变得没有意义。但是大模型可以辅助日常的研究,甚至可能对一些不太热点的研究方向提供帮助。
李国豪:大模型时代,不论是投身于大模型的研究,还是在资源有限的情况下继续解决当下的研究难题,每一个科研工作者可以有自己的选择。不可否认的是,大模型时代让科研方式发生了很大的改变,大模型若是要长远发展下去,我们需要转换研究思路,思考更多关于大模型的安全性问题,使其更符合人类的意图。
整理:陈研
审核:王磊、李国豪
往期精彩文章推荐
记得关注我们呀!每天都有新知识!
关于AI TIME
AI TIME源起于2019年,旨在发扬科学思辨精神,邀请各界人士对人工智能理论、算法和场景应用的本质问题进行探索,加强思想碰撞,链接全球AI学者、行业专家和爱好者,希望以辩论的形式,探讨人工智能和人类未来之间的矛盾,探索人工智能领域的未来。
迄今为止,AI TIME已经邀请了1000多位海内外讲者,举办了逾550场活动,超600万人次观看。
我知道你
在看
哦
~
点击 阅读原文 查看回放!