2023智源大会议程公开 | 生成模型论坛

news2025/1/16 6:04:33

254c1ac1d65b6a174bdce4079d4fb7b1.png

200ececd52c2831bcd5abe307c7f9098.png

2023年,人工智能新研究、新系统、新产品竞放——我们即将见证另一场有关智能的惊叹演化。6月9日,2023北京智源大会,将邀请这一领域的探索者、实践者、以及关心智能科学的每个人,共同拉开未来舞台的帷幕,你准备好了吗?与会知名嘉宾包括,2019年图灵奖得主Yann LeCun、图灵奖得主Geoffrey Hinton、图灵奖得主Joseph Sifakis、诺贝尔奖得主Arieh Warshel、未来生命研究所创始人Max Tegmark、2021年科学突破奖得主David Baker、2022吴文俊最高成就奖得主郑南宁院士以及中国科学院张钹院士等。目前已正式开放大会线上报名渠道。大会将同步向全球线上直播。

北京智源大会倒计时:19

生成模型论坛背景

内容生成是一项极富挑战且通用的智能任务。随着概率建模方法的快速发展和模型规模的急速增长,以自回归模型、生成对抗网络、扩散概率模型为代表的深度生成模型在语言、视觉、语音、跨模态等数据上取得了一系列进展。特别地,基于预训练的深度生成大模型在众多下游任务取得了新的突破。可以预见到,深度生成模型将会给学术界和工业界带来冲击和新的机遇。本次论坛邀请到五位生成模型领域的国内外著名学者围绕生成模型基础理论与算法、可控生成以及语音、三维场景、多模态生成等前沿领域带来精彩报告,并聚焦大家最关心的进展,讨论如何看待生成式AI的发展,包括数据的偏性,模型的安全性等亟待解决的问题。希望以此论坛为契机,共同展望生成式AI的未来,碰撞出学术的火花!

论坛议程

a8db36f677eb4f6d6d86e0571653ec69.jpeg

论坛主席 

44d5c10b1d02aa1635d20ab1b149c9b8.png

李崇轩,中国人民大学高瓴人工智能学院准聘助理教授,博士生导师

研究方向为深度概率学习,李崇轩获 ICLR 杰出论文奖,吴文俊人工智能自然科学奖一等奖,吴文俊人工智能优秀青年奖,中国计算机学会优秀博士学位论文奖,北京市科技新星,中国博士后创新人才支持计划。主持国家自然科学基金面上项目,教育部产学结合协同育人项目等。

论坛主席丨主持人

bf28c9b19c6d7c81fcb2105ad5c585c7.png

陈键飞,清华大学助理教授

陈键飞于2014年和2019年分别在清华大学获得了计算机科学的学士和博士学位,并在TSAIL组与朱军教授合作。他的研究兴趣包括高效机器学习,特别是量化神经网络、随机优化算法和概率推理算法。在过去,他还开发了几个可扩展的主题模型训练系统。2019年,陈键飞因杰出的工作获得了CCF优秀博士学位论文奖。他还曾在2009年获得中国信息学奥林匹克竞赛金牌。2018年,陈键飞共同创立了RealAI,这是他职业生涯中的一个显著成就。

演讲主题及嘉宾介绍

1、Recent advances in score-based diffusion models

议题简介:Generative models are typically based on explicit representations of probability distributions (e.g., autoregressive) or implicit sampling procedures (e.g., GANs). I will present an alternative approach based on modeling directly the vector field of gradients of the data distribution (scores) which underliesrecent score-based diffusion models. This framework allows flexible architectures, requires no sampling during training or the use of adversarial training methods. Additionally, score-based diffusion generative models enable exact likelihood evaluation through connections with neural ODEs, achieving state-of-the-art sample quality and excellent likelihoods on image datasets. I will discuss numerical and distillation methods to accelerate sampling and their application to inverse problem solving.

8629314849a2af70b931916e4f48d7fc.png

Stefano Ermon,斯坦福大学计算机科学系副教授

Stefano Ermon是斯坦福大学计算机科学系的副教授,隶属于人工智能实验室,同时也是伍兹环境研究所的研究员。他的研究方向是机器学习和生成式人工智能。他喜欢开发具有原则性的方法,这些方法受到具体的现实世界应用和广泛社会问题的推动。

2、多模态生成式语音模型

议题简介:AIGC在最近几个月获得了巨大的突破,用户可以输入自然语言生成图像、视频、音频、甚至是3D模型。现有跨模态语音生成方法在人机交互场景下,存在着存在着合成推理的实时性、可控性和通用性等挑战。针对上述挑战,本次报告主要介绍跨模态生成式语音模型中频谱图合成的并行化推理、多峰性建模、轻量级推理、高表现力建模、泛化学习、多模态可控、多任务通用合成等工作(NATSpeech、DiffSpeech和AudioGPT)。

da15ae9ad1a157104b381109df38295f.png

赵洲,浙江大学计算机学院教授、博士生导师

主要研究方向为自然语言理解、计算机视觉计算和生成式模型,在国际期刊和会议上发表50余篇论文,谷歌学术引用8000多次。完成了多个多模态生成式模型的工作,如生成式语音模型(NATSpeech、DiffSinger、Make-An-Audio、AudioGPT)和生成式视觉模型(PNDM、PDAE和GeneFace)等,应用于微软、华为、Stable-Diffusion和字节等科技公司产品中,获教育部科技进步一等奖、中国电子学会科技进步一等奖。

3、“低资源”的多语言文生图模型AltDiffusion-M18

议题简介:AltDiffusion-M18是一种多语言文生图模型,它采用AltCLIP-M18的多语言文本编码器来扩展SD框架的输入语言,支持18种不同的语言输入。实验结果表明,AltDiffusion-M18在英文方面表现与原始SD模型相当,同时在其他非英文文本到图像生成模型方面取得了SOTA的性能。该研究推进了跨语言图像生成技术的发展,为在不同语言环境下使用文本到图像技术开辟了新的可能性。

a4011ac823a01f0b884e514e29ac0caf.png

刘广,北京智源人工智能研究院 NLP与多模态研究中心,算法研究员

北京邮电大学智能科学与技术博士。FlagAI核心贡献者,主要研究LLM和多模态文图生成方向。

4、Controllable and Interactive Scene Generation from Bird Eyes View Layout (基于鸟瞰图的可控和可交互的大规模场景生成)

议题简介:本报告将分享课题组在可控和可交互场景生成研究方向的一些最新研究成果,涉及生成式神经场(Generative Radiance Fields)和MetaDriverse自动驾驶模拟器等工作。

27340b7874fe5e6bc8c4fa3397cc0507.png

周博磊,加州大学洛杉矶分校计算机科学系的助理教授

他的研究方向是计算机视觉和机器自主性中的可解释人工智能交互。他还对当前AI模型的各种人本属性感兴趣,这些属性超越了它们的准确性,例如可解释性,可控性,泛化性和安全性。他合作发表的一些早期作品包括Class Activation Mapping(CAM),Places,ADE20K和Network Dissection。

5、Understanding the Visual World Through Naturally Supervised Code

议题简介: The visual world has its inherent structure: scenes are made of multiple identical objects; different objects may have the same color or material, with a regular layout; each object can be symmetric and have repetitive parts. How can we infer, represent, and use such structure from raw data, without hampering the expressiveness of neural networks? In this talk, I will demonstrate that such structure, or code, can be learned from natural supervision. Here, natural supervision can be from pixels, where neuro-symbolic methods automatically discover repetitive parts and objects for scene synthesis. It can also be from objects, where humans during fabrication introduce priors that can be leveraged by machines to infer regular intrinsics such as texture and material. When solving these problems, structured representations and neural nets play complementary roles: it is more data-efficient to learn with structured representations, and they generalize better to new scenarios with robustly captured high-level information; neural nets effectively extract complex, low-level features from cluttered and noisy visual data.

ea31f12d50a946c5877c101557770d31.png

吴佳俊,斯坦福大学计算机科学系助理教授

隶属于斯坦福人工智能实验室(SAIL)和斯坦福视觉与学习实验室(SVL)。他的研究方向是机器感知、推理和与物理世界的交互,从人类认知中汲取灵感。在加入斯坦福之前,吴佳俊曾在Google Research纽约分部担任访问教职研究员,与Noah Snavely合作。他在MIT获得博士学位,导师为Bill Freeman和Josh Tenenbaum,并在清华大学获得学士学位,师从Zhuowen Tu教授。

6、圆桌讨论

圆桌论坛嘉宾:

陈键飞,清华大学助理教授

朱  军,清华大学教授

周博磊,加州大学洛杉矶分校助理教授

吴佳俊,斯坦福大学助理教授

李崇轩,中国人民大学准聘助理教授

扫码二维码或点击「阅读原文」报名线下参会&线上直播

fd002ab50887d06ed209a80e1bb45ace.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/557513.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

chatgpt赋能Python-python_geo

Python在地理空间数据分析中的应用 在地理空间信息系统领域,Python已经成为最流行的编程语言之一。Python有许多强大的地理空间库,例如GDAL,Shapely和Fiona等,这使得它成为了地理空间数据分析中不可或缺的一部分。 1. Python的地…

快速上手打通java中的IO流

目录 IO原理 流的分类 节点流和处理流 IO 流体系 InputStream & Reader InputStream Reader OutputStream & Writer OutputStream Writer 节点流(或文件流) 读取文件 写入文件 注意点 缓冲流 转换流 标准输入、输出流 打印流 数据流 对象流 O…

chatgpt赋能Python-python_for_局部变量

Python局部变量详解 Python是一种动态语言,其中一个特点是变量声明和赋值同时进行,因此变量类型在声明时可以不指定,而是在赋值时根据数据类型来推断。Python中的变量分为全局变量和局部变量。在本文中,我们将讨论Python中的局部…

【PCB专题】案例:使用SI9000阻抗计算线宽线距为PCB Layout提供参考

在实际工作中,我们会使用到高速信号(如USB2.0、MIPI、HDMI、以太网等)或射频信号。那么在PCB中这些信号都需要做阻抗匹配,防止信号产生反射而损耗和生成噪声。 阻抗对信号质量的影响很明显,我们可以利用眼图来分析信号质量。 下图所示为TI都是在90欧姆差分阻抗源经过了90欧…

论文改进想法

论文改进想法 当 z p r e v z_{prev} zprev​(上一轮本地训练好的发往server的模型得到的表征)与 z z z(这轮正在被更新的本地模型得到的表征)相似或是差别不大时,我们将 l c o n \mathcal{l}_{con} lcon​定为0&…

Go设计模式--中介者,最后的模式!

大家好,这里是每周都在陪你一起进步的网管~!今天继续学习设计模式,也是我们要学习的最后一个设计模式—中介者模式,对这个模式有一点了解后会觉得它跟我们已经学过的观察者模式挺像,但是两者还是有些区别的…

chatgpt赋能Python-python_entry如何清空

Python Entry如何清空 Python是一种高级编程语言,因其简单易学、代码优美而被广泛应用于数据科学、机器学习、Web开发等领域。在Python中,Entry是常用的GUI元素之一,用于接受用户输入。但有时候需要清空Entry中的文本,本文将介绍…

python中字符串的类型转换

一、使用eval----含有{}字符串的转换为list、tuple、dict- eval():将字符串str当成有效的表达式来求值并返回计算结果 (1)字符串转换为列表 (2)字符串转换为元组 a " ([1,3],[1,2],[1,1])…

STM8 调试红外遥控器HS003B

背景 项目中使用STM8S003F3P6,控制红外遥控器HS003B,调试过程也遇到了很多问题,这里做个记录。 问题1:长按按键问题,如果长按遥控的某个按键,应该是一直能响应该按键值(需要对接收状态、接收信…

工作模式(3)

8bit PWM PWM模式开启时,计数器与比较寄存器连续比较,当计数值小于比较寄存器,输出为低,当计数值大于等于比较寄存器,输出为高,并且保持到计数值等于重载寄存器,然后计数器回到0开始重新计数&am…

【三维激光扫描】实验05:点云数据预处理操作

SiScan软件可以对三维激光扫描的点云数据进行一些列的预处理操作,如:粗差剔除、点云抽稀、点云分割、调整水平面、删除分割面等等。 粗差剔除剔除粗差点抽稀抽稀数据点云分割根据点云的三维特征进行分组调整水平面根据三个点来调整水平面分割面水平纠正根据分割面进行水平纠正…

小心你的 OpenAI Key 被盗!

公众号关注 “GitHubDaily” 设为 “星标”,每天带你逛 GitHub! 今年随着 ChatGPT 发布,其强悍的能力也让 GPT-3.5/4 成为炙手可热的大语言模型,使得不少 AI 应用接入了 OpenAI 接口。当用户使用这些应用时,经常需要填…

Python自动化办公对每个子文件夹的Excel表加个表头(Excel不同名)(上篇)

点击上方“Python爬虫与数据挖掘”,进行关注 回复“书籍”即可获赠Python从入门到进阶共10本电子书 今 日 鸡 汤 含情凝睇谢君王,一别音容两渺茫。 大家好,我是皮皮。 一、前言 上一篇文章,我们抛出了一个问题,这篇文章…

工作模式(2)

输入捕捉 输入捕捉功能的主要特点: ⚫ 上升沿或下降沿捕捉 ⚫ 脉冲宽度捕捉或脉冲周期捕捉 ⚫ 带清零的捕捉或自由计数捕捉 ⚫ 单次捕捉或连续捕捉 捕捉模式只能工作在16bit级联模式下,从0开始计数。当选择上升沿捕捉周期模式时,电路在检测到…

chatgpt赋能Python-python_fetchone

Python fetchone方法简介 在Python编程领域中,fetchone()是一个经常使用的方法。fetchone()方法用于从数据库中获取单个结果,并将结果存储在变量中。本文将介绍fetchone()方法的详细信息,并探讨如何在Python中使用该方法。 什么是fetchone方…

chatgpt赋能Python-python_chariot

Python Chariot:一款强大的Python IDE Python Chariot是一款强大的Python IDE,它的特点是简单易用,功能齐全。该IDE适用于各种Python编程任务,无论是编写小型脚本还是大型项目。在本文中,我们将深入介绍Python Chario…

Windows本地快速搭建SFTP服务共享文件 - 外网访问【端口映射】

文章目录 1. 搭建SFTP服务器1.1 下载 freesshd服务器软件1.3 启动SFTP服务1.4 添加用户1.5 保存所有配置 2 安装SFTP客户端FileZilla测试2.1 配置一个本地SFTP站点2.2 内网连接测试成功 3 使用cpolar内网穿透3.1 创建SFTP隧道3.2 查看在线隧道列表 4. 使用SFTP客户端&#xff0…

基于SpringBoot的停车位智能管理系统的设计与实现_kaic

摘 要 随着经济与交通事业的飞速发展,汽车的保有量呈现上升趋势,公共停车位 智能化在信息时代显得尤为重要。面对有限的公共停车位与上升的汽车保有量, 通过合理利用公共停车位来提高车位的利用率是大势所趋。 基于上述背景,本论…

为生信写的Python简明教程 | 视频4

开源生信 Python教程 生信专用简明 Python 文字和视频教程 源码在:https://github.com/Tong-Chen/Bioinfo_course_python 目录 背景介绍 编程开篇为什么学习Python如何安装Python如何运行Python命令和脚本使用什么编辑器写Python脚本Python程序事例Python基本语法 数…

基于 Log 的通用增量 Checkpoint 在美团的进展

摘要:本文整理自美团计算引擎工程师王非凡,在 Flink Forward Asia 2022 核心技术专场的分享。本篇内容主要分为四个部分: 1. Log based Checkpoint 基本原理介绍 2. 美团应用场景及测试效果 3. Changelog Restore 性能优化 4. Changelog 存储…