Geoffrey Hinton、姚期智、张钹、Sam Altman等专家共话AI安全与对齐丨2023智源大会议程公开...

news2024/11/25 12:40:48

53db6bcd23e70100ba99a2420010a086.png

292e91f98c2396d62c029b165a60eb2d.jpeg

6月9日,2023北京智源大会,将邀请AI领域的探索者、实践者、以及关心智能科学的每个人,共同拉开未来舞台的帷幕,你准备好了吗?与会知名嘉宾包括,图灵奖得主Yann LeCun、OpenAI创始人Sam Altman、图灵奖得主Geoffrey Hinton、图灵奖得主Joseph Sifakis、诺贝尔奖得主Arieh Warshel、未来生命研究所创始人Max Tegmark、2021年科学突破奖得主David Baker、2022吴文俊最高成就奖得主郑南宁院士以及中国科学院张钹院士等。目前已正式开放大会线上报名渠道。大会将同步向全球线上直播。

北京智源大会倒计时:10

AI安全与对齐论坛丨6月10日全天

进入大模型时代,如何确保越发强大和通用的人工智能系统安全可控,符合人类意图和价值观,是极为重要的一个问题。这一安全问题又被称为人机对齐(AI alignment)问题,它代表了本世纪人类社会面临的最紧迫和最有意义的科学挑战之一。本次论坛邀请到「深度学习之父」Geoffrey Hinton、OpenAI创始人Sam Altman和张钹院士等14位国内外嘉宾围绕人机对齐、大模型的可拓展监督、人工智能的生存风险,以及其他人工智能安全相关的议题带来精彩报告。希望以此论坛为契机,共同展望AI的挑战和机遇,碰撞出学术的火花!

联合举办:安远AI,使命是引领人机关系走向安全、可信、可靠的未来,面向大模型和通用人工智能的安全和对齐问题建立技术社区、开展治理研究以及推动国际交流。

论坛议程

6834fa01eb2b872895fd5317ebf5973a.jpeg

论坛主席

5d4997872d0d72bea9b30a2fc9affb95.jpeg

张钹,中国科学院院士、智源研究院学术顾问委员会主席

中国科学院院士,清华大学人工智能研究院名誉院长、中国人工智能领域首批研究者、汉堡大学自然科学荣誉博士、俄罗斯自然科学院外籍院士、微软亚洲研究院技术顾问、国家“863”高技术计划智能机器人主题专家组专家,获得吴文俊人工智能最高成就奖、CCF终身成就奖、ICL欧洲人工智能奖、国家科委和计委颁发的个人金牛奖、为国家重点实验室做出重大贡献的先进工作者、国家教委科技进步一等奖、电子工业部科技进步一等奖以及国防科工委科技进步一等奖、国家教委高等学校出版社优秀学术专著特等奖、国家自然科学三等奖等。 

主持人

95ad89c6f94165010087b88b2626c7ec.png

谢旻希,安远AI创始人

兼任牛津大学成立的人工智能治理中心(Centre for the Governance of AI)政策研究员,同济大学出版社《全球视野下的人工智能治理》副主编,AAAI、IJCAI人工智能安全研讨会(SafeAI)组委会成员,IEEE可信人工智能工作组P2894成员。

演讲主题及嘉宾介绍

1、论坛开幕主题演讲& 问答环节

1ae45df2a5ea69151b9166ea18831d27.jpeg

Sam Altman,ChatGPT母公司OpenAI联合创始人

Sam Altman(萨姆·奥尔特曼)是一位美国的企业家、程序员和投资者。他当前是ChatGPT母公司OpenAI的联合创始人和董事会成员、曾经担任过Y Combinator的总裁。

25332fd635e38717af065dc6214a7b91.jpeg

张宏江,智源研究院理事长

北京智源人工智能研究院理事长,美国国家工程院外籍院士。原微软亚太研发集团首席技术官,曾任金山软件CEO、微软亚太研发集团CTO、微软亚洲工程院院长、微软亚洲研究院副院长,微软第一批“杰出科学家”。国际计算机协会(ACM)和电气电子工程协会(IEEE)双会士,曾获2010年IEEE计算机学会技术成就奖和2012年ACM多媒体杰出技术成就奖,并获评2008年度美国杰出亚裔工程师奖。发表过近四百篇学术论文,编著过多本学术专著。自2018年起,在Guide2Research发布的世界顶尖计算机科学家排名中,蝉联中国大陆科学家榜首。

2、「AI: Some thoughts? 」& 专家对谈

a0c3405d978d482bb118bb972863652b.jpeg

Stuart Russell,加州伯克利分校教授

ACM Fellow、AAAI Fellow、AAAS Fellow。1995年荣获IJCAI Computers and Thought Award。他与Google研究总监Peter Norvig合著的《人工智能:一种现代的方法》是人工智能权威教材。2020年,他的新书《AI新生:破解人机共存密码——人类最后一个大问题》(Human Compatible:Artificial intelligence and The problem of control)在中国出版。

db4a895748c79bf938ec3701d1618602.jpeg

姚期智,图灵奖得主,中国科学院院士

姚期智,世界著名计算机学家,2000年图灵奖得主,中国科学院院士,美国科学院外籍院士,美国科学与艺术学院外籍院士,国际密码协会会士,清华大学交叉信息研究院院长,"清华学堂计算机科学实验班""清华学堂人工智能班"首席教授,973项目首席科学家,香港中文大学博文讲座教授。

3、Anthropic’s Core Views on AI Safety

370dba973ebf3687be95bd8d71a15b79.png

Christopher Olah,Anthropic联合创始人

Chris Olah works on reverse engineering artificial neural networks into human understandable algorithms. Olah is one of the co-founders of Anthropic, an AI lab focused on the safety of large models. Previously, he led interpretability research at OpenAI, worked at Google Brain, and co-founded Distill, a scientific journal focused on outstanding communication.

4、Aligning Massive Models: Present and Future Challenges

e9fd84ab0779c0e1356c70204bf82fbd.png

Jacob Steinhardt,加州伯克利分校助理教授

Jacob Steinhardt is an Assistant Professor in the department of Statistics at UC Berkeley. His research goal is to make the conceptual advances necessary for machine learning systems to be reliable and aligned with human values. He studies robustness of ML models, reward specification and reward hacking, and techniques for scalable alignment. He consults part-time for Open Philanthropy and has previously worked at OpenAI. He is a coach for the USA Computing Olympiad and an instructor for SPARC. For more info please see his website:https://jsteinhardt.stat.berkeley.edu/.

5、中文大语言模型的安全性研究

6b97fdf9a719e17b3ac6429f35c6667d.jpeg

黄民烈,清华大学计算机科学与技术系副教授

黄民烈博士,清华大学长聘副教授,国家杰青,中文信息学会自然语言生成与智能写作专委会副主任、CCF学术工作委员会主任助理,获国家自然科学基金重点项目资助。他的研究领域为自然语言处理,特别是自然语言生成、对话系统、阅读理解等。曾获得中国人工智能学会吴文俊人工智能科技进步奖一等奖(第一完成人),中文信息学会汉王青年创新奖,阿里巴巴创新合作研究奖。著有《现代自然语言生成》一书,在国际会议期刊发表论文超过100篇,多次获得国际主流会议的最佳论文或提名(IJCAI、ACL、SIGDIAL等)。研发对话系统平台ConvLab和ConvLab2,中文开放域对话预训练模型EVA、CDial-GPT等。担任顶级期刊TNNLS、TACL、CL编委,ACL 2021资深领域主席(SAC),EMNLP 2021研讨会联合主席,10余次担任ACL/EMNLP的领域主席。

6、《人机对齐》中文版书籍发布

f234a94c3182ab403bbea78fef11e805.jpeg

Brian Christian,《算法之美》作者

Brian Christian是一位获奖无数的科学作者。他的作品《算法之美》曾被评为亚马逊年度最佳科学书籍和《麻省理工科技评论》年度最佳书籍。他的新书《人机对齐》(The Alignment Problem: Machine Learning and Human Values)目前正在被翻译成中文,被微软首席执行官萨蒂亚·纳德拉评为2021年激励他的五本书之一。

目前,Christian的著作已被翻译成19种语言,他曾在谷歌、脸书和微软等公司讲课。他拥有布朗大学的哲学和计算机科学本科学位,以及华盛顿大学的诗歌艺术硕士学位,同时也做过加州大学伯克利分校的访问学者。

7、Paradigms of AI alignment: components and enablers

168c1cd49c590da02a2cf1863c27df55.jpeg

Victoria Krakovna,DeepMind研究科学家、Future of Life Institute联合创始人

Victoria Krakovna is a senior research scientist at DeepMind focusing on AI alignment: ensuring that advanced AI systems do what we want them to do and don’t knowingly act against our interests. She has worked on goal misgeneralization, specification gaming, reward tampering, and measuring side effects. Her PhD thesis in statistics and machine learning at Harvard University focused on building interpretable models. Victoria gained numerous distinctions for her accomplishments in math competitions, including a silver medal at the International Mathematical Olympiad and the Elizabeth Lowell Putnam prize.

8、大语言模型的安全性对齐

ed5e8deb887fdd68b96ddc9c9518ad98.jpeg

杨耀东,北京大学人工智能研究院助理教授

杨耀东,北京大学人工智能研究院助理教授。科研领域包括强化学习、博弈论和多智能体强化学习,相关的研究成果在国际会议和期刊上发表40余篇学术论文。他的研究工作于2020年获国际机器人学习会议CoRL最佳系统论文奖,2021年获国际多智能体系统会议AAMAS最具前瞻性论文奖(Best Blue-Sky Paper)。此外,杨耀东长期担任ICML、NeurIPS、ICLR、AAAI等会议审稿人和JMLR、IEEE TNNLS、IEEE Cybernatics等期刊受邀审稿人。在加入北京大学以前,他曾任英国国王大学(King’s College London)信息学院(长聘)助理教授,在加入KCL以前,他就职于华为英国研究所,任主任研究员,带领团队从事多智能体系统相关研究,在加入华为之前,杨耀东就职于美国国际集团(AIG), 任科学部高级研发经理,带领团队开发人工智能在金融保险领域的相关应用。 杨耀东于中国科学技术大学获得学士学位,英国帝国理工大学获得硕士学位,英国伦敦大学学院获得博士学位。

9、Towards Safe and Trustworthy AI

644ce5914a0e1ded709c7c0f3ec8540f.jpeg

David Krueger,剑桥大学助理教授

David is an Assistant Professor at the University of Cambridge. He is a member of Cambridge's Computational and Biological Learning lab (CBL), where he leads a research group focused on Deep Learning and AI Alignment. David’s current research interests include: 1) formalizing and testing AI Alignment concerns and approaches, especially to do with learning reward functions, 2) understanding Deep Learning, and 3) techniques for aligning foundation models. His previous research has spanned many areas of Deep Learning, including generative modeling, Bayesian Deep Learning, empirical theory, and robustness. He is also a CSER research affiliate, and previously studied at Mila / University of Montreal, and Reed College; interned at the Future of Humanity Institute, DeepMind, and ElementAI; and worked as a contract writer for the Partnership on AI, and a career counselor for 80,000 Hours.

10、Scalable Oversight for Large Language Models

cf82d9d8eacca8751ae8a6affaead654.png

Samuel Bowman,纽约大学助理教授

Sam Bowman is an associate professor at NYU and a member of technical staff at Anthropic. At NYU, he is a member of the Center for Data Science, the Department of Linguistics, and the Courant Institute's Department of Computer Science. His research focuses primarily on developing techniques and datasets for use in controlling and evaluating large language models, and additionally on applications of machine learning to scientific questions in linguistic syntax and semantics. He is the senior organizer behind the GLUE and SuperGLUE benchmark competitions and his work has been funded by the US NSF (including through a CAREER award), Google, Apple, and Samsung, among others.

11、圆桌讨论:如何确保大模型追求“正确”的目标?

圆桌论坛嘉宾:

谢旻希:主持人丨安远AI创始人

杨耀东:北京大学人工智能研究院助理教授

 David Krueger:剑桥大学人工智能研究助理教授

 付杰:智源研究院研究员

618c62f985da7d39eb59fe872a098ea0.jpeg

付杰,智源研究院研究员

博士毕业于新加坡国立大学,师从Tat-Seng Chua,博士后在Mila师从Yoshua Bengio, Chris Pal。曾获得ICLR 2021 Outstanding Paper Award。

13、论坛闭幕主题演讲

892f9a9ec135bbb8393e5c177fbe8d3e.jpeg

Geoffrey Hinton,「深度学习之父」、多伦多大学名誉教授

Geoffrey Hinton,「深度学习之父」,图灵奖得主。他曾获得爱丁堡大学人工智能的博士学位,同时也是多伦多大学特聘教授。2012年,Hinton还曾荣获加拿大基廉奖(Killam Prizes,有“加拿大诺贝尔奖”之称的国家最高科学奖)。2013年,Hinton 加入谷歌并带领一个AI团队,他将神经网络引入研究与应用的热潮,将“深度学习”从边缘课题变成了谷歌等互联网巨头仰赖的核心技术,并将HintonBack Propagation(反向传播)算法应用到神经网络与深度学习。2023年5月,他从谷歌离职,自称为了自由探讨AI 风险。

14、论坛闭幕致辞

6467b0310668ec38f568c6e90dcbad39.jpeg

黄铁军,智源研究院院长

北京智源人工智能研究院院长,北京大学多媒体信息处理全国重点实验室主任,主要研究方向为视觉信息处理与类脑计算。国家杰出青年科学基金获得者,教育部长江学者特聘教授,新一代人工智能产业技术创新战略联盟秘书长。发表论文200多篇,制定国家标准和国际标准10项,授权发明专利50多项。荣获国家技术发明二等奖(2017)和国家科学技术进步二等奖(2012,2010)和中国科协求是杰出青年成果转化奖(2014)。

扫码二维码或点击「阅读原文」报名线下参会&线上直播

3ef1ecf117e3372cb4862f42b0cc6a8c.png

b5906ca7caf423ff81f8079d7437c7a6.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/596335.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Linux教程——Linux和UNIX的关系及区别(详解版)

UNIX 与 Linux 之间的关系是一个很有意思的话题。在目前主流的服务器端操作系统中,UNIX 诞生于 20 世纪 60 年代末,Windows 诞生于 20 世纪 80 年代中期,Linux 诞生于 20 世纪 90 年代初,可以说 UNIX 是操作系统中的"老大哥&…

开始梳理大学课程体系(二)--万字数据结构总结上

数据结构总结 第一章 概述1.1 基本概念和术语1.2 数据结构1. 2.1 逻辑结构1.2.2 存储结构 1.3 数据类型和抽象数据类型1.3.1 数据类型1.3.2 抽象数据类型 1.4 算法和算法分析1.4.1 算法的定义及特性1.4.2 评价算法优劣的基本标准1.4.3 算法的时间复杂度1.4.4 算法的空间复杂度 …

chatgpt赋能python:用Python优化交通

用Python优化交通 作为一种功能强大的编程语言,Python已经被广泛应用于各个领域。交通领域也不例外。在交通领域,Python可以发挥重要作用,帮助优化交通运行,提高安全性和效率。 实时路况预测 Python可以通过机器学习算法来对实…

【Linux】进程与文件系统(详细解析)

文章目录 1.前言(提出问题)2.认识问题3.回顾c文件接口4.学习系统文件IOopen函数第一个参数第二个参数第三个参数函数的返回值 write函数read函数close函数 5.文件描述符 1.前言(提出问题) 在C语言阶段学习文件操作的时候&#xf…

基于PP-OCRv3的车牌检测和识别

本项目基于百度飞桨AI Studio平台进行实现,百度出品的深度学习平台飞桨(PaddlePaddle)是主流深度学习框架中一款完全国产化的产品,与Google TensorFlow、Facebook Pytorch齐名。2016 年飞桨正式开源,是国内首个全面开源…

【SpringMVC】| 域对象共享数据

目录 前期准备 域对象共享数据 一:向request域共享数据(五种方法) 1. 使用ServletAPI向request域对象共享数据(了解) 2. 使用ModelAndView向request域对象共享数据 3. 使用Model向request域对象共享数据 4. 使用…

chatgpt赋能python:Python代码怎么找?这里介绍几种方法

Python代码怎么找?这里介绍几种方法 在编写Python程序的时候,经常会遇到需要查找已有代码的情况。那么,在这里,我们将介绍几种查找Python代码的方法,希望能对大家有所帮助。 使用文本编辑器的查找功能 在大多数文本…

3.场(field)

目录 1.复习 2.引言 3.数量场 1.概念 2.例题 4.矢量场 1.概念 2.例题 5.坐标变换和坐标单位矢 1.坐标变换 2.单位矢 1.复习 2.引言 如果说矢量分析研究的是矢量的时间变化,那么场就是它的空间变化. 场是客观存在的,杨振宁先生在总结20世…

Spring Boot 3.1中如何整合Spring Security和Keycloak

在今年2月14日的时候,Keycloak 团队宣布他们正在弃用大多数 Keycloak 适配器。其中包括Spring Security和Spring Boot的适配器,这意味着今后Keycloak团队将不再提供针对Spring Security和Spring Boot的集成方案。但是,如此强大的Keycloak&…

数据库|TiDB 数据库大版本升级-基于TiCDC异机升级

作者:高文峰 | 神州数码云基地TiDB团队成员 目录 一、前言 二、升级架构图 三、升级流程 1.下游TiDB集群部署过程 2. 上游TiCDC节点的扩容 3. 上游数据全备恢复到下游 4. TiCDC启用正向同步任务 5. 应用停服务,tidb 无业务会话连接 6. 确认数据…

2023年6月跟产品开发专家学NPDP产品经理认证课到这里

NPDP产品经理国际资格认证是国际公认的唯一的新产品开发专业认证,集理论、方法与实践为一体的全方位的知识体系,为公司组织层级进行规划、决策、执行提供良好的方法体系支撑。 我们针对互联网时代的个人、互联网企业、与传统企业推出一系列学习。 课程从…

小车跑迷宫,如何完成?

先看视频1: 先看视频2: 要制作一个能顺利走到迷宫终点,并能按最短路径回来的小车,重中之重就是寻找其最短路径的算法,迷宫情况复杂多变,多个路口交错纵横,想要完美的找出最短路径并不容易&#…

事件相关功能磁共振波谱技术(fMRS)

导读 质子磁共振波谱(MRS)是一种非侵入性脑成像技术,用于测量不同神经化学物质的浓度。“单体素”MRS数据通常在几分钟内采集,然后对单个瞬态进行平均,从而测量神经化学物质浓度。然而,这种方法对更快速的神经化学物质的时间动态…

chatgpt赋能python:Python人脸身份识别:提高安全性和效率的先进技术

Python人脸身份识别:提高安全性和效率的先进技术 随着科技的发展,人类对于安全性和效率的需求逐渐增加。而人脸身份识别技术正是一个能够满足这一需求的先进技术。在过去的几年中,这种技术已经逐渐发展成为一种普及的安全措施,这…

串口组件:ZylSerialPort.NET 1.83 Crack

ZylSerialPort.NET 1.83 .NET 组件 库 ZylSerialPort.NET 是一个基于线程、事件驱动、异步/同步串口的.NET 组件库。 使用 ZylSerialPort.NET 组件可以轻松地通过串行端口连接与外部设备进行通信,例如调制解调器、条形码阅读器、GSM 模块等。 您也可以将它与 USB、…

Volatile、Synchronized、ReentrantLock锁机制使用说明

一、Volatile底层原理 volatile是轻量级的同步机制,volatile保证变量对所有线程的可见性,不保证原子性。 当对volatile变量进行写操作的时候,JVM会向处理器发送一条LOCK前缀的指令,将该变量所在缓存行的数据写回系统内存。由于缓…

DJ4-7 请求分页存储管理方式

目录 4.7.1 请求分页中的硬件支持 1、页表机制 2、缺页中断机构 4.7.2 内存分配策略和分配算法 1、最小物理块数的确定 2、物理块的分配策略 3、物理块的分配算法 4.7.3 调页策略 1、系统应当在何时把一个页面装入内存? 2、从何处调入页面?…

机器学习常识 12: SVM

摘要: 支持向量机 (support vector machine, SVM) 有很多闪光点, 理论方面有 VC 维的支撑, 技术上有核函数将线性不可分变成线性可分, 实践上是小样本学习效果最好的算法. 1. 线性分类器 如图 1 所示, 基础的 SVM 仍然是一个线性二分类器, 这一点与 logistic 回归一致. 图 1.…

MATLAB 之 隐函数绘图、图形修饰处理、图像处理与动画制作和交互式绘图工具

这里写目录标题 一、隐函数绘图1. 隐函数二维绘图3. 隐函数三维绘图 二、图形修饰处理1. 视点处理2. 色彩处理2.1 颜色的向量表示2.2 色图2.3 三维曲面图形的着色 3. 图形的裁剪处理 三、图像处理与动画制作1. 图像处理1.1 图像的读/写1.2 图像的显示 2. 动画制作2.1 制作逐帧动…

chatgpt赋能python:Python交流App:提高Python社区交流效率

Python 交流 App: 提高 Python 社区交流效率 Python 是当今流行程度最高的编程语言之一,有着广泛的应用场景和庞大的社区。 作为 Python 工程师,经常有各种问题需要得到解决,同时也希望能与同行进行交流、分享和学习。这时,一款高…