Geoffrey Hinton、姚期智、张钹、Sam Altman等专家共话AI安全与对齐丨2023智源大会议程公开...

6月9日，2023北京智源大会，将邀请AI领域的探索者、实践者、以及关心智能科学的每个人，共同拉开未来舞台的帷幕，你准备好了吗？与会知名嘉宾包括，图灵奖得主Yann LeCun、OpenAI创始人Sam Altman、图灵奖得主Geoffrey Hinton、图灵奖得主Joseph Sifakis、诺贝尔奖得主Arieh Warshel、未来生命研究所创始人Max Tegmark、2021年科学突破奖得主David Baker、2022吴文俊最高成就奖得主郑南宁院士以及中国科学院张钹院士等。目前已正式开放大会线上报名渠道。大会将同步向全球线上直播。

北京智源大会倒计时：10天

AI安全与对齐论坛丨6月10日全天

进入大模型时代，如何确保越发强大和通用的人工智能系统安全可控，符合人类意图和价值观，是极为重要的一个问题。这一安全问题又被称为人机对齐（AI alignment）问题，它代表了本世纪人类社会面临的最紧迫和最有意义的科学挑战之一。本次论坛邀请到「深度学习之父」Geoffrey Hinton、OpenAI创始人Sam Altman和张钹院士等14位国内外嘉宾围绕人机对齐、大模型的可拓展监督、人工智能的生存风险，以及其他人工智能安全相关的议题带来精彩报告。希望以此论坛为契机，共同展望AI的挑战和机遇，碰撞出学术的火花！

联合举办：安远AI，使命是引领人机关系走向安全、可信、可靠的未来，面向大模型和通用人工智能的安全和对齐问题建立技术社区、开展治理研究以及推动国际交流。

论坛议程

论坛主席

张钹，中国科学院院士、智源研究院学术顾问委员会主席

中国科学院院士，清华大学人工智能研究院名誉院长、中国人工智能领域首批研究者、汉堡大学自然科学荣誉博士、俄罗斯自然科学院外籍院士、微软亚洲研究院技术顾问、国家“863”高技术计划智能机器人主题专家组专家，获得吴文俊人工智能最高成就奖、CCF终身成就奖、ICL欧洲人工智能奖、国家科委和计委颁发的个人金牛奖、为国家重点实验室做出重大贡献的先进工作者、国家教委科技进步一等奖、电子工业部科技进步一等奖以及国防科工委科技进步一等奖、国家教委高等学校出版社优秀学术专著特等奖、国家自然科学三等奖等。

主持人

谢旻希，安远AI创始人

兼任牛津大学成立的人工智能治理中心（Centre for the Governance of AI）政策研究员，同济大学出版社《全球视野下的人工智能治理》副主编，AAAI、IJCAI人工智能安全研讨会（SafeAI）组委会成员，IEEE可信人工智能工作组P2894成员。

演讲主题及嘉宾介绍

1、论坛开幕主题演讲& 问答环节

Sam Altman，ChatGPT母公司OpenAI联合创始人

Sam Altman（萨姆·奥尔特曼）是一位美国的企业家、程序员和投资者。他当前是ChatGPT母公司OpenAI的联合创始人和董事会成员、曾经担任过Y Combinator的总裁。

张宏江，智源研究院理事长

北京智源人工智能研究院理事长，美国国家工程院外籍院士。原微软亚太研发集团首席技术官，曾任金山软件CEO、微软亚太研发集团CTO、微软亚洲工程院院长、微软亚洲研究院副院长，微软第一批“杰出科学家”。国际计算机协会（ACM）和电气电子工程协会（IEEE）双会士，曾获2010年IEEE计算机学会技术成就奖和2012年ACM多媒体杰出技术成就奖，并获评2008年度美国杰出亚裔工程师奖。发表过近四百篇学术论文，编著过多本学术专著。自2018年起，在Guide2Research发布的世界顶尖计算机科学家排名中，蝉联中国大陆科学家榜首。

2、「AI: Some thoughts? 」& 专家对谈

Stuart Russell，加州伯克利分校教授

ACM Fellow、AAAI Fellow、AAAS Fellow。1995年荣获IJCAI Computers and Thought Award。他与Google研究总监Peter Norvig合著的《人工智能：一种现代的方法》是人工智能权威教材。2020年，他的新书《AI新生：破解人机共存密码——人类最后一个大问题》（Human Compatible：Artificial intelligence and The problem of control）在中国出版。

姚期智，图灵奖得主，中国科学院院士

姚期智，世界著名计算机学家，2000年图灵奖得主，中国科学院院士，美国科学院外籍院士，美国科学与艺术学院外籍院士，国际密码协会会士，清华大学交叉信息研究院院长，"清华学堂计算机科学实验班""清华学堂人工智能班"首席教授，973项目首席科学家，香港中文大学博文讲座教授。

3、Anthropic’s Core Views on AI Safety

Christopher Olah，Anthropic联合创始人

Chris Olah works on reverse engineering artificial neural networks into human understandable algorithms. Olah is one of the co-founders of Anthropic, an AI lab focused on the safety of large models. Previously, he led interpretability research at OpenAI, worked at Google Brain, and co-founded Distill, a scientific journal focused on outstanding communication.

4、Aligning Massive Models: Present and Future Challenges

Jacob Steinhardt，加州伯克利分校助理教授

Jacob Steinhardt is an Assistant Professor in the department of Statistics at UC Berkeley. His research goal is to make the conceptual advances necessary for machine learning systems to be reliable and aligned with human values. He studies robustness of ML models, reward specification and reward hacking, and techniques for scalable alignment. He consults part-time for Open Philanthropy and has previously worked at OpenAI. He is a coach for the USA Computing Olympiad and an instructor for SPARC. For more info please see his website:https://jsteinhardt.stat.berkeley.edu/.

5、中文大语言模型的安全性研究

黄民烈，清华大学计算机科学与技术系副教授

黄民烈博士，清华大学长聘副教授，国家杰青，中文信息学会自然语言生成与智能写作专委会副主任、CCF学术工作委员会主任助理，获国家自然科学基金重点项目资助。他的研究领域为自然语言处理，特别是自然语言生成、对话系统、阅读理解等。曾获得中国人工智能学会吴文俊人工智能科技进步奖一等奖（第一完成人），中文信息学会汉王青年创新奖，阿里巴巴创新合作研究奖。著有《现代自然语言生成》一书，在国际会议期刊发表论文超过100篇，多次获得国际主流会议的最佳论文或提名（IJCAI、ACL、SIGDIAL等）。研发对话系统平台ConvLab和ConvLab2，中文开放域对话预训练模型EVA、CDial-GPT等。担任顶级期刊TNNLS、TACL、CL编委，ACL 2021资深领域主席（SAC），EMNLP 2021研讨会联合主席，10余次担任ACL/EMNLP的领域主席。

6、《人机对齐》中文版书籍发布

Brian Christian，《算法之美》作者

Brian Christian是一位获奖无数的科学作者。他的作品《算法之美》曾被评为亚马逊年度最佳科学书籍和《麻省理工科技评论》年度最佳书籍。他的新书《人机对齐》（The Alignment Problem: Machine Learning and Human Values）目前正在被翻译成中文，被微软首席执行官萨蒂亚·纳德拉评为2021年激励他的五本书之一。

目前，Christian的著作已被翻译成19种语言，他曾在谷歌、脸书和微软等公司讲课。他拥有布朗大学的哲学和计算机科学本科学位，以及华盛顿大学的诗歌艺术硕士学位，同时也做过加州大学伯克利分校的访问学者。

7、Paradigms of AI alignment: components and enablers

Victoria Krakovna，DeepMind研究科学家、Future of Life Institute联合创始人

Victoria Krakovna is a senior research scientist at DeepMind focusing on AI alignment: ensuring that advanced AI systems do what we want them to do and don’t knowingly act against our interests. She has worked on goal misgeneralization, specification gaming, reward tampering, and measuring side effects. Her PhD thesis in statistics and machine learning at Harvard University focused on building interpretable models. Victoria gained numerous distinctions for her accomplishments in math competitions, including a silver medal at the International Mathematical Olympiad and the Elizabeth Lowell Putnam prize.

8、大语言模型的安全性对齐

杨耀东，北京大学人工智能研究院助理教授

杨耀东，北京大学人工智能研究院助理教授。科研领域包括强化学习、博弈论和多智能体强化学习，相关的研究成果在国际会议和期刊上发表40余篇学术论文。他的研究工作于2020年获国际机器人学习会议CoRL最佳系统论文奖，2021年获国际多智能体系统会议AAMAS最具前瞻性论文奖(Best Blue-Sky Paper)。此外，杨耀东长期担任ICML、NeurIPS、ICLR、AAAI等会议审稿人和JMLR、IEEE TNNLS、IEEE Cybernatics等期刊受邀审稿人。在加入北京大学以前，他曾任英国国王大学（King’s College London）信息学院（长聘）助理教授，在加入KCL以前，他就职于华为英国研究所，任主任研究员，带领团队从事多智能体系统相关研究，在加入华为之前，杨耀东就职于美国国际集团（AIG）, 任科学部高级研发经理，带领团队开发人工智能在金融保险领域的相关应用。杨耀东于中国科学技术大学获得学士学位，英国帝国理工大学获得硕士学位，英国伦敦大学学院获得博士学位。

9、Towards Safe and Trustworthy AI

David Krueger，剑桥大学助理教授

David is an Assistant Professor at the University of Cambridge. He is a member of Cambridge's Computational and Biological Learning lab (CBL), where he leads a research group focused on Deep Learning and AI Alignment. David’s current research interests include: 1) formalizing and testing AI Alignment concerns and approaches, especially to do with learning reward functions, 2) understanding Deep Learning, and 3) techniques for aligning foundation models. His previous research has spanned many areas of Deep Learning, including generative modeling, Bayesian Deep Learning, empirical theory, and robustness. He is also a CSER research affiliate, and previously studied at Mila / University of Montreal, and Reed College; interned at the Future of Humanity Institute, DeepMind, and ElementAI; and worked as a contract writer for the Partnership on AI, and a career counselor for 80,000 Hours.

10、Scalable Oversight for Large Language Models

Samuel Bowman，纽约大学助理教授

Sam Bowman is an associate professor at NYU and a member of technical staff at Anthropic. At NYU, he is a member of the Center for Data Science, the Department of Linguistics, and the Courant Institute's Department of Computer Science. His research focuses primarily on developing techniques and datasets for use in controlling and evaluating large language models, and additionally on applications of machine learning to scientific questions in linguistic syntax and semantics. He is the senior organizer behind the GLUE and SuperGLUE benchmark competitions and his work has been funded by the US NSF (including through a CAREER award), Google, Apple, and Samsung, among others.

11、圆桌讨论：如何确保大模型追求“正确”的目标？

圆桌论坛嘉宾：

谢旻希：主持人丨安远AI创始人

杨耀东：北京大学人工智能研究院助理教授

David Krueger：剑桥大学人工智能研究助理教授

付杰：智源研究院研究员

付杰，智源研究院研究员

博士毕业于新加坡国立大学，师从Tat-Seng Chua，博士后在Mila师从Yoshua Bengio, Chris Pal。曾获得ICLR 2021 Outstanding Paper Award。

13、论坛闭幕主题演讲

Geoffrey Hinton，「深度学习之父」、多伦多大学名誉教授

Geoffrey Hinton，「深度学习之父」，图灵奖得主。他曾获得爱丁堡大学人工智能的博士学位，同时也是多伦多大学特聘教授。2012年，Hinton还曾荣获加拿大基廉奖（Killam Prizes，有“加拿大诺贝尔奖”之称的国家最高科学奖）。2013年，Hinton 加入谷歌并带领一个AI团队，他将神经网络引入研究与应用的热潮，将“深度学习”从边缘课题变成了谷歌等互联网巨头仰赖的核心技术，并将HintonBack Propagation（反向传播）算法应用到神经网络与深度学习。2023年5月，他从谷歌离职，自称为了自由探讨AI 风险。

14、论坛闭幕致辞

黄铁军，智源研究院院长

北京智源人工智能研究院院长，北京大学多媒体信息处理全国重点实验室主任，主要研究方向为视觉信息处理与类脑计算。国家杰出青年科学基金获得者，教育部长江学者特聘教授，新一代人工智能产业技术创新战略联盟秘书长。发表论文200多篇，制定国家标准和国际标准10项，授权发明专利50多项。荣获国家技术发明二等奖（2017）和国家科学技术进步二等奖（2012，2010）和中国科协求是杰出青年成果转化奖（2014）。

扫码二维码或点击「阅读原文」报名线下参会&线上直播