AI 编译器技术分享会:上海交大/中科院计算所/微软亚研/智源,他们来了!

news2024/10/23 2:41:30

4 场 Meetup、3 个城市、19 位嘉宾、1k+ 行业从业者、累计 100w+ 曝光, 2023 年 AI 编译器社区小小刷新了一下存在感,我们在非常细分的领域里找到了最为垂直的开发者和工程师,从 0 到 1 建立起一个个小据点,搭建交流平台、促成企内合作、连通生态上下游。

2024 年虽然已经过半,在大模型持久占据技术圈「热搜榜单」的今天,我们将于 7 月 6 日(周六)在中国科学院计算技术研究所, 举办 Meet AI Compiler 技术沙龙的第 5 期线下聚会。

本次 Meetup 分为技术分享和圆桌讨论两个环节,嘉宾分别来自上海交通大学、中国科学院计算技术研究所、微软亚洲研究院、北京智源人工智能研究院,期待新的聚会能为大家带来新的技术收获,结交新的同行好友~

活动详情

⏰ 时间:7 月 6 日(周六)13:30-18:00

地点:北京市海淀区科学院南路 6 号中国科学院计算技术研究所一层报告厅

人数:200(现场座位有限,请尽早报名)

报名:扫描下方二维码报名

扫码备注「AI 编译器」加入活动群:

议程:

嘉宾及议程

环节 1 分享嘉宾

分享主题: MLCEngine: A Universal LLM Deployment Engine

内容简介:本次分享将介绍 MLCEngine,一个能够在不同平台上 Universally Deployment 的 LLM 引擎。 MLCEngine 既在服务器上具备 high-throughput, low-latency 的 LLM serving 能力,同时又支持在各种本地环境下无缝部署当今高质量的大语言模型。

观看本场分享,你将了解:

  1. MLCEngine 的设计理念和使用方式

  2. Universally Deployment 的意义

  3. 针对 LLM 推理引擎发展的思考

分享主题: ElasticRoom: Multi-Tenant DNN Inference Engine via Co-design with Resource-constrained Compilation and Strong Priority Scheduling

内容简介: 运行时软件中的 GPU 资源划分机制已广泛应用于作业调度程序和多租户计算系统,以提高资源利用率和吞吐量。然而,现有的 GPU 资源划分机制在面临批量异构 DNN 推理请求的时候无法同时提高 GPU 资源利用率并确保实时请求的低延时。我们提出了一种创新的多租户 DNN 推理引擎 ElasticRoom,它基于 TVM 构建了资源约束编译并通过优先级调度同时实现高 GPU 利用率和实时请求的低延迟。

观看本场分享,你将了解:

  1. GPU 资源管理与任务调度

  2. 基于 TVM 的资源约束编译

分享主题: 基于块 (Tile) 抽象的高效深度学习编译系统

内容简介: 随着深度学习算法和硬件的快速发展,业界对高效、快速的模型部署有了更高要求,深度学习编译器成为了一种新的连接模型计算表达和底层硬件执行的途径。然而,如何在不同硬件上高效支持快速发展的深度学习应用仍然存在很多挑战。本次分享将介绍我们基于统一的块 (Tile) 抽象,在深度学习编译领域的一系列探索性工作。

观看本场分享,你将了解:

  1. 基于块 (Tile) 抽象的深度学习编译栈

  2. 在深度学习应用场景,如何通过块 (Tile) 抽象优化全局访存效率

  3. 在深度学习应用场景,如何通过块 (Tile) 抽象支持低精度深度学习计算

分享主题: 基于 Triton 的大模型算子库 FlagGems 创新实践

内容简介:基于 OpenAI 的 Triton 语言,我们开发了高性能的通用算子库 FlagGems,为 PyTorch 框架下的大模型提供推理与训练加速。 针对 Triton 的编程特点,我们应用了运行时优化和自动代码生成两项技术创新,拓展了算子的表达能力,提高了算子的性能表现。

观看本场分享,你将了解:

  1. 认识 Triton 编程语言,接触 Triton 开源生态

  2. 了解 FlagGems 算子库及其开发进展

  3. 了解 FlagGems 中应用的运行时优化技术和自动代码生成技术

环节 2 圆桌环节

圆桌主题: Transformer 时代的跨异构芯片编译优化

主办方及合作伙伴

HyperAI超神经是国内领先的人工智能及高性能计算社区, 旨在通过提供数据集加速下载、在线教程演示、论文深度解读、顶会日历集成等多种基础设施,助力中国的数据科学与⼈⼯智能⾏业的开发者、爱好者学习、理解、实践,与社区⼀起构建⼈⼯智能的未来。目前超神经官网已经上线数千个经典及优质公开数据集和教程,并运营国内最活跃的 AI 编译器社区,HyperAI超神经也是本系列活动的唯一主办方。

访问官网: https://hyper.ai/

OpenBayes贝式计算是国内领先的高性能计算服务提供商, 通过为新一代异构芯片嫁接经典软件生态及机器学习模型,进而为工业企业及高校科研提供更加快速、易用的数据科学计算产品,其产品已被数十家大型工业场景或头部科研院所所采用。

访问官网: https://openbayes.com/

MLC.AI 社区成立于 2022 年 6 月,并由 Apache TVM 主要发明者、机器学习领域著名的青年学者陈天奇,带领团队上线了 MLC 线上课程,系统介绍了机器学习编译的关键元素以及核心概念。

2022 年 11 月,在 MLC.AI 社区志愿者的共同努力下,首个完整的 TVM 中文文档上线,并成功托管至 HyperAI超神经官网,进一步为对机器学习编译感兴趣的国内开发者,提供了接触并学习一门新技术的基础设置——文档。

MLC 线上课程: https://mlc.ai/

TVM 中文文档: https://tvm.hyper.ai/

中国科学院计算技术研究所(简称计算所)创建于 1956 年,是中国第一个专门从事计算机科学技术综合性研究的学术机构。 计算所研制成功了我国第一台通用数字电子计算机,并形成了我国高性能计算机的研发基地,我国首枚通用 CPU 芯片也诞生在这里。

计算所是我国计算机事业的摇篮。伴随着计算所的发展,先后为国家培养了几百名我国最早的计算技术专业人员,在这里工作或学习过的院士有二十余位。随着学科与技术发展,从计算所陆续分离出西安微电子所、计算中心、软件所、网络中心、微电子所和信工所等多个研究机构,孵化了联想、曙光、龙芯、寒武纪等高技术企业。

中国计算机学会高性能计算专业委员会(Technical Committee of HPC ,China Computer Federation 缩写 CCF TCHPC),于 2005 年经中国计算机学会批准成立,作为中国计算机学会下属专业委员会,是高性能计算学术研究、组织高性能计算领域学术会议、产学应用服务的权威性机构。

本着「打造学术平台、促进产业交流、推进应用落地、平衡软硬件生态、服务行业发展、沟通产学研用」原则使命,致力于推进中国高性能计算领域的研究与发展,构建高性能计算学术、产业合作交流平台,对支撑科技发展创新,促进社会进步,增强我国综合国力和国际竞争力有着不可替代的重要作用和意义。

2011 年 6 月,中国科学院正式成立青年创新促进会(以下简称「青促会」),这是中科院对全院 35 岁以下青年科技人才进行综合培养的创新举措,旨在通过有效组织和支持,团结、凝聚全院青年科技工作者,拓宽学术视野,促进相互交流和学科交叉,提升科研活动组织能力,培养造就新一代学术技术带头人。

活动支持

活动行: 扫码跳转至活动行报名

扫码备注「2024 AI 编译器」加入活动群

考虑到本场活动的场地空间情况,我们仅开放了 200 个到场名额,建议大家尽早报名锁定席位。

7 月 6 日 13:30-17:40,期待新老朋友相聚!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1844293.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

求最小生成树的新算法

不管 prim 算法还是 kruskal 算法都基于 “当前可见最短边” 作贪心策略,但这并不适合分布式并行操作,比方说所有节点一起构建最小生成树,这些算法都显得同步开销过大,甚至导出错误的结果。 最近研究并构建最大流多路径传输协议的…

韩顺平0基础学Java——第27天

p548-568 明天开始坦克大战 Entry 昨天没搞明白的Map、Entry、EntrySet://GPT教的 Map 和 Entry 的关系 1.Map 接口:它定义了一些方法来操作键值对集合。常用的实现类有 HashMap、TreeMap 等。 2. Entry接口:Entry 是 Map 接口的一个嵌…

【高等数学】傅里叶级数

最近刷了会抖音,看到一个非常有趣的现象:傅里叶级数,今天挑了几个视频来供大家学习。 1.傅里叶级数概念 【小崔说数】傅里叶级数专题https://www.bilibili.com/video/BV1Uq4y1q7xk?t117.4 2.傅里叶级数动画 【谜之舒适】12分钟的傅立叶级…

编译原理:语法分析(语法制导翻译)、语义分析(类型检查、中间代码生成)

编译器在做语法分析的过程中,除了回答程序代码的语法是否合法(LL,LR能否接收)外,还需要完成后续的工作(包括构建语法树、类型检查、中间代码生成、目标代码生成),这些后续工作一般都可以通过语法…

国产芯片方案/血氧仪方案SIC88336

血氧仪是用来测量脉率、血氧浓度以及灌注指数的仪器设备,血氧浓度是临床医疗上重要的基础数据之一。如果有条件,人们应该时刻监测自己的血氧饱和度,对自己的健康更加有利。下面是详细知识说明。 一、血氧仪方案开发原理 该方案一种检测方式是…

SOFTS: Efficient Multivariate Time Series Forecasting with Series-Core Fusion

SOFTS: Efficient Multivariate Time Series Forecasting with Series-Core Fusion 文章目录 SOFTS: Efficient Multivariate Time Series Forecasting with Series-Core Fusion1. 论文背景1.1 通道独立-通道依赖的区别1.2 论文贡献 2. 模型架构2.1 SOFTS的主要架构2.2 STAR 模…

家用洗地机哪个牌子的好用性价比高?热销品牌型号推荐

洗地机在市场上越来越受到人们的欢迎,它能够一次性完成吸尘、拖地和清洗的所有步骤,极大地提高了清洁效率,是减轻人们日常清洁负担的优秀家电,为了避免大家盲信挑选机器,我整理了一份洗地机选购指南,帮助大…

基于MATLAB的误码率与信噪比(附完整代码与分析)

目录 一. 写在前面 二. 如何计算误码率 三. 带噪声的误码率分析 3.1 代码思路 3.2 MATLAB源代码及分析 四. 总结 4.1 输入参数 4.2 规定比特长度 4.3 特殊形式比较 一. 写在前面 (1)本文章主要讨论如何仿真误码率随着信噪比变化的图像 &#…

原子性(juc编程)

原子性 概述:所谓的原子性是指在一次操作或者多次操作中,要么所有的操作全部都得到了执行并且不会受到任何因素的干扰而中断,要么所有的操作都不执行,多个操作是一个不可以分割的整体。 //比如说:你喂你女朋友吃冰淇…

户外LED显示屏的发展历程

户外LED显示屏自其问世以来,经历了显著的发展与变革。其技术不断进步,应用场景逐步扩大,并在广告、信息传播等领域发挥了重要作用。本文将梳理户外LED显示屏的发展历程,重点介绍其技术演进和应用拓展。 早期发展:直插式…

一文带你理清同源和跨域

1、概述 前后端数据交互经常会碰到请求跨域,什么是跨域,为什么需要跨域,以及常用有哪几种跨域方式,这是本文要探讨的内容。 同源策略(英文全称 Same origin policy)是浏览器提供的一个安全功能。同源策略限制了从同一个源加载的…

海外盲盒小程序搭建过程的最大挑战:文化差异与本地化

一、引言 随着全球化的深入发展,跨境电商和海外市场的拓展成为许多企业的重要战略方向。盲盒小程序作为一种新兴的消费模式,也在海外市场展现出巨大的潜力。然而,在海外搭建盲盒小程序并非易事,文化差异与本地化问题是其搭建过程…

计算最大数位-第13届蓝桥杯省赛Python真题精选

[导读]:超平老师的Scratch蓝桥杯真题解读系列在推出之后,受到了广大老师和家长的好评,非常感谢各位的认可和厚爱。作为回馈,超平老师计划推出《Python蓝桥杯真题解析100讲》,这是解读系列的第87讲。 计算最大数位&…

Qwen2大模型微调入门实战-命名实体识别(NER)任务(完整代码)

Qwen2是通义千问团队最近开源的大语言模型,由阿里云通义实验室研发。 以Qwen2作为基座大模型,通过指令微调的方式做高精度的命名实体识别(NER),是学习入门LLM微调、建立大模型认知的非常好的任务。 使用LoRA方法训练&…

MySQL快速安装(mysql8.0.30区别之前yum安装)

目录 一.初始化环境并解压 二.创建程序用户管理 三.修改mysql目录和配置文件的权限 四.修改配置文件 五.设置环境变量,申明/宣告mysql命令便于系统识别 六.初始化数据库 七.设置系统识别,进行操作 八.初始化数据库密码 九.用户并设置密码 十.赋…

机器学习模型评估之校准曲线

模型校准曲线(Calibration Curve),也称为可靠性曲线(Reliability Curve)或概率校准曲线(Probability Calibration Curve),是一种评估分类模型输出概率准确性的图形工具。它可以帮助我…

STM32 串口通讯

使用STM32的串口通讯,接收串口助手的数据,并且将接收到的数据返回串口,重定义printf功能。 配置引脚信息 由于每次新建工程都需要配置信息,比较麻烦,好在STM32CubeIDE提供了导入.ioc文件的功能,可以帮我们…

达梦8 兼容MySQL语法支持非分组项作为查询列

MySQL 数据库迁移到达梦后,部分GROUP BY语句执行失败,报错如下: 问题原因: 对于Oracle数据库,使用GROUP BY时,SELECT中的非聚合列必须出现在GROUP BY后面,否则就会报上面的错误,达梦…

基于python+tkinter(Gui)的学生信息管理系统

博主介绍: 大家好,本人精通Java、Python、C#、C、C编程语言,同时也熟练掌握微信小程序、Php和Android等技术,能够为大家提供全方位的技术支持和交流。 我有丰富的成品Java、Python、C#毕设项目经验,能够为学生提供各类…

[创业之路-119] :制造业企业的必备管理神器-ERP-主要功能模块说明与系统架构

目录 一、ERP功能的标准化 二、常见的ERP标准化功能 2.1 基础档案 2.2 供应链 2.3 人力资源管理 2.4 资产管理 2.5 生产制造 2.6 财务会计 2.7 管理会计 2.8 CRM客户管理管理 2.9 商业智能分析 三、常见的ERP软件供应商 国内ERP软件供应商 国外ERP软件供应商 四…