开发者活动:云原生的开源 AI 大模型基础设施

news2024/11/15 12:55:43

随着 ChatGPT 的火热,大语言模型和相关应用不断涌现。你是否了解大语言模型的技术细节?你是否曾经开发过大语言模型应用?如果你对大语言模型背后的基础设施感兴趣,那么7月8号,北京海淀中关村创业大街,云原生的开源 AI 大语言模型基础设施 meetup 等你来探讨!

此次 meetup 聚集了来自 Milvus、VMware、智源、商汤科技和 WasmEdge 等AI/云原生领域的专家,演讲将涉及大模型应用开发、联邦学习与大语言模型、向量数据库、神经网络量化、模型评测等多个方向,为你解析完整的大语言模型开发生命周期,透彻了解大语言模型背后的细节。

除了精彩的演讲内容,本次活动还得到了 CNCF(云原生计算基金会)的大力支持,会议将提供饮料和 Pizza。人民邮电出版社赞助了AI、开源和 Rust 相关的技术书籍,为你的技术学习之路提供帮助。现场还有飞盘、酷炫贴纸、帽子、搪瓷杯、T-shirt 等周边礼品,让你满载而归。

时间

2023年7月8日下午1点-6点,Pizza 将在 1点提供,欢迎小伙伴早点前来签到!

地点

北京市海淀区中关村创业大街12号楼五层

议程介绍

下午1:35 - 2:20:使用 Rust 和 Wasm 开发轻量级 AI 应用 — Michael Yuan,WasmEdge 创始人

LLM——大语言模型,例如ChatGPT,就好像没有记忆、感官或手的大脑。API 和插件允许开发者为 LLM 添加这些关键功能,从而实现 LLM 应用程序。开放AI插件和功能模板的流行表明,存在对这种服务的巨大需求。然而,当前的 LLM 插件通常建立在专为完全成熟服务设计的复杂云原生基础设施上,例如 VM、Linux 容器和 K8s 集群。这种基础设施对于大多数充当LLM和外部服务之间轻量级链路的插件/ Serverl ess应用程序来说过于笨重。WebAssembly(Wasm)已成为这种类型的函数的一种引人注目的轻量级、便携式和安全运行时。

我们将讨论 WasmEdge 社区(一个 CNCF Sandbox 项目)如何利用和构建 Wasm 容器基础设施以用于 LLM 插件。我们将涵盖主要的使用案例和应用领域,如研发管理、DevRel、营销自动化和培训/学习。然后,我们将深入探讨技术栈,以及社区创建的 Rust和 JavaScript SDK,从而实现这些 LLM 应用场景。

通过这个演讲,你将学习到如何在3分钟内使用 serverless 的方式构建开发 AI 应用。

下午2:20 - 3:05:FATE-LLM: 当联邦学习遇到大型语言模型 — 王方驰,VMware CTO 办公室高级工程师,FATE 项目 maintainer

近年来,基于 transformer 的大型语言模型越来越受欢迎,各界讨论不断升温,各路大模型也相继发布,另一方面,大型语言模型在数据和隐私问题上面临的挑战也逐渐凸显。近期,开源联邦学习框架FATE发布了联邦大模型方案FATE-LLM,将联邦学习和大模型技术相结合,为以上问题带来前瞻性的解决方案。通过FATE-LLM,各参与方可以在数据不出本地域的前提下,用各自隐私数据共同进行大模型微调并互惠互利。本次演讲将介绍FATE-LLM在将联邦学习应用于ChatGLM、 LLaMA 等大型语言模型方面的最新努力,并探讨技术和实践上的挑战、设计思路以及未来规划。

通过这个演讲,你讲学习到  1. 联邦学习与联邦大模型 2. FATE-LLM相关设计思路 3. FATE开源社区生态。

下午3:05 - 3:50:向量数据库:大模型的长期记忆体 — 李晨 Zilliz 运营及生态负责人

对于构建专有大型语言模型的组织而言,向量数据库至关重要。向量数据库的一个新型重要用例是 LLM,在文本生成过程中可用于检索领域特定事实或专有事实,用以存储、索引、搜索和检索非结构化数据的大型数据集。本次分享将重点介绍AI 基础设施的开源向量数据库 Milvus 以及对应的云服务 Zilliz Cloud 是如何知识增强和赋能 LLM,并进而引出大模型与向量数据库的关系、生态集成、工具与应用等。

通过这个演讲,你将学习到 1. 了解大模型和向量数据库的集成构建 AI Native应用 2. 向量数据库如何知识增强和赋能 AIGC 领域相关

下午3:50 - 4:05:茶歇

下午4:05 - 4:50:在 AI 开发中模型量化相关的技术实践 — 张志,商汤模型量化框架 PPQ 首席工程师

神经网络量化是一种广泛应用的技术,可以在较低的成本下降低神经网络的计算代价和内存使用。目前使用最为广泛的量化技术将浮点模型转换为8位整数模型,并使用整数运算器完成网络的推理过程。量化技术目前正广泛应用于推理框架当中,大模型的压缩与部署也广泛地依赖于神经网络量化压缩,由商汤 OpenPPL 团队开发的量化框架 PPQ 是目前国内神经网络量化框架的佼佼者,其支持多个硬件后端平台的量化模拟与部署,并在此基础上抽象出一套完整的量化框架设计。我们将着重讲解大语言模型中广泛应用的量化技术,从weight only量化到groupwise kv cache量化,介绍这些技术的应用场景与性能收益。

通过这个演讲,你将学习到如何在服务器上进行网络部署以及性能调优,进而大幅降低神经网络模型的存储需求和计算成本,从而使得这些模型可以在资源要求严苛的设备上运行。通过一些在实际应用中的案例,您将更进一步地了解神经网络模型量化的实现细节与局限性。

下午4:50 - 5:35:FlagEval:大模型评测开源项目 — 玄日成,智源智能评测组算法研究员,天秤项目 core contributor

模型评测是模型生产生命周期中非常重要的一环,随着近年来基础模型相关理论和技术的高速发展,但传统的评测方法和基准在基础模型评测上正面临失效的困境,因此研发面向基础模型的评测方法和工具就显得更为重要。FlagEval 大模型开源评测体系创新构建了“能力-任务-指标”三维大语言模型评测框架,尝试细粒度的刻画基础模型的认知能力边界。

通过这个演讲,你将了解到大模型评测的基本概念,以及如何评测大模型。

下午5:35 - 6:00:集体照片和自由交流

报名方式

扫描上方二维码或戳此报名http://hdxu.cn/L3bji

7月8日,期待与你相见!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/693616.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

chatgpt赋能python:Python调用关系图:了解你的代码依赖关系

Python调用关系图:了解你的代码依赖关系 Python是一种强大的编程语言,具有易读易写、开放源代码、多功能等优点。但是在开发大型项目时,代码会变得复杂,不同模块之间的依赖关系也会变得混乱。为了更好地了解你的代码依赖关系&…

Openresty原理概念篇(九)LuaJIT分支和标准Lua有什么不同

一 LuaJIT分支和标准Lua有什么不同 ① 背景 luajit官方 标准lua官方 openresty自身维护的luajit 编译luajit ② LuaJIT 在 OpenResty 整体架构中的位置 ③ 标准 Lua 和 LuaJIT 的关系 ④ 为什么选择LuaJIT ⑤ lua特别之处 1)Lua 的下标从1开始 2) 使用…

Java HelloWorld

一、java命令 javac:将.java文件编译成.class文件 cp - 指定class搜索路径 d - 指定class文件生成目录 java: 执行.class或.jar文件 cp指定class搜索路径 示例:java test1.app #表示执行./test1/app.class文件main函数 jar:打包生成.jar文件 v- 可视化输…

星星之火,可以燎原——关于太赫兹的技术进展

盼望着,盼望着,5G来了,6G的脚步也近了。除了做好现有的技术工作,作为通信人还要不断关注新技术的发展,真心不易!无线数据链路的容量在过去十几年中呈指数级增长,但对更高数据速率的需求持续增加…

MySQL数据库优化技术一

纵论 对mysql优化时一个综合性的技术,主要包括 表的设计合理化(符合3NF)添加适当索引(index) [ 四种: 普通索引、主键索引、唯一索引unique、全文索引 ]分表技术( 水平分割、垂直分割 ) 水平分割根据一个标准重复定义几个字段值相同,表名称不同的表&…

Android Jetpack Compose之ModalBottomSheet的使用

Android Jetpack Compose是一个现代化的UI工具包,让开发者以声明式的方式来构建Android应用。今天我们要讨论的是其中一个重要组件——ModalBottomSheet。 1. ModalBottomSheet简介 ModalBottomSheet是Jetpack Compose中的一个组件,它允许我们从屏幕底部…

Hugging News #0626: 音频课程更新、在线体验 baichuan-7B 模型、ChatGLM2-6B 重磅发布

每一周,我们的同事都会向社区的成员们发布一些关于 Hugging Face 相关的更新,包括我们的产品和平台更新、社区活动、学习资源和内容更新、开源库和模型更新等,我们将其称之为「Hugging News」,本期 Hugging News 有哪些有趣的消息…

第27章 uView 内置路由使用注意事项

1 uView 内置路由不支持通过“localhost”域名直接获取数据。 在前后分离开发中“axios” 路由支持使用“localhost”域名或IP地址获取后端的数据,所以不管是IIS部署还是后端调试通过“axios” 路由都能获取数据,对于.NetCore的前后端分离开发来说“axio…

【proxychains4】虚拟机内kali走主机代理

文章目录 简介安装配置使用测试 简介 ProxyChains是Linux和其他Unix下的代理工具。 它可以使任何程序通过代理上网, 允许TCP和DNS通过代理隧道, 支持HTTP、 SOCKS4和SOCKS5类型的代理服务器, 并且可配置多个代理。 ProxyChains通过一个用户定…

数据结构--单链表的定义

数据结构–单链表的定义 本节的学习目标: 单链表的定义(如何用代码实现) 优点:不要求大片连续空间,改变容量方便 缺点:不可随机存取,要耗费一定空间存放指针 代码实现 struct LNode {ElemType data; //数据域stru…

vcruntime140.dll,丢失如何修复,vcruntime140.dll,丢失修复详细办法(有效的方法)

今天打开photoshop软件的时候,突然间就打不开,电脑报错由于找不到vcruntime140.dll,无法继续执行此代码,然后我就把photoshop卸载了,再重新安装,依然还是报错。这个可怎么办?vcruntime140.dll如…

C++【day1】

练习 定义一个命名空间Myspace&#xff0c;包含以下函数&#xff1a;将一个字符串中的所有单词进行反转&#xff0c;并输出反转后的结果。 #include <iostream> #include<iomanip>using namespace std;namespace Myspace { void reversal(string *str); }void My…

CW32L083不同主频功耗测试

本文主要介绍CWL083VCT6芯片在不同主频下的功耗测试方法和测试结果。 1.HSIOSC时钟 HSIOSC 时钟由内部 RC 振荡器产生&#xff0c;不需要外部电路&#xff0c;比 HSE 时钟的成本低&#xff0c;启动速度快。HSIOSC 时钟频率固定为 48MHz&#xff0c;频率精度低于 HSE 时钟。RC …

《计算机系统与网络安全》 第二章 计算机网络基础与TCPIP协议安全性

&#x1f337;&#x1f341; 博主 libin9iOak带您 Go to New World.✨&#x1f341; &#x1f984; 个人主页——libin9iOak的博客&#x1f390; &#x1f433; 《面试题大全》 文章图文并茂&#x1f995;生动形象&#x1f996;简单易学&#xff01;欢迎大家来踩踩~&#x1f33…

苹果app用发布证书打包后怎么装手机测试

一、背景 iOS 的开发证书打包后可以通过爱思助手安装到手机上测试&#xff0c;但发布 (Production) 证书是不允许安装在手机上的。而在实际开发过程中&#xff0c;尽管通过开发证书测试过了&#xff0c;iOS生产包仍然可能会出现一些问题&#xff0c;需对生产包也进行测试。 而…

【Stable diffusion教程】AutoDL云部署超详细步骤说明【外婆都会】

1 AutoDL云端部署操作流程 1.1 登录/注册 官网&#xff1a;https://www.autodl.com/home&#xff0c;点击右上角登录/注册。此处我已经注册了 如果你是学生的话&#xff0c;注册完之后&#xff0c;进入控制台&#xff0c;在右上角点一下学生认证&#xff0c;然后你就可以享受…

23.6.24

1、grep&#xff1a;查找字符串 grep 字符串 文件名 -w:按单词查找 -R:实现递归查找&#xff0c;主要用于路径是目录的情况 -i:不区分大小写 -n:显示行号 grep -w "^ubuntu" /etc/passwd ---->查找以ubuntu单词作为开头位置的所在行 grep -w "ubuntu$"…

html简单实现b站评论回车发布

头像&#xff1a; <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><meta name"viewport" content"widthdevice-wi…

Linux系统:进程概念

文章目录 1 操作系统1.1 概念1.2设计操作系统的目的 2进程2.1 进程是什么2.2 如何管理进程2.2查看进程2.3 程序中获取自己的pid2.4 创建一个进程2.5 进程状态2.6 进程优先级2.6.1为什么要有优先级2.6.2 什么是优先级2.6.3 linux下优先级的做法 2.8 其他概念 3进程地址空间3.1 初…

基于Docker环境下的Jenkins搭建及使用

目录 前言&#xff1a; Docker下安装Jenkins 启动Jenkins Jenkins插件下载 配置Jenkins 修改Jenkins时间 配置Python3环境 配置HTML报告/Allure报告 Allure报告配置 简单使用-实例构建 参数化构建 构建后操作 配置成功 控制台输出 Allure报告查看 HTML报告查看 前言&#xff1a…