Cube-Studio:开源大模型全链路一站式中台

news2024/11/28 3:29:25

开源项目,欢迎star哦,https://github.com/data-infra/cube-studio

一款真正意义的 LLMOps 框架

LLMOps(Large Language Model Operations)是一个涵盖了大型语言模型(如GPT系列)开发、部署、维护和优化的一整套实践和流程,而不仅仅是大模型的应用层。

简介

Cube-Studio是由腾讯音乐开源的一款云原生一站式AI中台,覆盖机器学习/深度学习/LLM大模型,开发、训练、推理、应用,全链路。

github地址:https://github.com/data-infra/cube-studio

该项目目前已是国内最火的开源算法全链路中台,上千家企业私有化部署和项目交付,非常适合数据算法架构团队搭建公司级AI中台,以及toB企业算法中台类项目交付。

LLMOps

cube-studio除了支持原有mlops全链路能力外,新版本增加了很多大模型相关的链路能力。

1. 支持AIHub形式部署40+常用开源大模型:

模型市场中已集成了40+常用开源大模型,包括chatglm4、llama3、qwen2、baichuan2、gemma等,还有openjourney、stable diffusion等文生图模型,并且支持开源模型一键部署,一键开发,一键微调,快速直观地感受大模型。

在这里插入图片描述

提示:除了大模型,另外还有400+开源图文音常规模型。

2. 多层次支持大模型训练微调技术栈:

• 支持tensorflow、pytorch、paddlejob、mindspore、mxnet等分布式多机多卡训练框架;

• 支持deepspeed、megatron、colossalai、horovod、mpi等分布式加速框架;

• 同时支持RDMA网络协议,可以使用底层IB交换机或roce网络;

• 硬件适配英伟达,以及海光、华为、寒武纪、天数智芯等国产设备,支持vgpu。

在这里插入图片描述

提示:除了多机多卡训练,也包含spark/ray/volcano等分布式计算框以及特征处理,文本处理,模型处理等环节。

3. 支持自有数据集一键微调部署:

支持chatglm3、chatglm4、qwen2、baichuan2、llama3等一键微调,集成了llama factory 支持100+LLMs的微调方案;并支持自动发布为推理服务,vllm推理加速,形成openai流接口。

pipeline一键训练推理部署,非常适合不太熟悉大模型微调算法的同学,任务流完成后可以直接对接到其他的openai接口使用的产品中。

在这里插入图片描述

4. 通过智能体构建,构建智能人机交互

• 支持对接外部llm服务厂商接口

• 支持对接内部预训练模型或微调模型llm服务接口

• 支持通过prompt构建领域专家和添加私有知识库

• 支持文生图,语音多模态交互

• 支持支持对接企业oa软件机器人

在这里插入图片描述

在这里插入图片描述

5. 大模型自动化标注

标注是AI中经常出现的任务,cube-studio中集成了开源标注平台label studio,支持图/文/音/多模态/大模型多种类型标注功能,用户管理,工作任务分发,对接数据集,支持标注数据导入;对接pipeline,支持标注结果自动化训练;对接aihub模型市场,支持自动化标注,只需将服务接口配置到label studio中,即可实现通过大模型来自动化标注。

在这里插入图片描述

在这里插入图片描述

提示:除了支持大模型的自动化标注,也支持普通模型图文音的自动化标注。

详细操作
使用参考wiki:https://github.com/data-infra/cube-studio/wiki

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1897094.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【EI会议/稳定检索】2024年应用数学、化学研究与物理工程国际会议(AMPE 2024)

2024 International Conference on Applied Mathematics, Chemical Research, and Physical Engineering 2024年应用数学、化学研究与物理工程国际会议(AMPE 2024) 【会议信息】 会议简称:AMPE 2024 大会时间:点击查看 截稿时间:官网查看 大…

pp 二 物料bom (CS01 CS02 CS03)

02:bom建了以后不能做生产,也不能下达计划 03:不能下达成本,下达订单 bom里面的存储地点高于物料主数据里面的存储地点(mrp视图2) 生产存储地点作为组件角度是一个发料得存储地点 但是作为一个成品则是成…

Restore Equipment

Restore Equipment 魔兽世界 - 盗号申请 - 恢复装备流程 魔兽和网易真的不行啊 1)这个装备本来就是兑换的竟然可以卖NPC 2)针对这个情况竟然无法挽回 3)设计理念真的不得不吐槽一下 4)策划真的不咋样,要是有机会我要自…

mssql查询历史执行过的语句日志

SELECT deqs.creation_time,dest.text AS [SQL Text],deqs.execution_count,deqs.total_elapsed_time,deqs.total_worker_time FROM sys.dm_exec_query_stats AS deqs CROSS APPLY sys.dm_exec_sql_text(deqs.sql_handle) AS dest--where dest.text like %这个是我的条件&#…

数学建模----滑翔伞伞翼面积的设计及运动状态描述

摘要 滑翔伞作为一项融合了挑战、冒险和刺激于一体的运动,近年来在全球范围内受到了广泛的关注。滑翔伞在救援、探险、体育、娱乐、环保和交通等领域的应用展现了其重要价值。然而,中国在滑翔伞领域尚未取得突破,缺乏全球影响力和竞争力。因此…

Keepalived+LVS实现负责均衡,高可用的集群

Keepalived的设计目标是构建高可用的LVS负载均衡群集,可以调用ipvsadm工具来创建虚拟服务器,管理服务器池,而不仅仅用作双机热备。使用Keepalived构建LVS群集更加简便易用,主要优势体现在:对LVS负责调度器实现热备切换…

iPad电容笔什么牌子好?2024最值得买的五款高性价比电容笔推荐!

现在平板和电容笔在一定程度上可以替代传统的笔和纸,不仅减少纸张浪费,还可以导入教材和习题册。只需携带它们就无需携带厚重的书本,这种环保、便捷、方便的特点吸引了越来越多的用户。但电容笔品牌的不断涌现,也让用户更加难以抉…

零基础STM32单片机编程入门(七)定时器PWM波输出实战含源码视频

文章目录 一.概要二.PWM产生框架图三.CubeMX配置一个TIME输出1KHZ,占空比50%PWM波例程1.硬件准备2.创建工程3.测量波形结果 四.CubeMX工程源代码下载五.讲解视频链接地址六.小结 一.概要 脉冲宽度调制(PWM),是英文“Pulse Width Modulation”的缩写&…

配置基于用户认证的虚拟主机

添加账号abc [rootlocalhost conf.d]# htpasswd -c /etc/httpd/zhanghao abc New password: Re-type new password: Adding password for user abc添加账号tom [rootlocalhost conf.d]# htpasswd /etc/httpd/zhanghao tom New password: Re-type new password: Adding pa…

C#桌面应用开发:番茄定时器

C#桌面应用开发:番茄定时器 1、环境搭建和工程创建: 步骤一:安装visual studio2022 步骤二:新建工程 2、制作窗体部件 *踩过的坑: (1)找不到工具箱控件,现象如下:…

昇思MindSpore学习笔记4-02生成式--DCGAN生成漫画头像

摘要: 记录了昇思MindSpore AI框架使用70171张动漫头像图片训练一个DCGAN神经网络生成式对抗网络,并用来生成漫画头像的过程、步骤。包括环境准备、下载数据集、加载数据和预处理、构造网络、模型训练等。 一、概念 深度卷积对抗生成网络DCGAN Deep C…

个人引导页+音乐炫酷播放器(附加源码)

个人引导页音乐炫酷播放器 效果图部分源码完整源码领取下期更新内容 效果图 部分源码 //网站动态标题开始 var OriginTitile document.title, titleTime; document.addEventListener("visibilitychange", function() {if (document.hidden) {document.title "…

[作业]10 枚举-排列类

作业&#xff1a; 已做&#xff1a; #include <iostream> using namespace std; int n; int a[100]; void func(int ,int); int main(){cin>>n;func(0,n);return 0; } void func(int k,int m){if(k>m-1){for(int i0;i<m;i){cout<<a[i];}cout<<en…

【高性能服务器】select模型

&#x1f525;博客主页&#xff1a; 我要成为C领域大神&#x1f3a5;系列专栏&#xff1a;【C核心编程】 【计算机网络】 【Linux编程】 【操作系统】 ❤️感谢大家点赞&#x1f44d;收藏⭐评论✍️ 本博客致力于知识分享&#xff0c;与更多的人进行学习交流 IO多路复用就是复用…

一文了解常见DNS问题

当企业的DNS出现故障时&#xff0c;为不影响企业的正常运行&#xff0c;团队需要能够快速确定问题的性质和范围。那么有哪些常见的DNS问题呢&#xff1f; 域名解析失败&#xff1a; 当您输入一个域名&#xff0c;但无法获取到与之对应的IP地址&#xff0c;导致无法访问相应的网…

INTERCONNECT 使用脚本导入 Element Library 的器件

INTERCONNECT 使用脚本导入 Element Library 的器件 正文示例1示例2正文 在 INTERCONNECT 添加自定义器件到 Custom 文件夹下 一文中,我们介绍了如何将器件或者自定义器件添加到用户自定义的库中。那么我们如何从 Element Library 中导入我们需要的器件呢? 最简单的方式就是…

Linux系统(CentOS)安装iptables防火墙

1&#xff0c;先检查是否安装了iptables 检查安装文件-执行命令&#xff1a;rpm -qa|grep iptables 检查安装文件-执行命令&#xff1a;service iptables status 2&#xff0c;如果安装了就卸装(iptables-1.4.21-35.el7.x86_64 是上面命令查出来的版本) 执行命令&#xff1a…

Logstash安装插件失败的问题

Logstash安装插件失败的问题 安装 logstash-output-jdbc 失败 报错为&#xff1a; Unable to download data from https://rubygems.org - Net::OpenTimeout: Failed to open TCP connection to rubygems.org:443 (execution expired) (https://rubygems.org/latest_specs.4.…

正确使用Pytorch Geometric打开Cora(Planetoid)数据集

文章目录 关于报错&#xff08;"Cannot connect to host"&#xff09;解决方法 关于报错&#xff08;“Cannot connect to host”&#xff09; 我们在使用PyG调用Planetoid数据集的时候&#xff0c;常会碰到如下报错&#xff1a; 解决方法就是手动下载这个数据集。…

CentOS 离线安装部署 MySQL 8详细教程

1、简介 MySQL是一个流行的开源关系型数据库管理系统&#xff08;RDBMS&#xff09;&#xff0c;它基于SQL&#xff08;Structured Query Language&#xff0c;结构化查询语言&#xff09;进行操作。MySQL最初由瑞典的MySQL AB公司开发&#xff0c;后来被Sun Microsystems公司…