ModaHub魔搭社区:“百模大战”下,字节跳动选择做一个“大模型商场”

news2024/11/15 17:43:05

“火山方舟”面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即Model-as-a-Service),目前集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等多家AI科技公司及科研团队的大模型。

·这种模式一端连着大模型厂商,另一端则接着大模型的应用需求。如果这条路线成功,那么中间平台就能构建起一个完整生态,甚至成为唯一入口,这可能才是选择这条路线的厂商的终极目标。

随着生成式AI热潮兴起,一个新的价值链正在出现,主要分为六个类别:计算机硬件、云平台、基础模型、模型中心和机器学习操作(MLOps)、应用程序和服务,一眼看上去与传统的人工智能价值链非常相似,只有基础模型是新增的。

随着生成式AI热潮兴起,一个新的价值链正在出现,主要分为六个类别:计算机硬件、云平台、基础模型、模型中心和机器学习操作(MLOps)、应用程序和服务。 图片来源:麦肯锡

目前,AI基础模型似乎已成为第一轮竞争赛的“兵家必争之地”,百度、阿里巴巴、腾讯等原本占据优势地位的科技巨头纷纷推出自己的大模型,“百模大战”格局初现。而同为巨头的字节跳动,直到最近才有了新动作。

6月28日,字节跳动旗下火山引擎发布大模型服务平台“火山方舟”,面向企业提供模型精调、评测、推理等全方位的平台服务(MaaS,即Model-as-a-Service),目前集成了百川智能、出门问问、复旦大学MOSS、IDEA研究院、澜舟科技、MiniMax、智谱AI等多家AI科技公司及科研团队的大模型,类似于为各行各业提供了一个“大模型商场”。

 

“选择合适你的大模型。”火山引擎总裁谭待讲解道,“在选择之前,首先需要明确自己的需求,并基于需求场景,制定可量化的评估指标。到底是关注模型的逻辑推理能力、文本生成能力,还是风险控制能力?有了量化的评估指标作为依据,就可以针对不同的模型进行全方位的能力测评,选择性价比最合适的。注意,并不一定是选效果最好的,而是性价比最合适的。因为在真实应用场景里,成本和收益是不可回避的问题。”

火山引擎智能算法负责人吴迪介绍,企业可以用统一的工作流对接多家大模型,对于复杂需求可设置高级参数、验证集、测试集等功能,再通过自动化和人工评估直观对比模型精调效果,在不同业务场景里还可灵活切换不同的模型,实现最具性价比的模型组合。

“卖点”:成本和数据安全

总结起来,整场发布会主要强调两个“卖点”:成本和数据安全。

吴迪称,国内大模型正在快速迭代,不同大模型在特定任务上各有千秋,企业不必急于绑定一家大模型,而是应该结合自身业务场景,综合评估使用效果和成本,在不同场景选用更具性价比的模型。

 

据国盛证券《ChatGPT需要多少算力》报告,GPT-3训练一次的成本约为140万美元,一些更大的大模型,训练成本介于200万美元到1400万美元之间。

“训练大模型很昂贵,但是从长期来看,模型的推理开销会超过训练开销。效果和成本的矛盾永远存在,降低推理成本会是大模型应用落地的重要因素。一个经过良好精调的中小规格模型,在特定工作上的表现可能不亚于通用的、巨大的基座模型,而推理成本可以降低到原来的十分之一。”吴迪说。

数据安全也是大模型落地应用中的核心话题。据网络安全公司Cyberhaven调查,至少有4%的员工将企业敏感数据输入ChatGPT,敏感数据占输入内容的比例高达11%。2023年初,三星公司在使用ChatGPT不到20天时,就发现其半导体设备相关机密数据被泄露,并连续发生3起类似事故。

 

在这点上,吴迪一方面介绍了“火山方舟”已上线的基于安全沙箱的大模型安全互信计算方案,利用计算隔离、存储隔离、网络隔离、流量审计等方式,实现模型的机密性、完整性和可用性,另一方面也表示正在探索基于英伟达新一代硬件支持的可信计算环境、基于联邦学习的数据资产分离等多种方式的安全互信计算方案。

在具体营收模式方面,吴迪表示,作为中间平台,火山会将资源供应给大模型提供方,供应内包含一定的IaaS层(Infrastructure as a Service,基础设施即服务)利润,大模型提供方刨除掉基本成本,叠加自身认为合理的利润,最终形成其大模型在火山方舟上的定价。而下游客户的支付成本包括了模型服务费与平台服务费,后者火山在相当长时间内都设置为零。

什么是MaaS?

火山引擎发布会中提到的商业模式MaaS是什么?

MaaS(模型即服务)是生成式AI最常见的商业模式之一,比如引起这一波生成式AI热潮的OpenAI将其GPT模型(ChatGPT背后的基础模型)授权给微软,以在其必应搜索引擎中使用。借助MaaS,公司可以通过云访问生成式AI模型,并使用它们来创建新的应用。

这种商业模式类似于当今大多数软件基于订阅的模式。MaaS的最大好处之一是它使公司可以访问最新的生成式AI模型,而无需投资从头开始构建这些模型所需的基础设施和资源。此外,MaaS产品(如OpenAI的GPT-3和谷歌的BERT)高度可定制。

资产管理公司Globalxetfs认为,我们最终可能会看到根据模型的使用情况收取增量费用的商业模式,类似目前在亚马逊云(AWS)或微软云(Azure)看到的情况。其被称为即用即付价模式,客户只需为他们使用的服务付费。它还允许模型提供商管理其成本结构(通过人工智能模型运行的每个查询都有相关成本,目前估计约为两到三美分),OpenAI的文本生成图像工具DALL-E目前实现了这种类型的定价结构。

终极目标:构建生态

火山引擎这种入局大模型的方式并非第一次出现,之前云厂商亚马逊云科技就有相关实践。4月,亚马逊推出Amazon Bedrock新服务,通过API(应用程序编程接口)可访问来自AI21 Labs、Anthropic、Stability AI和亚马逊自己的大模型。

美东时间6月28日,亚马逊云科技销售和营销高级副总裁马特·加曼 (Matt Garman)在采访中称,“针对金融服务客户优化的模型可能不是针对基因组数据优化的模型,也可能不是最适合电子商务或图像或任何其他事物的模型。也比如Stability AI对于图像来说是一个很好的模型,但对于文本来说却不是。可以通过一些测试判断模型A的性能是否优于模型B,然后自由选择模型组合或最适合的模型。”

这种模式一端连着大模型厂商,另一端则接着大模型的应用需求。如果这条路线成功,那么中间平台就能构建起一个完整生态,甚至成为唯一入口,这可能才是选择这条路线的厂商的终极目标。

在接受媒体采访时,谭待称,火山侧重于提供平台,提供安全、低成本的应用服务,目前仍坚持不做大模型。

谭待认为,未来的大模型市场将是一个百花齐放的多模型生态,在这个生态系统中,将同时并行存在几个少数的超大规模的大模型、多个中等规模的大模型和更多个行业的垂直模型,这是由安全信任、行业壁垒和成本因素共同决定。

中国科学技术信息研究所等机构发布的《中国人工智能大模型地图研究报告》显示,截至今年5月,国内已公开披露的大模型数量达到79个。

“另一方面,企业尤其是行业头部企业,未来自身对于大模型的应用将会是‘1 +N’的模式,即企业通过自研或与第三方模型服务商的深度合作,形成自身的1个主力模型。在这个主力模型之外,在不同的场景中,企业还会同时应用N个外部模型。”谭待说。

麦肯锡在《探索生成式人工智能价值链中的机会》一文中表示,生成式人工智能系统的基础比大多数传统人工智能系统要复杂得多。因此,与交付相关的时间、成本和专业知识给整个价值链的新进入者和小公司带来了巨大的阻力。“虽然整个领域都存在价值,但我们的研究表明,在可预见的未来,许多领域将继续由科技巨头和现有企业主导。”报告称。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/706481.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

通过elementui的el-table实现table嵌套展示

el-table属性: :expand-row-keys: 可以控制行的展开和关闭,也可以控制只能有一行进行展开 expand-change:是表格行的切换事件,具体方法如下 el-table-column属性: type"expand" :表示如果有子t…

从网上复制shell脚本 到 linux下运行 碰到的各种问题汇总

从网上复制shell脚本 到 linux下运行 碰到的各种问题汇总 快捷键CtrlU查看网页源码 一、报错现象:: No such file or directory 解决方法:在linux系统下执行:dos2unix filename 问题原因:本质是文件中二进制符号^M乱码问题 参考…

JAVA学习(七)

1. JAVA 多线程并发 1.1 JAVA 并发 并发知识库 1.2 JAVA 线程实现/创建 创建方式 1.2.1 承 继承 Thread 类 Thread 类本质上是实现了 Runnable 接口的一个实例,代表一个线程的实例。启动线程的唯一方 法就是通过 Thread 类的 start()实例方法。start()方法是一个…

c++实现httpd服务器

文章目录 网络的初始化端口的分配协议的使用WSAStartup函数参数1:WORD wVersionRequested参数2:LPWSADATA lpWSAData返回值 int代码实现 创建套接字int af表示套接字的类型(网络套接字 文件套接字)int type数据流 数据报int protocol 通信协议 TCP &…

网络空间安全数学基础考试要点

网络空间安全数学基础 阶的计算不要求那个公式,但是Order几次方要求 考试会考原根 Legendre必考 多项式计算必考 扩域多项式计算 同态不考 域元素表示 本元多项式不考 1.整除 3 ≡ \equiv ≡ 4 mod 7不对吧3 ≡ \equiv ≡ 3 mod 74 ≡ \equiv ≡ 4 (m…

DITA技巧:给文字加颜色

- 1 - 场景 在文档中,我们有时候会在文字中使用颜色。 比如: 在文档中,使用在文字上加颜色来代表一定意义。使用MS Word编写文档的时候,直接在文字上加颜色就可以了。转换成DITA以后,大家会发现在XML编辑器的工具栏…

css实现大屏效果的背景div

实现大屏效果的背景div, 效果如下: html <div class"box">1111111</div>css .box {width: 200px;height: 80px;background: linear-gradient(270deg, #00cda2, #00cda2) 0 0 no-repeat,linear-gradient(180deg, #00cda2, #00cda2) 0 0 no-repeat,line…

JUC高并发编程-初篇(后续发布高阶篇)

JUC高并发编程 1.JUC概述 1.1 什么是JUC JUC就是java.util.concurrent工具包的简称。这是一个处理线程的工具包&#xff0c;JDK1.5开始出现的。 1.2 线程和进程概念 进程&#xff1a;指在系统中正在运行的一个应用程序&#xff1b;程序一旦运行就是进程&#xff1b;进程—…

数据结构--队列的基本概念

数据结构–队列的基本概念 队列的定义 队列其实是一种受限制的线性表 队列(Queue)&#xff1a;是 只允许在一端进行插入或删除操作 \color{red}只允许在一端进行插入或删除操作 只允许在一端进行插入或删除操作的线性表 重要术语: 队头、队尾、空队列 队列的特点: 先进先出 \…

表格检测识别技术面临的挑战和发展趋势

第四章 表格检测识别技术面临的挑战和发展趋势 现在表格区域检测的准确率已经很高了。但检测和识别是相辅相成的&#xff0c;单独的检测不够完善。如何利用检测和结构识别的结果互相提高效果&#xff0c;是未来的研究方向和重点。 由于表格应用场景较为广泛&#xff0c;表格形…

【MySQL学习笔记】(三)操作表(结构)

表 1 创建表2 查看表结构3 修改表4 删除表 注&#xff1a;本篇文章操作的是表的结构&#xff0c;并不是表的内容。 属于笔记&#xff08;一&#xff09;中的SQL分类中的DDL 1 创建表 语法&#xff1a; CREATE TABLE table_name ( field1 datatype, field2 datatype, field3 d…

线程同步器:CountDownLatch、CyclicBarrier、Semaphore

CountDownLatch 日常开发中经常遇到一个线程需要等待一些线程都结束后才能继续向下运行的场景&#xff0c;在CountDownLatch出现之前通常使用join方法来实现&#xff0c;但join方法不够灵活&#xff0c;所以开发了CountDownLatch。场景&#xff1a;一个等其他多个线程&#xf…

消息中间件进阶学习

文章目录 1、RabbitMQ1.1、如何保证消息不丢失&#xff1f;小总结面试快速答法 1.2、消息的重复消费问题面试快速答法 1.3、死信交换机小总结面试快速答法 1.4、消息堆积怎么解决小总结面试快速答法 1.5、集群小总结面试快速答法 2、Kafka2.1、Kafka是如何保证消息不丢失小总结…

Linux中Docker详细安装说明

1.准备环境 说明&#xff1a;准备Linux系统centos7版本(以上) 2.切换管理模式 说明&#xff1a;输入一下命令&#xff0c;然后回车&#xff0c;输入密码。 su – 3.更新yum 说明&#xff1a;为了保证doker能够给顺利安装&#xff0c;那么更新一下&#xff1b;如果没有也可以…

单相智能电量多用户远程预付费控系统优化的设计及应用

摘要&#xff1a;由于现有系统仅对电表数据进行读取操作&#xff0c;存在成本较高和耗时较长的问题&#xff0c;为此对单相智能多用户远程预付费控系统优化设计进行研究。选择电能表子系统作为优化对象&#xff0c;选取78KO527A微控制器作为电能表子系统的控制核心&#xff0c;…

文献阅读:中国物理海洋学研究70 年-发展历程、学术成就概览

摘要 本文概略评述新中国成立70 年来物理海洋学各分支研究领域的发展历程和若干学术成就。中国物理海洋学研究起步于海浪、潮汐、近海环流与水团&#xff0c;以及以风暴潮为主的海洋气象灾害的研究。随着国力的增强&#xff0c;研究领域不断拓展&#xff0c;涌现了大量具有广泛…

Linux踢掉远程登录用户

Linux踢掉远程登录用户 安装psmisc yum install -y psmisc查看远程登录用户 who得到以下结果 [rootcentos7 ~]# w10:58:13 up 0 min, 2 users, load average: 0.12, 0.03, 0.01 USER TTY FROM LOGIN IDLE JCPU PCPU WHAT lhz pts/0 19…

mysql——数据库设计

前言 之前我们已经了解了 mysql 的基本增删改查mysql 从入门到放弃——基本约束以及语法 现在我们系统的进行一遍数据库的设计 直接进入主题 来个例子&#xff1a;下面我们将围绕这个例子来进行数据库的设计 我们就来简单的模拟 大学教务处的选课 系统 中的 选课功能 注意…

十大排序算法(Java实现)

文章目录 零、总览 / 前言一、冒泡排序1.算法描述2.代码&复杂度 二、选择排序1.算法描述2.代码&复杂度 三、插入排序1.算法描述2.代码&复杂度分析 四、希尔排序1.算法步骤2.代码&复杂度分析 五、归并排序1.算法描述2.代码&复杂度分析 六、快速排序1.算法描…

《强化学习的数学原理》思维导图,供初学者参考

对应课程&#xff1a; 【强化学习的数学原理】课程&#xff1a;从零开始到透彻理解&#xff08;完结&#xff09;_哔哩哔哩_bilibili