字节扣子模型广场,给AI大模型搭了一座擂台

news2024/11/18 17:39:32

前言

6月11日凌晨,在苹果开发者大会WWDC 2024上,苹果发布iOS 18,同时首次公布了苹果智能(Apple Intelligence,简称 AI)。在近 40 分钟的时间内,苹果差不多提到了 60 次 Apple Intelligence,基于自有AI与“外援”OpenAI,苹果将重构Siri、iOS以及iPhone、iPad、Mac等设备的体验。发布会后,苹果股价连续两日拉涨,最新市值3.3万亿美元再度成为世界市值最高公司。

图片

(图源:苹果WWDC 2024)

苹果宣布放弃汽车押注AI后,终于真刀真枪地干了起来。苹果用实际行动证明,AI就是世界的未来——上一次科技行业如此激动还是移动互联网爆发时。

“AI的iPhone时刻”终于来了!这一概念由黄仁勋率先提出,作为AI“卖铲子的”,英伟达一骑绝尘,成了跟苹果、微软同一个体量的超级巨头。现在看来,iOS 18以及Apple Intelligence的发布,意味着AI的“iPhone时刻”真的到来。

Bot大爆发,AI现象级应用呼之欲出

2022年11月,GPT-3.5让人们见到了AI大模型的强大威力,AIGC百花齐放,文生文、文生图、文生音乐、文生视频……不断涌现“炸裂级”基础大模型技术。同时,越来越多的企业与开发者跑步入局AI,想法设法将AI融入到自家产品中。

然而从结果来看,AI尚未普及,迄今为止行业缺乏一款类似于微信(3G移动时代)或者说抖音(4G移动时代)的现象级应用,大多数用户对AI大模型是“只闻其声”,Sora更是成了停留在demo阶段的传说。

当前的AI大模型有点像2010年前后的移动互联网:iPhone与安卓均已诞生,3G也已发牌,然而App的缺失却让智能手机成了少数发烧友的炫酷装备。

任何技术都需要繁荣的应用生态,因为“只有车跑起来,高速公路才有价值”。AI应用生态亟需更加丰富,但AI开发者正面临两大难题:

一个是AI大模型本身具有极高的开发门槛,开发者不知道如何“下牙”,不同模型能力不同,越复杂的模型越难调试,学习成本高,开发难度大;第二个是AI计算资源昂贵奢侈,大模型训练、推理与部署均需要高性能GPU、电能等计算资源,这给开发者带来巨大的资金压力。

AI想要普及,必须下沉到各类软硬件产品上,要么成为AI硬件,要么成为融入到AI硬件中的AI应用——其中最具代表性的是Bot,即Robot(机器人)的缩写,它是当前应用最广泛的智能应用形态,具有代表性的是ChatGPT、字节豆包、文心一言。

图片

(图源:字节扣子)

大模型将重构人机交互方式,应用的终极形态可能不一定再是基于触控点按GUI(图形交互界面)的App,而是基于人机自然多模态对话交互的Bot,就跟苹果在WWDC 24上“画饼”的Siri超级助理一样,AI可理解文字、声音、图片、视频等诸多指令并生成对应的结果。

这样看,Bot将会是AI时代的“App”,对于开发者来说,开发Bot将是拥抱AI的主流路径,也是新的红利。

因此,要推动AI大模型落地,最重要的一点就是降低Bot开发门槛。移动时代,苹果和谷歌始终为降低开发门槛而不懈努力,它们的应用生态分别拥有数百万计的App。AI时代,字节旗下的扣子(coze.cn)也想扮演类似角色,让开发者更低门槛、更高效率、更低成本地开发Bot应用,拥抱AI新浪潮。

字节扣子,让人人都能成为AI开发者

对大多数开发者来说,基于基础大模型开发AI应用特别是Bot,并不现实,因为基础大模型开发门槛极高,与大多数开发者之间都有技术鸿沟,更别说缺乏编程经验的普通人了。

AI开发者的痛点,有平台看见了,比如善于技术产品化的字节跳动。在大模型驱动的AI时代,字节没有狂卷参数猛堆料搞军备竞赛,而是将重点放在了技术产品化与大模型落地上。除了“人有我有”的基础大模型以及对应的云服务外,今年2月字节在国内上线了新一代 AI Bot 应用开发平台扣子(coze.cn)。在这个平台上,即使是没有编程基础的小白,也能快速创建各种各样的聊天机器人,并将创建的机器人发布到抖音、微信等社交通讯平台。

图片

(图源:字节扣子)

相较于其他Bot开发平台而言,字节扣子的最大特色可被概括为:“模块化”。

开发者可像搭积木一样拼装不同组件,将大模型、插件和工作流等能力组合成具有不同能力、适用于不同场景的Bot应用,哪怕没有编程基础的人,也可通过拖拉拽的方式快速搭建一个工作流实现编程的效果。

在搭建Bot的过程中,扣子提供了多样的知识存储能力和丰富的交互模式支持,开发者可“投喂”网站实时信息或者本地大文件作为知识库,让Bot具备特定领域的数据源。

此外,字节扣子另一个特征是更新迭代快,这一点至关重要。为什么苹果在WWDC 2024上说不清楚“苹果智能”的路线图?因为AI进化神速,它到底会长出什么样的软硬件今天没人知道答案。因此,所有AI开发者特别是Bot都必须只争朝夕,快速进化。

字节扣子可满足开发者快速进化的需求,一则是其低门槛、易上手的搭建环境支持Bot极速迭代;二则是其会及时地更新各种基础大模型且兼容并包,让Bot拥有与时俱进的底层智能,其现已支持字节豆包、通义千问、MiniMax、Moonshot、智谱、百川智能等基础大模型,且名单依然在扩大中。

凭借着模块化的低门槛开发能力,快速迭代的平台基础能力体系,字节扣子让Bot开发变得前所未有的简单。

6月13日,字节扣子联合Intel推出AI工坊(Coze AI Factory)活动,同时推出了全新板块“模型广场”,定位为在线大模型对比与评估系统——可以简单地将其理解成是AI大模型以及Bot的“擂台”。

图片

(图源:字节扣子)

古代的“擂台”要么是比武招亲,要么是招募勇士,总之就是要寻觅牛人。同理,字节扣子的“模型广场”旨在构建一个大模型评估体系,一则让AI开发者可更好地选择适合自身需求的大模型,二则让大模型供应商知道对应大模型在细分领域和真实应用中的反馈,进而有的放矢地改进。

字节扣子模型广场推出的背景是,“百模大战”如火如荼,基础大模型,垂直大模型,产业大模型,多模态大模型如雨后春笋出现,这让开发者陷入了选择困难症,在开发Bot往往不知道选择什么模型,市面上也没有类似于豆瓣电影评分这样的评测体系。

举个例子,小雷这样的科技爱好者想在扣子上创建一个帮助编辑检查文章配图版权、错别字的Bot,但缺乏大模型开发经验的我并不知道扣子上的哪些模型、哪些插件、哪些能力可以为我所用,在模型广场,小雷可以通过“模型对战”来寻觅适合的模型。

也就是说,开发者可让一个Bot在隐藏模型的情况下回答任何问题,再对回答进行投票,测试结束扣子会揭晓模型,让开发者不再有选择困难症。

字节扣子模型广场的对战模式分为三种:指定Bot对战、随机Bot对战和纯模型对战。

开发者想要评测模型在指定细分领域的能力,可以“指定Bot对战”,选取感兴趣的Bot后(比如财经领域的信息处理,再比如数学领域的知识应用),系统会随机选取两个匿名模型来让开发者进行对战测试,检验是否符合预期并进行筛选。

图片

(图源:字节扣子)

比如我想做一个影评类Bot,需筛选一个善于影视类信息分析处理的模型。我只需选中字节扣子上已有的“影视分析Bot”进行对战,就可以筛选出表现更好的大模型。

图片

(图源:字节扣子,该问题下,B模型显然不如A模型表现好。)

如果开发者要评测模型在通用业务场景下的能力,则可选择“随机Bot”对战模式,系统会随机选取一个bot再随机匹配两个匿名模型来进行评测;

图片

(图源:字节扣子,随机Bot对战,问一个问题,对Bot的回答进行评分)

图片

(图源:字节扣子,随机Bot对战,评分后系统会展示隐藏模型细节,帮助开发者选择合适的。)

如果开发者只是想评测模型本身能力,则可选择“纯模型对战”模式,可直观地对比出模型本身的文本生成等AIGC能力。

字节靠着引以为豪的A/B测试方法体系,开发并运营了多款成功的移动产品,成为移动App工场。在小雷看来,字节扣子创造性推出的“模型竞技场”其实也是受到A/B测试方法论的启发,让开发者可以更高效地开发Bot,同时帮助所有大模型更快进化,字节扣子正在邀请更多大模型对其开放 API,加入到其评测范围,收集真实消费场景的数据进而有的放矢地优化。

自上线以来,字节扣子动作频频,成功抹平基础大模型与AI应用Bot之间的技术鸿沟,让Bot开发走向低代码阶段。AI应用的开发正在变得跟开发App一样简单甚至更简单。今年5月就有一位五年级小朋友基于字节扣子开发了AI bot,他通过利用在学校学到的语文知识,打造了一个堪称英语外教的 AI bot。

人人成为AI开发者,在字节扣子正在成为现实。

重做所有软硬件!开发者迎接AI泼天富贵

任何产品的成功都离不开两点:开发与运营,AI应用也不例外。AI应用的分发则是成功的运营的第一步。开发者开发Bot后,需要先部署让其“跑起来”,再分发获取用户、实现商业化,这些字节扣子都有对应的能力支持。

开发者在字节扣子创建完Bot后,可将Bot部署成网站/App/小程序甚至硬件终端上,接着可将其一键发布到包括抖音、公众号(订阅号/服务号/企业微信)在内的社交通讯平台。

图片

(图源:字节扣子)

已有不少开发者尝到了低门槛开发与运营Bot的甜头,比如海底捞使用扣子模拟顾客对话演练,帮助客服小姐姐提高服务水平,让“海底捞式服务”在AI加持下精益求精;比如超级猩猩使用扣子帮助用户懂得更好的健身;招商银行基于扣子搭建了推荐餐饮优惠门店的掌上生活优惠 bot 以及分析市场行情的财富看点……

2024年的一个显著趋势是,所有软硬件都在被用AI重做一遍。比如阿里提出了AI电商战略让淘宝App全面拥抱AI;再比如在硬件行业,AI手机、AI PC、AI电视、AI穿戴、AI汽车更是蔚然成风,继OPPO、vivo、荣耀、三星、华为、魅族等安卓巨头加码AI硬件后,WWDC 24上苹果的动作更表明,AI手机以及AI硬件是大势所趋。

硬件开发者当然不只是大厂,除了海量智能硬件开发者外,还有大量的基于智能硬件实现行业方案的开发者。不过,AI硬件开发比AI软件要难得多,因为终端侧会更受限于算力、网络、续航等底层资源。苹果AI硬件采取了端-边-云的大模型联动协同复杂方案,vivo、三星等AI硬件巨头都请了“外援”,由此可见AI硬件开发,绝非易事。

字节扣子已针对AI硬件的开发难题提供解法,其产品经理潘宇扬就明确提到,扣子已具备将AI能力带入硬件设备的能力,比如说在边缘云Bot的统筹下,普通的摄像头也能化身“AI设备”,通过图像截取、图像分析等能力,告诉后台哪个展馆热度最高、人流如何。

借着字节扣子“一键发布Bot”的能力,开发者可一键让硬件接入大模型能力,基于此,教育硬件、穿戴设备、家居家电、健康设备、行业智能设备等等智能设备,都可具备全新的Bot对话服务能力,极大化地感知真实世界与场景需求,更好地服务于人类的生活、生产与学习。

不论是移动互联网还是AI大模型,软件与硬件均密不可分。AI硬件是AI 应用普及的关键,AI设备上的OS将升级为AI OS(如iOS 18),软件则将升级成AI 应用(如豆包)。不断降低AI软硬件应用开发门槛的字节扣子,正在“长出”更多Bot创新。

图片

(图源:字节扣子)

移动互联网的流量红利消失,开发者迎来AI带来的新一轮泼天富贵。千行百业的软硬件开发者正在字节扣子释放创意,结合业务场景与客户需求,开发Bot,用Bot创业,用Bot承载现有业务服务客户,用Bot改造现有软硬件应用,用Bot重塑原来的数字化系统。

写在最后:

“高手在民间”。

移动互联网时代,iOS与安卓催生了海量的创新,不只是有微信、抖音、美团外卖、街电等等创新软件,也有智能电视、智能手表、智能门锁、智能家电、XR眼镜、智能汽车等智能硬件,还有智慧交通、智能能源、智能安防、共享经济等等行业数字化应用……

同样,当所有软硬件开发者,甚至每一个用户都能低门槛地开发AI Bot时,AI一定会实现从“智能涌现”到“创新涌现”的跨越,“AI英雄”将会创造出许多我们今天想得到、想不到的AI软硬件应用,乃至全新的商业模式。

AI的iPhone时刻已经到来,AI应用的算力、设备、开发工具等基础设施已万事俱备,我们距离真正的“AI时代”,只有一步之遥。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1838767.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据库复习——范式(Normal Form)

因为上课的时候一直在摸鱼没有听懂,所以复习的时候理解一下数据库中关于范式的相关知识点。涉及范式的定义,以及给定一个函数依赖集判断是那种范式的方法。 范式 迄今为止一共提出了 6 6 6 种范式,他们的关系是 5 N F ⊂ 4 N F ⊂ B C N F …

ubuntu设置静态ip地址

首先,查看ip地址可以使用: ifconfig 例如,出现如下结果: 然后,需要查看本地的gateway以及dns,可以使用: nmcli device show例如: 接下来说明一下如何设置静态ip:

浅谈配置元件之JDBC连接配置

浅谈配置元件之JDBC连接配置 通过使用“JDBC连接配置”配置元件(JDBC Connection Configuration),您可以轻松地在JMeter测试计划中集成数据库交互能力。本指南将详细介绍如何设置和使用此配置元件来连接数据库并执行SQL查询。 1. 准备工作 …

2002-2022年各省人口总抚养比数据(人口抽样调查)

2002-2022年各省人口总抚养比数据(人口抽样调查) 1、时间:2002-2022年 2、指标:总抚养比 3、来源:国家统计局、统计年鉴 4、范围:31省, 5、缺失情况:无缺失,其中201…

视频监控统一管理平台LntonCVS安防视频监控系统视频汇聚方案

LntonCVS平台最初被设计为一个以视频汇聚为核心的平台。那么,什么是视频汇聚平台,以及它是如何处理视频资源的呢?简单来说,视频汇聚平台能够从不同的视频源(如直播和点播)收集、整合和展示视频内容。以下是…

SAS:从零开始用proc report出人口统计学表

目的:如何生成如下图所示的人口统计学的表格 要点: 1、连续型变量(基线体重、基线身高等)需要展示例数、均值、中位值、最小值、最大值;离散型变量(性别、民族等)需要展示例数和百分比。这些统…

application/x-www-form-urlencoded和json的区别

application/x-www-form-urlencoded 和 application/json 是两种不同的数据格式,常用于HTTP请求中传递数据。 它们各自的特点和使用场景如下: 1. application/x-www-form-urlencoded •特点:这是一种传统的表单提交时采用的编码类型&#x…

Jenkins+K8s实现持续集成(一)

镜像仓库的搭建 docker run -d \--restartalways \--name registry \-p 5000:5000 \-v /root/devops/registry/data:/var/lib/registry \registry安装完之后,执行下面命令可以看到镜像仓库已经安装成功 docker ps 然后在浏览器上输入下面地址进行访问 http://ip:…

高性价比MOS推荐:惠海HC090N10L,HC025N10L,100V高耐压,12V/24V加湿器和3.7V打火机专用MOS

加湿器MOS应用特点(HC090N10L,HC025N10L): 沟槽工艺,抗性好,不容易烧 可应用在1.8MHZ,2.4MHZ和3MHZ频率的加湿器 100V高耐压,MOS不容易尖峰击穿 加湿器缺水干烧MOS不易坏 加湿器出雾量大 …

路由框架 ARouter 原理及源码解析

文章目录 前言一、ARouter 简介二、ARouter 使用1.添加依赖和配置2.添加注解3.初始化SDK4.发起路由操作 三、ARouter 成员1. PostCard 明信片2. Interceptor 拦截器3. Warehouse 路由仓库4. ARouter 注解处理 四、ARouter 原理五、ARouter 源码分析1. ARouter 初始化1.1 ARoute…

美国ARC与延锋安全合作,推动汽车安全气囊技术新突破

在汽车安全领域,安全气囊作为关键被动安全配置,对于保障乘客生命安全至关重要。随着汽车工业的快速发展和科技创新的持续推进,安全气囊技术的升级与革新显得尤为重要。2022年10月25日,美国ARC公司与延锋安全携手合作,共…

产品交付能力提升的探索与分享

在当前激励的市场竞争环境下,对项目交付的成本和毛利要求越来越高。如何能快速高效地完成项目交付已然成为我们矢志追求的目标。抛开人为因素对项目交付效率的影响,产品本身的交付能力才是关键。因此,在设计新产品时需要考虑其便捷交付性&…

那些年我为了考PMP踩过的坑.....

说到考PMP我尊嘟很难过且伤心,众所周知,报考PMP都是要报机构的而且还是PMI认证的机构,所以在报考PMP过程中选的机构我可以说踩过了很多坑了...... Q:包过吗? 大家千万不要信某某机构说的包过噱头,真的很坑…

具身智能的视觉-语言-动作模型综合综述论文

近期arXiv公开了关于具身智能(Embodied AI)中的视觉-语言-动作模型(Vision-Language-Action Models,简称VLAs)的综合综述论文。介绍了VLAs的概念,它们是为了处理多模态输入而设计的模型,包括视觉…

用AI绘画生成网上爆火的治愈系插画,竟然轻松月入两万?!

大家好,我是向阳 一个月的时间,涨粉 2w,太猛了。这类作品,不仅涨粉能力强,变现能力也很强。 在第 11天的时候,就已经开始接商单变现了。 而这类账号,不仅仅只有接商单这一种变现模式。至于其…

Spire.PDF for .NET【文档操作】演示:如何删除 PDF 中的图层

借助Spire.PDF,我们可以在新建或现有pdf文档的任意页面中添加线条、图像、字符串、椭圆、矩形、饼图等多种图层。同时,它还支持我们从pdf文档中删除特定图层。 Spire.PDF for .NET 是一款独立 PDF 控件,用于 .NET 程序中创建、编辑和操作 PD…

用python和HY(lisp)代码为例学习什么是递归?

什么是递归? 看ANSI Common Lisp手册,里面提到递归第二章:欢迎来到 Lisp — ANSI Common Lisp 中文版,说:不要把递归看作一个普通函数来理解,因为普通函数经常被当成一个“机器”,原料从入口进…

2021数学建模A题目–“FAST”主动反射面的形状调节

A 题——“FAST”主动反射面的形状调节 思路:该题主要是通过利用伸缩杆调整FAST反射面,给出合适的调整方案 程序获取 第一题问题思路与结果: 当待观测天体S位于基准球面正上方,结合考虑反射面板调节因素,确定理想抛物…

消息队列的对比及适配的应用场景

消息队列的对比及适配的应用场景## 特性 / 消息队列KafkaRabbitMQActiveMQRedis消息模型发布-订阅、流处理队列、发布-订阅队列、发布-订阅发布-订阅协议支持自定义TCP协议、REST代理AMQP、STOMP、MQTTAMQP、OpenWire、STOMP、MQTT自定义协议可用性非常高,分区和副…