大模型带来的Web复兴,会是昙花一现吗?

news2024/12/25 0:04:45

b1444cf45bf9f8f09d12e56847217684.jpeg

大家是不是对GPT、对话式AI、生成式AI之类的话题,已经有点审美疲劳了?

写这篇文章之前,我有点犹豫,究竟还要不要接着讨论GPT了。最终决定写,是觉得个人用户、开发者,以及正在紧锣密鼓训大模型的AI公司和云厂商,还是有必要提前琢磨一下这个事情——大模型能力要从云入端,究竟什么时候做、怎么做?

AIGC热潮带来Web复兴

但大众更爱移动端

89332498ee9ad467a234bb81ff9797d2.png

我们看到,大多数基于大模型的AIGC应用,都选择了Web端接入。

微软第一时间推出了带有对话(Chat)功能的必应(Bing),更新了Edge浏览器,嵌入到Microsoft 365 应用中。国内,高校机构推出的MOSS(复旦大学)、SegGPT(智源),企业推出的文心一言(yiyan.baidu.com)、通义千问(tongyi.aliyun.com),都要从官网入口访问。

图像和视频类的生成式AI,比如Midjourney、Stable Diffusion、DALLE2,以及视频平台Make-A-Video(Meta)、Imagen Video(谷歌)等,也是如此。

有业内人士认为,生成式AI带来了Web的复兴。

当然,市面上也有通过小程序、App等访问的AIGC产品,大多通过调用基础模型的API来提供服务。

但受限于网络传输、算力等,领先的技术能力都不得不打折扣,比如只能生成很短的一句话文本,手机app的作图效果一般,加载速度很慢经常排队掉线卡顿……

这是因为大模型的大量计算,还是要通过云服务来完成,Web页面的承载能力比较大,加载速度快,还不用考虑流量损耗。

所以,想体验大模型强大的能力,目前还是以PC Web端+云服务更佳。

但是,大模型的商业化潜力,还是在移动端。

190721155a9e3d884188ec0b4c9b9307.jpeg

大家可能都记得,去年底AI作图就火爆过,意间 AI 绘画、YUAN 初等多款具有 AI 作图功能的移动端小程序,用户量和付费激增。意间 AI 绘画的官方数据显示,上线不到两个月,用户量增长了 117 万人。

大部分人也都更希望,便捷、低门槛地体验AIGC。要使用GPT-4、New bing、DALLE等应用,注册、登录、付费的一系列操作,都非常麻烦,劝退了不少人。

国内的大模型应用,移动端也明显很受期待。比如就有人抓住了“官方没有app”这个“时间差”,造出了“文心一言”盗版 App,吓得百度赶紧出来声明:凡是在App Store和各种应用商店看到的“文心一言”App都是假的,凡是“文心一言”收费下载、付费会员都是骗子!

显而易见,场景化、轻量化的移动端应用,用户又喜欢,又能付费赚到钱,如果官方不搞,投机客/骗子都要来搞。

无论是从用户体验的角度,还是大模型服务普及化的需要,以及回收训练成本的商业化考量,移动端应用都是一块不能轻言放弃的阵地。

既然如此,为什么各大基础模型服务商,就是不早点抓住这个机会呢?我们什么时候才能用上和Web版一样强大的移动AI应用呢?

fd06288bef7c1db43f60d736ef7a5a64.png

千呼万唤不出来

基础模型服务商在想啥?

基础大模型的服务商,比如OpenAI、谷歌、百度、阿里以及各类研究院所,就是不去吃移动端应用这块蛋糕。

除了大家都知道的移动端侧计算能力限制之外,还有其他考量:

1.产品。基础模型往往技术和能力比较超前,产品化不是最优先考虑的,尤其移动端应用要适配各种系统、机型、配置,更不可能投入太大的人力、物力。

OpenAI 的联合创始人 Sam Altman就说过,ChatGPT 是一个糟糕的产品,只是这个产品蕴含着很大价值,所以人们愿意忍受。觉得Web不好用?那你先忍忍吧。

2.用户。别看全民热议生成式AI,但真正坚持使用并愿意付费的,还是一小撮早期客户,包括技术狂热者和专业人士,比如程序员、插画师。

他们大多会将生成式AI当作生产力工具,用于研究、编程、办公、设计、游戏制作、软件开发等,还要跟其他专业软件相结合来使用,比如生成图片之后再通过Photoshop增强,还是要用到PC、一体机等设备,PC Web端比移动App有更强的可编辑性,更能满足这部分群体的需求。

3.商业化。目前基础大模型的商业模式,以API为主,需要一定的开发经验,更适合极客和开发者,深度开发集成部署等工作,很少会通过移动端来完成,所以模型服务商自然也就没有紧锣密鼓去适配移动端的动力。

285c809449fcc551f4213b4a8724351b.png

大模型千帆竞渡

移动端是商业化必争之地

3914c731d6c349cf9ecc1872a0788c5c.png

既然如此,为什么还要做移动端呢?一个很表层的答案是:大众需要。

能够真正引发全民体验热潮的,还是那些能够通过社交软件分享、小程序、App等形式,低成本快速触达的能力,不需要什么“智能涌现”,更在乎有趣、好玩。

往深了说,大模型技术被视为“新工业革命”的引擎,要发挥效应,必须将技术能力更好地集成到产品和服务中去。此时,移动端能够提供至少三重价值:

第一,规模落地。

中国互联网络信息中心发布第51次《中国互联网络发展状况统计报告》中,我国10.67亿网民,使用手机上网的比例为99.8%,移动端用户已经远远超过了PC端的用户,要提升生成式AI的应用范围,移动端应用必不可少。

第二,商业潜力。

高科技行业的主流市场,是由“实用主义者”组成的,相比技术的前沿性、炫酷感,他们更看重技术解决方案的可靠、稳定、性价比、配套服务等。移动端的广泛普及度、即时访问、便捷低成本的优势,可以让AI以更短的路径触达用户,在移动端应用AI技术是大势所趋。

开发者眼中的AIGC应用是这样的:

7e3f55bccc980c7ea55d192d5f9440f9.png

(OpenAI发布会演示的编程能力)

大众眼中的AIGC应用是这样的:

e50dedcbc34bc97ce0801486550def7a.png

(某GPT类应用平台截图)

第三,市场壁垒。

大模型的商业化路径之一,是走向产业,走向ToB,将大模型能力封装为AI解决方案,参与到千行百业的数字化、智能化进程中。

如今头部科技公司、云厂商都在炼大模型,很多直接对标GPT-3.5,没有显著的差异化价值,很难与业界领先水平拉开差距。

云厂商要打开ToB市场,移动端应用工具与能力是非常有吸引力的。近年来,不仅消费类、服务型企业,在不断加强移动端侧的布局和产品能力,一些传统的企业和机构,比如工业制造、政务银行等,无论是在内部生产管理中移动化,也推出了更多移动应用来更好地服务终端用户。如果直接在云上端到端用好大模型,比如训练开发环节直接调用云端的大模型和AI算力资源,完成后,一键分发到智能手机等终端上,可以大大减少工作量。

0326092c967936cfd096660279390012.png

(某GPT 类应用开发平台)

互联网的演进之路,已经说明,无论To B还是To C行业,都在追求越来越集约精简的终端硬件、越来越低门槛的交互入口、越来越轻盈的软件应用。

所以说,大模型从云入端,是模型服务商实现商业化的必争之地。

4ead0498e73b418da908e05ca7c169e8.png

从云入端,一条天路

高瞻远瞩如OpenAI和DeepMind,照样有商业化的要求。赚钱嘛,不寒掺。可是,大模型由云入端,这个钱还真没那么好赚。非不为也,实不能也。

云计算、AI能力要进入移动终端设备,所面对的是一条天路:

首先,一些大型的生成式AI应用,运行环境在云上,要经过网络传输,而移动端的设备能力、网络环境,是很多样且不稳定的,比如从5G蜂窝网络转移到室内宽带,或者在高架桥、地铁等特殊环境,都有可能让生成过程中断或失败,影响到端侧体验。

其次,生成式AI应用的计算量比较大,在端侧加载渲染运行时,比如智能手机CPU会有比较高的负载,出现卡顿、发热、电量损耗等情况,如果让AI改一篇文档画一张图就咔咔掉电,当然不能接受。

e2689fb2bdb0505d488a6e8fe7eb4b16.png

此外,把AI深度集成到业务中,必须通过云计算,而云端开发环境和端侧是不同的操作系统。这意味着,开发者要进行二次开发或迭代开发,完成之后才能进行不同终端下的触达,同事要考虑不同终端的兼容性,这就提升了AI云应用的风险成本、人力成本、时间成本。要保证集成之后的应用效果,需要云平台有一整套完整的产品服务和工具来支撑快速搭建、验证、部署分发。

另外,云侧和端侧的架构不同,也导致算力割裂,云端一体的AI应用开发要充分结合端侧算力和云上算力,一部分应用场景搭建在端,一部分搭建在云,这就给云厂商带来了比较大的技术难题:如何提供稳定一致的底层环境?

天路难行亦需行。大家都知道,云计算靠基础设施IaaS层是很难赚到钱的,云厂商炼大模型,本质上是希望提升软件的先进性,进而调动SaaS服务的商业价值。

要让个人用户和企业,都得到简单、易用、低门槛的大模型能力,云厂商不仅要训练基础模型,还需要在产业链上游,就解决AI应用从云到端的一系列技术难题,为开发者和产业用户提供移动AI开发能力,才能让大模型在端侧爆发。

各种形态的大模型应用百花齐放,这个新技术才能真正迎来商业化的奇点。

a5093791b3dde7b1901ec9d1930689e0.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/446773.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Go | 一分钟掌握Go | 1 - 安装Go

作者:Mars酱 声明:本文章由Mars酱原创,部分内容来源于网络,如有疑问请联系本人。 转载:欢迎转载,转载前先请联系我! 为什么学Go 为什么要学Go?网上太多广告和说辞了,什…

“SCSA-T学习导图+”首发:路由技术之OSPF入门

本期引言: 路由技术是网络环境中,为不同的节点传输数据提供传输路径的技术,企业网络的拓扑一般会比较复杂,不同的部门或者总部和分支可能处于不同的网段中,此时就需要使用路由协议来连接不同的网段,实现数…

django channels(websocket)的使用,实现网页间实时聊天

目录 一、创建项目mysite和应用chat 1. 创建项目mysite 2. 创建应用chat并添加应用到settings.py的INSTALLED_APPS中 3. 添加模板文件 4. 添加视图及路由 5.配置根路由指定chat应用的路由 6. 集成channels 二、实现聊天服务器 1. 创建一个新文件chat/templates/chat/r…

响应式开发HTNL5CSS3视频播放器

目录 前言 一、本视频播放器需要实现的功能 ​二、代码分布结构 三、部分主要代码 1.index01.html 2.video1.css 3.video1.js 四、images图片资源及视频 五、运行效果 前言 1.本文讲解的响应式开发技术(HTML5CSS3Bootstrap)的HTML5视频播放器等…

TS-黑马(二)

目录: (1)ts-类型-字面量与nullish类型 (2)ts-类型-泛型 (3)ts-意义 (4)ts-class语法 (1)ts-类型-字面量与nullish类型 我们子啊传递参数的时…

以 100GB SSB 性能测试为例,通过 ByteHouse 云数仓开启你的数据分析之路

动手点关注 干货不迷路 I. 传统数仓的演进:云数仓 近年来,随着数据“爆炸式”的增长,越来越多的数据被产生、收集和存储。而挖掘海量数据中的真实价值,从其中提取商机并洞见未来,则成了现代企业和组织不可忽视的命题。…

总的所有的全部的完全的整个的整体的: all entire full gross whole total

all entire full gross whole total 所有的,完全的,完整的全部的,整个的,整体的,总的 all entire full gross whole total all entire full gross whole total一些词典的解释allentirefullgrosswholetotal 区别辨析entire、whole、complete、full、total、gross与alltotal&…

【JavaWeb】HTMLCSS

一:B/S 软件的结构 二:前端的开发流程 3、网页的组成部分 页面由三部分内容组成! 分别是内容(结构)、表现、行为。 内容(结构),是我们在页面中可以看到的数据。我们称之为内容。一般内容 我们…

【Linux】共享内存(shm)代码实现

文章目录 共享内存介绍最快的IPC形式共享内存示意图共享内存数据结构共享内存函数shmget函数shmfig shmat函数说明: shmdt函数shmctl函数 共享内存的原理小结 共享内存的特点生命周期共享内存的大小共享内存为什么快共享内存没有任何的保护机制即同步互斥扩展内容 代…

《软件开发本质论》读书笔记

目录 第一部分——价值的循环开发取向频繁交付小的,价值大,代价小的特性 测试同时要有业务测试和开发测试开发测试应在代码开发的同时完成甚至先于代码完成 重构第一部分总结 第二部分——说明与论述团队目的自主专精 五卡法预测软件计划控制好自己所参与…

二叉树一定是完全二叉树

一、树的概念及其结构 树是一种非线性的数据结构,它是由n(n>0)个有限结点组成一个具有层次关系的集合。把它叫做树是因为它看起来像一棵倒挂的树,也就是说它是根朝上,而叶朝下的。 1、树的特点 ①有一个特殊的结点&…

ARM Coresight 及 DS-5 介绍 5 - ARM Cortex-M DS-5 加载 ELF 文件运行

文章目录 1.1.1 DS-5 工程创建1.1.2 DS-5 加载 ELF 脚本创建1.1.3 DS-5 脚本读写 Memory1.1.4 DS-5 扫描脚本 1.1.1 DS-5 工程创建 在使用ARM DS-5 连接 board(或者PFGA)之前首先需要能够扫描到相应的硬件信息,比如对应的cpu的相关信息:coresight 相关组…

【Zblog搭建博客网站】windows环境搭建属于自己的博客并发布上线 - cpolar内网穿透

文章目录 1. 前言2. Z-blog网站搭建2.1 XAMPP环境设置2.2 Z-blog安装2.3 Z-blog网页测试2.4 Cpolar安装和注册 3. 本地网页发布3.1. Cpolar云端设置3.2 Cpolar本地设置 4. 公网访问测试5. 结语 转载自远程内网穿透的文章:【Zblog建站】搭建属于自己的博客网站&#…

【C++】初始化列表,explicit 关键字,静态成员

初始化列表 构造函数内可以对于成员的赋值,故不能称为是初始化,初始化只能初始化依次,C中类对象的初始化可由初始化列表完成 内置类型成员可以通过设置缺省值实现初始化,但对于const修饰的成员、引用成员、没有默认构造函数的自…

hive解析json

目录 一、背景 二、hive 解析 json 数据函数 1、get_json_object 2、json_tuple 3、使用嵌套子查询(exploderegexp_replacesplitjson_tuple)解析json数组 4、使用 lateral view 解析json数组 一、背景 我们进行ETL(Extract-Transfer-Load) 过程中,经常会遇到从不同数据…

编码拓展:链接库

一.认识链接库 1.1库 计算机中,有些文件专门用于存储可以重复使用的代码块,例如功能实用的函数或者类,我们通常将它们称为库文件,简称“库”(Library)。 以 C 语言为例,如下为大家展示的就是…

JUC高级十-并发加锁原理之AbstractQueuedSynchronizer(AQS)

1. 前置知识 公平锁和非公平锁可重入锁自旋锁LockSupport数据结构之双向链表设计模式之模板设计模式 AQS重要性 JAVA ------>JVM AQS ------>AQS 2. AQS入门级别理论知识 2.1 是什么? 2.1.1 字面意思 Abstract Queued Synchronizer----抽象的队列同步器 源码位置: …

【Microsoft Edge】如何彻底卸载 Edge

文章目录 一、问题描述二、卸载 Edge2.1 卸载正式版 Edge2.2 卸载非正式版 Edge2.2.1 卸载通用的 WebView22.2.2 卸载 Canary 版 Edge2.2.3 卸载其他版本2.3 卸载 Edge Update 2.4 卸载 Edge 的 Appx 额外安装残留2.5 删除日志文件2.6 我就是想全把 Edge 都删了 一、问题描述 …

预测模型的局部评价?

预测模型的局部评价 为什么要进行局部评价? 首先是临床决策曲线分析通常会给预测模型的使用规定一个阈值范围,相应地预测模型的评价也应该局限在这个范围之内才是合理的; 其次,全局性地评价往往不够敏感,即好的模型和坏…

本地搭建属于自己的ChatGPT:基于Python+ChatGLM-6b+Streamlit+QDrant+DuckDuckGo

本地部署chatglm及缓解时效性问题的思路: 模型使用chatglm-6b 4bit,推理使用hugging face,前端应用使用streamlit或者gradio。 微调对显存要求较高,还没试验。可以结合LoRA进行微调。 缓解时效性问题:通过本地数据库…