开源大模型LLaMA 2会扮演类似Android的角色么?

news2024/11/18 3:23:44

图片

在AI大模型没有商业模式?等文章中,我多次表达过这样一个观点:不要把大模型的未来应用方式比喻成公有云,大模型最终会是云端操作系统的核心(新通用计算平台),而它的落地形式会很像过去的沃森,以系统型超级应用的形态落地。假如真的这样,那无疑的就需要一个开源的、便宜的“安卓”来真正启动这种落地。没想到的是这还没过去一个月,LLaMA 2出现了,并且表现优异。那LLaMA 2会在AI行业里扮演移动互联网中安卓的角色么?(其它如chatGPT 和AlphaGo下围棋,谁赢?垂域大模型有戏么?等一系列与此有关的大模型文章参见个人公号:琢磨事

安卓与历史性时刻

整个移动互联网有两个至关重要的历史性时刻:一个是iPhone的发布,这伴随着乔布斯而载入史册;一个则是同年Android的发布,相比之下这个则有点默默无闻。但实际上对于移动互联网而言,后者的实际影响大于前者。每年全球手机销量里面15%左右为苹果手机,其它基本是安卓手机。

换句话说,没有安卓就没有移动互联网。

那安卓这类操作系统到底是什么?为什么这么关键?我们来简单科普下操作系统的概念。

图片

(操作系统最简示意图)

这个图不十分精确,Kernel(内核)那个位置通常还有非常复杂的各种模块,但好在它能清楚说明操作系统是什么。安卓就处于中间的Kernel那个位置,对上面的各种应用比如微信、抖音来讲,他们其实根本接触不到麦克风、摄像头、内存、网络等,所有对具体物理设备的使用都要通过安卓这样的系统。

这样的分工好处是什么呢?

降低开发和应用成本。在IT行业的早期没有上面的分工,通常都是一个公司(比如IBM)把所有事都干了。这就导致对人员要求非常高。纯粹从技术复杂度角度看开发一般终端应用的难度如果是1,那很多操作系统里模块的开发难度估计是10,并且两者的难度不在一个维度上。同时操作系统只有1个,但应用会有无数个(安卓--应用商店)。所以就需要一种更为高效的分工方式,于是行业再分工,操作系统出现了。

高效的分工体系才能导致整个生态的大发展,对于移动互联网安卓就是生态大发展的最关键支点。如果微信团队需要自己做安卓,那很可能我们就看不见微信了。

如果说技术意义上的操作系统是上面那张简图,那商业意义上的操作系统则是一个引擎,为所有应用提供动力,缩减它们的开发成本、缩短周期。

大模型扮演的就是这个角色,但如果它只有一个(chatGPT),并且只是OpenAI自己用,那就像只有iOS一样,根本就造不出来五花八门的手机,也就不会有移动互联网的真正启动。

过去基于chatGPT根本没法打造沃森这样的系统,各种数据风险的考量根本不是一个技术进步就能对冲掉的,谁愿意把数据都上传到OpenAI呢,谁愿意依赖一个完全不知道的黑盒呢!

但在过去别的大模型又太差了,LLaMA 2在改变这种局面,从评测看它基本赶上GPT3.5,,也就是说在创造价值的维度它变的能用了,在落地的维度又因为开源而能对冲风险上的顾虑。再发展下去就真的会变成一个新智能生态的引擎,类似安卓的角色。

在前面系列文章里面也曾经多次提到我们普遍的看待大模型的方式是有问题的。如果就看到技术和能力,而看不到它的落地需要一套复杂系统做支撑,那就搞不清它的真正价值创造方式,就会争论是屁胡还是什么,但其实并不对。

人工智能应用会大爆发么?

如果评测结果无误,那现在就需要开始在不同的领域打造一个个类似沃森的系统。否则可能就晚了。

大模型很关键,提供了打造智能型应用的机会,但就像移动互联网上真正有价值的是微信而不是一个裸的安卓一样,大模型也需要在它上面长出自己的应用。用系统的思维模式很容易看到这类系统型超级应用的关键点。我们换一张图来对此进行说明。

图片

(Alexa基础架构,本质和安卓一样)

上图是亚马逊Alexa的基础架构图,为什么用它呢,因为Alexa是现在为止最像云端操作系统的一个产品。

实际上OpenAI的插件骨子里也是这模式。可以这么讲从大模型的角度看OpenAI的远胜,这种智能的进步大幅缩减应用(上图中的Alexa Skills Kit)的开发成本,但从系统完备性的角度看OpenAI还有很长一段路要走,比如对大规模设备的介入和管控等。

基于这种架构图很容易看出基于大模型的超级应用的关键点:

大模型:会处于中间的部分,负责提供通用智能的能力。也要与其它各类算法相配合,比如感知类算法、推荐类算法等。上图中针对交互做了一点分解,分成:语音识别(ASR)和自然语言理解,后者会完全被大模型取代,但不会改变架构。

AIoT基础设施:为了支撑大模型跑好并且和另外几部分连接起来,AIoT用的东西一个也缺不了,包括大规模设备管理通讯等。这些部分加起来才是过去系统的Kernel,也就是安卓所扮演的角色(上图中间的部分)。

用户侧(上图右侧):要提供充分感知,这种感知要有时间维度和空间维度,要有现场和历史数据。我们和智能音箱进行交互的时候,先要喊一嗓子,比如小爱同学等,它要听不到不管后面大模型多厉害也是不行。然后交互的时候肯定需要这个人的建模数据(历史)以及位置等,然后才能做好内容输出。不同场景下这部分会有比较大差别,比如沃森的场景可能就需要个人的24小时心电图、病史以及基因数据。这些部分非常关键,需要综合应用IoT和各种算法才能达成目标。大模型在这个环节扮演的角色没那么关键。

应用侧(上图左侧):智能音箱的场景就需要对接各种数据源(chatGPT的插件就干这事的),总不能天气也靠大模型来生成吧。对于沃森类系统这里就需要行业数据和法规等。

相比于过去应用侧在变薄,但问题是三个部分整个加一起才是智能云系统下的应用,非要类比的话这种新应用的创建有点像需要打造一个个属于特殊领域的手机。

有无数个领域需要这种系统型超级应用,医疗、教育、税务、企业、零售、军事、家居等,很久以前DeepMind甚至还尝试过给Google数据中心做个这样的应用来管空调。

人工智能应用确实会大爆发,在过去大模型是起点和障碍,而不是应用本身。LLaMA 2提供了跨越低成本跨越这种障碍的可能性。

普遍盈利(break-even)会来么?

在此前的系列文章中我多次总结:从商业角度看,人工智能过去10年的创业其实集体性失败了,因为没跑通任何一个像样的商业模式。而真自己做大模型的企业短期亏损会加剧,因为投入增加并且经常会被归零,而议价权并不会增加。

那现在看这会有什么变化么?

有点变化,但不是对做大模型的公司,而是对应用大模型的公司。

可以更低成本创造一种效力巨大的系统型超级应用,甚至可以简单用等于多少人来衡量其效果和商业价值。如果LLaMA 2继续再进展下去,那相当于这个超级应用总是可以用便宜却更强劲的引擎。

这时候整体成本可控了,周边的部分也需要投入,但不会像大模型研发那样导致投入产出高度失衡。

这时候效果明显了,过去的AI算法其实解决了一些不痛不痒的问题,不创造商业上的核心价值,做闸机和智能音箱能创造什么核心价值?但现在不一样,大模型在技术上的进展保证了,在用和不用上会导致大刀对坦克的差异。比如对企业而言谁能想象电脑、互联网全部都不用的企业?

更关键在于数据飞轮的Key看着是在做出系统型超级应用的企业手里,这导致上限会比较高。

琢磨事上马斯克首先是个商人,从xAI发布说起里我画了一张这样的图:

图片

(数据飞轮的三个阶段)

每一个大模型每个领域中最终追求的一定是把这个数据飞轮跑起来,但很遗憾的是到目前为止好像除了AlphaGo别的就没跑起来过。

可这不意味着未来也这样,谁在未来能把它先跑起来,谁就是那个领域的冠军,也就赢了。

现在产业链条上谁最可能把这个飞轮跑起来?

显然是成功落地系统型超级应用的人,他们才是拥有场景和用户的人。

若干年后,回看我们可能会认为LLaMA 2是一个类似2007年安卓发布的时刻。

小结

我个人前十年主要做系统,中间做了阵战略投资,后十年主要就做人工智能的产研,可能是这种背景的原因导致我越看大模型商业化的路径越觉得是系统型超级应用。希望对此感兴趣的同学和我联系,共同探讨如何在新技术要素下确立新的商业模式。确实,像DeepMind那哥们说的:不要扯图灵测试了,现在核心是看看能不能终结人工智能行业的十年亏损,这更关键些!

其它大模型相关文章,涉及团队组织等其它方面,标题有点热闹,内容不是:

chatGPT 和AlphaGo下围棋,谁赢?垂域大模型有戏么?

AI大模型没有商业模式?

从教育到就业,AI大模型到真产生影响还有多远

是时候摒弃黑暗森林式思维了,从瓦格纳反叛开始说

马斯克首先是个商人,从xAI发布说起

碳基中心 VS 硅基中心:把Vision Pro和便利蜂放一起比比

AI带来了巨大的机遇,未能善用AI的企业将面临衰退

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/789082.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

消息队列(一)-- RabbitMQ入门(3)

延迟队列 延迟队列是用来存放需要在指定时间被处理的元素的队列。队列内部是有序的&#xff0c;最重要的特性就体现在它的延时属性上。 使用场景&#xff1a;订单在十分钟之内未支付则自动取消。 整合SpringBoot 新建一个SpringBoot的Module 添加依赖 <!--RabbitMQ依赖-…

Kafka集群——(区别于Master/Slave架构的的分布式集群)

Kafka角色介绍&#xff1a; 1. Producer:消息生产者&#xff1a; 2. Broker: kafka实例&#xff0c;可以理解为一台kafka服务器&#xff0c;kafka cluster 是由多个broker构成的集群。 3. Topic: 消息主题&#xff0c;理解为消息队列&#xff0c;kafka数据就保存在topic里。…

vue+Element-ui实现树形组件、表格树

需求 要做出如下图所示的 树形表格&#xff0c;也就是数据之间有父子类关系的这种&#xff0c;可以点击展开、收缩 像上图这样的表格树 实现 1.使用树形组件 在学习树形表格之前&#xff0c;肯定得先搞懂普通的树形组件是怎么搞的&#xff0c;然后将其套到表格中就好了&…

基于JavaSE的手机库存管理系统

1、项目背景 基于JavaSE完成如下需求&#xff1a; 功能需求&#xff1a; 1、查询库存量 2、可以修改库存中不同品牌手机的个数 3、退出系统 实现步骤&#xff1a; 1、把List当做库房 2、把手机存放在库房中 3、使用封装的方法区操作仓库中的手机 2、项目知识点 面向对象 集合…

存储过程——case函数、while函数、repeat函数的应用、loop函数

1.case循环 存储过程中&#xff0c;几种循环格式的语法讲解。 create procedure p6(in month int) begindeclare result varchar(10);casewhen month > 1 and month < 3 thenset result : 第一季度;when month > 4 and month < 6 thenset result : 第二季度;whe…

spring cloud sentinel

初始时 并不能将sentinel实例显示出来的 需要修改加配置clent-ip spring:cloud:sentinel:transport:#本机ipclient-ip: 192.168.10.108#dashboard服务端的grp端口 监听心跳的port: 8719#dashboard服务端地址dashboard: 192.168.12.14:8080

数据结构【栈和队列】

第三章 栈与队列 一、栈 1.定义&#xff1a;只允许一端进行插入和删除的线性表&#xff0c;结构与手枪的弹夹差不多&#xff0c;可以作为实现递归函数&#xff08;调用和返回都是后进先出&#xff09;调用的一种数据结构&#xff1b; 栈顶&#xff1a;允许插入删除的那端&…

了解Unity编辑器之组件篇Physics(四)

Physics&#xff1a;用于处理物理仿真和碰撞检测。它提供了一组功能强大的工具和算法&#xff0c;用于模拟真实世界中的物理行为&#xff0c;使游戏或应用程序更加真实和可信。 主要用途包括&#xff1a; 碰撞检测&#xff1a;Unity Physics 提供了高效的碰撞检测算法&#x…

【Unity实战篇 】| 游戏中实现镂空遮罩效果【矩形、圆形镂空遮罩】

前言【Unity实战篇 】 | 游戏中实现镂空遮罩效果【矩形、圆形镂空遮罩】一、制作原理二、矩形中间镂空遮罩效果2.1 实现镂空显示2.2 镂空区域内事件穿透三、圆形中间镂空遮罩效果总结前言 本文来写一下怎样在Unity中完成一个 镂空遮罩 的效果。镂空遮罩 比较常用的有两种:矩形…

力扣题库刷题笔记73--矩阵置零

1、题目如下&#xff1a; 2、个人Python代码实现 3、个人Python代码思路 a、声明2个空数组p、q&#xff0c;用于存放值为0的元素matrix[i][j]的下标 b、首先遍历二维数组matrix&#xff0c;找到值为0的元素matrix[i][j]&#xff0c;将下标i加入数组p&#xff0c;将下标j加入数…

【【51单片机直流电机调速】】

学会电机调速&#xff0c;掌握中国速度 PWM的生成方法 先用户设定一个比较值&#xff0c;然后计数器定时自增。 当计数器<比较值&#xff0c;输出0 当计数器>比较值&#xff0c;输出1 main.c #include <REGX52.H> #include"delay.h" #include"…

vue 学习笔记 【ElementPlus】el-menu 折叠后图标不见了

项目当前版本 {"dependencies": {"element-plus/icons-vue": "^2.1.0","types/js-cookie": "^3.0.3","types/nprogress": "^0.2.0","axios": "^1.4.0","core-js": &quo…

PHP 药店管理系统mysql数据库web结构apache计算机软件工程网页wamp

一、源码特点 PHP 药品管理系统 是一套完善的web设计系统,系统采用smarty框架进行开发设计&#xff0c;对理解php编程开发语言有帮助&#xff0c;系统具有完整的源代码和数据库&#xff0c;系统主要采用B/S模式开发。 PHP 药店管理系统mysql数据库web结构apache计 下载地址…

TSN -促进IT/OT 融合的网络技术

时间敏感网络&#xff08;tsn&#xff09;技术是IT/OT 融合的一项关键的基础网络技术&#xff0c;它实现了在一个异构网络中&#xff0c;实现OT的实时数据和IT系统的交互数据的带宽共享。 TSN允许将经典的高确定性现场总线系统和IT应用&#xff08;如大数据传输&#xff09;的功…

第1章 获取数据库中的数据

CoreShop源程序是以数据库优先进行定义的&#xff0c;所以其本身不包含代码优先的定义&#xff0c;但本从更习惯于代码优先&#xff0c;所以为其定义了代码优先的定义。 1 CoreCms.Net.Model.Entities.SysRole using SqlSugar; using System.ComponentModel.DataAnnotations…

力扣 56. 合并区间

题目来源&#xff1a;https://leetcode.cn/problems/merge-intervals/description/ C题解&#xff1a;根据左区间排序&#xff0c;更新每一段的右区间最大值&#xff0c;直到间断。 class Solution { public:static bool cmp(vector<int> & a, vector<int> &a…

小学期笔记——天天酷跑5

效果&#xff1a; -------------------------- 效果&#xff1a; ------------------ 让人物跑起来 效果&#xff1a;&#xff08;此时的人物是运动的&#xff09; ---------------------- 通过键盘控制角色 效果&#xff1a; 人物可以上左右动&#xff0c;自由落体

K8S初级入门系列之二-集群搭建

一、前言 为了更好学习K8S&#xff0c;建议自行搭建一套K8S的环境&#xff0c;目前比较流行的有两种搭建工具&#xff0c;一种是单机版的minkube&#xff0c;一种是集群版的kubeadm。minkube更多是用于实验环境&#xff0c;且单机版隐藏了很多细节&#xff0c;而kubeadm更贴近实…

Vue 3.3 + Vite 4.3 + TypeScript 5+ Element-Plus:从零到一构建企业级后台管理系统(前后端开源)

vue3-element-admin 是基于 vue-element-admin 升级的 Vue3 Element Plus 版本的后台管理前端解决方案&#xff0c;技术栈为 Vue3 Vite4 TypeScript Element Plus Pinia Vue Router 等当前主流框架。 相较于其他管理前端框架&#xff0c;vue3-element-admin 的优势在于一…

红队打靶:Nullbyte打靶思路详解(vulnhub)

目录 写在开头 第一步&#xff1a;主机发现与端口扫描 第二步&#xff1a;Web渗透 第三步&#xff1a;hydra密码爆破 第四步&#xff1a;SQL注入大赏 方法一&#xff1a;手工SQL注入之联合查询 方法二&#xff1a;SQL注入写入一句话木马 方法三&#xff1a;SQL注入写入…