【研究】AI大模型需要什么样的硬件?

news2025/4/13 8:17:59

关注AI大模型 x 硬件的两条思路

从22年11月OpenAI推出ChatGPT至今,我们看到Chatbot应用的能力不断增强,从最初的文字问答,迅速向具有自主记忆、推理、规划和执行的全自动能力的AI Agent发展。我们认为端侧智能是大模型发展的重要分支。建议投资人沿着:1)大模型如何赋能终端,2)终端如何解决大模型普及难点两条思路,寻找硬件的落地机会。我们看好1)Apple Intelligence推动苹果用户换机,2)交互能力提升推动轻量级AR开始普及,3)隐私保护需求推动办公用 PC AI化等三大机会。

具备记忆、推理、规划、执行能力的AI Agent可能是大模型的最终形态

大模型的应用能力最初功能仅限于文字问答,此后逐渐引入图像理解、文生图功能,并通过GPT Store拓展功能,形成了AI Agent雏形,近期GPT-4o则实现了具备情感的互动。用户数方面,根据Similarweb,24年5月ChatGPT的PC+移动端独立访客数达到3亿,在全球所有网站中排名第22。我们认为大模型的演进方向是智能化和自动化程度逐渐提升,最终形态是AI Agent,具有自主记忆、推理、规划和执行的全自动能力。

观点#1:Apple Intelligence推动苹果用户换机,利好产业链业绩增长

6/11, 苹果WWDC 2024大会推出由苹果自研的端侧大模型、云端大模型、以及OpenAI的ChatGPT组成的全新智能系统Apple Intelligence。从功能上来讲,和OpenAI,Google的现有功能差异不大,但由于此类功能只在iPhone 15 pro/max及以后系列搭载,有望推动苹果用户换机。根据IDC数字,苹果2023年销量2.34亿台,华泰预测苹果2024年销量下降8.2%到2.15亿台。根据BankMyCell数字,2024年苹果手机活跃用户14.6亿人,对应目前换机周期6.23年,如果Apple Intelligence能够缩短换机周期3个月,可以带动约1000万台新机销售。

观点#2:交互能力提升推动轻量AR普及

AR/VR一直被认为有望替代手机成为下一代移动终端。但由于缺少触摸屏,人机交互困难一直是困扰AR/VR发展的一大难点。从最近谷歌推出的Project Astra以及Meta的雷朋眼镜中我们看到,大模型所具备的图像理解、语音交互,以及根据语音交互结果进行的执行能力有望大幅度提高AR眼镜的交互能力。目前具身智能的发展仍然处于非常早期阶段,但是大模型所具备的以上能力,也有望大幅度提高机器人对环境的理解能力,以及根据理解结果控制关节等的执行能力。

观点#3:隐私保护需求推动办公用 PC AI化

23年3月,微软推出面向Office的Microsoft 365 Copilot以来,以办公助手为切入点,重塑包括Word、Excel、 Powerpoint等通用办公软件,以及Dynamics套件等专业软件在内的生产力工具矩阵,向数据协同、功能联动的方向发展。如何保护自身私域数据的安全是企业导入微软Copilot的主要痛点之一。24年5月,微软推出Copilot+PC,通过在终端侧部署轻量级的大模型,在保护隐私的前提下,能够实现会议纪要、文档总结、PPT智能创作、文生图等企业的基本办公需求,是大模型时代生产力工具的主要支点。我们认为2025年AI PC渗透率有望大幅提升。

大模型能力提升不断解锁新的应用场景

过去一年,大模型能力的发展速度超出我们预期。

以衡量LLM的常用的多语言理解均值评测标准(MMLU)为例,2021年底全球最先进大模型的MMLU 5-shot得分刚达到60%,2022年底超过70%,而2023年底已提升至超过85%。在语言能力之外,AI大模型的多模态能力也快速提升。2023年初,主流闭源大模型通常为纯文本的LLM。2023年至今,闭源模型的多模态能力具有大幅度提升,目前主流闭源大模型通常具备图像理解、图像生成能力。部分最前沿的闭源大模型,例如GPT-4o、谷歌Gemini,支持的模态更加多元,能够理解文本、图像、音频、视频(帧),并生成文本、图像、音频。2022年9月,红杉资本预计还需要近十年的时间,大模型才能实现实习生级别的代码生成、好莱坞质量的视频和区别于机械声的人类质量语音,但是实际进展远超当时预期,Sora已经能够生成60s的高质量视频,GPT-4o和谷歌Gemini都已经能够实现具备感情的实时人机语音交互。

我们看到,随着大模型能力的不断增强,AI的作用不断深化,生成式AI新的应用不断被解锁。

通过对AI在搜索、电商零售、办公、金融法律、影视游戏,医药、教育、汽车等行业应用前景的分析,我们认为,AI应用的落地节奏或与行业数字化程度成正比,我们看到AI大模型在互联网(搜索+广告营销)、办公、金融等领域率先迎来“iPhone时刻”。其中最值得关注的应用包括:1)文本生成在电商、金融、医疗等行业替代传统客服;2)文本和图像生成在办公、广告营销、金融、影视游戏等领域成为下一代生产力工具;3)蛋白质生成能力拓宽人类探讨世界的范围,特别是在新药开发上的应用前景。

硬件是大模型的重要载体,什么是AI大模型时代的最佳硬件形态是投资人最关心的话题之一。我们认为随着大模型能力的不断提升,新的硬件形态会被不断解锁。建议投资人沿着:1)大模型如何赋能终端,2)终端如何解决大模型普及难点两条思路,寻找硬件的落地机会。

大模型如何赋能终端:交互能力提升(轻量级AR),代码执行(具身智能)。

AR/VR一直被认为有望替代手机成为下一代移动终端。但由于缺少触摸屏,人机交互困难一直是困扰AR/VR发展的一大难点。从最近OpenAI推出的GPT-4o、谷歌推出的Project Astra以及Meta的雷朋眼镜中我们看到,大模型所具备的图像理解、语音交互,以及根据语音交互结果进行的执行能力有望大幅度提高AR/VR产品的交互能力。另外,虽然目前具身智能的发展仍然处于非常早期阶段,但是大模型所具备的以上能力,也有望提高机器人对环境的理解能力,以及根据理解结果控制关节等的执行能力。

终端如何解决大模型痛点:隐私保护(AI PC)。

23年3月,微软推出面向Office的Microsoft 365 Copilot以来,以办公助手为切入点,重塑包括Word、Excel、Powerpoint等通用办公软件,以及Dynamics套件等专业软件在内的生产力工具矩阵,向数据协同、功能联动的方向发展。如何保护自身私域数据的安全是企业导入微软Copilot的主要痛点之一。24年5月,微软推出Copilot+PC,通过在终端侧部署轻量级的大模型,在保护隐私的前提下,能够实现会议纪要、文档总结、PPT智能创作、文生图等企业的基本办公需求,是大模型时代生产力工具的主要支点。我们认为2025年AI PC渗透率有望大幅提升。

终端如何解决大模型痛点:高频使用(AI手机)。

手机是人们日常生活最高的交互终端,具有普及率高、使用频率高,考虑终端算力、存力以及客户应用需求等因素,手机已经成为AI大模型在C端落地的重要设备。去年底至今,随着三星Galaxy S24、Google Pixel 8等重要产品上市,以及苹果WWDC推出Apple Intelligence,手机AI的功能逐渐清晰。目前语音助手、修图、写作助手等功能成为主流。苹果通过Siri,将AI当作手机不同App之间联系的工具,而不是像此前三星和谷歌的AI应用更侧重于让AI去完成单一特定任务。未来AI软件由谁付费或发展成手机品牌商、芯片厂商、软件厂商、消费者的四方博弈,但随着token成本的下降和苹果较大的优质用户基数,模型API成本或持续下降,并推动应用加速普及,AI手机渗透率有望持续提升,形成正向循环。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1863199.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

昇思25天学习打卡营第二天|张量

张量 Tensor 张量(Tensor)是一个可用来表示在一些矢量、标量和其他张量之间的线性关系的多线性函数,这些线性关系的基本例子有内积、外积、线性映射以及笛卡儿积。其坐标在 𝑛𝑛 维空间内,有  &#x1…

北尔Beijer软件iXDeveloper2触摸屏和使用说明手侧

北尔Beijer软件iXDeveloper2触摸屏和使用说明手侧

Python笔记 文件的写,追加,备份操作

一、文件的写操作 案例演示: # 1.打开文件 f open(python.txt,w)# 2.文件写入 f.write(hello world)# 3.内容刷新 f.flush() 注意: 直接调用write,内容并为真正的写入文件,二十会积攒在程序的内存中,称之为缓冲区…

SpringBoot控制反转和依赖注入

目录 一、内聚和耦合 二、分层解耦 三、具体实现 四、bean的组件扫描 五、bean注入 一、内聚和耦合 在了解分层解耦的概念之前我们我们要去先了解一下内聚和耦合。内聚:通常将的是软件中各个模块之间的功能联系。耦合衡量软件各个模块之间的依赖、关联的程度。一…

Lua网站开发之文件表单上传

这个代码示例演示如何上传文件或图片,获取上传信息及保存文件到本地。 local fw require("fastweb") local request require("fastweb.request") local response require("fastweb.response") local cjson require("cjson&q…

30-33、SpringBoot项目部署\属性配置方式\多环境开发(一个文件)\多环境分组(多个文件)

1、打包插件:和springboot的版本保持一致 根pom <build><plugins><!--打包插件--><plugin><groupId>org.springframework.boot</groupId><artifactId>spring-boot-maven-plugin</artifactId><version>3.1.3</versi…

期末复习题中的问题

一、编程中&#xff08;包括函数&#xff09;的问题 1. malloc 头文件是stdlib.h 二、第二次写复习题的不会的 三、程序填空 总结&#xff1a; 删除节点m >>>>要有一个指针来遍历找到这个m >>>> 用另一个指针指向这个指针的下一 个 >>&…

【机器参数】安装适合的nvidia驱动

背景&#xff1a;我现在nvidia-smi没有显示&#xff0c;我的目标是让nvidia-smi正常显示 参考&#xff1a; nchttps://www.cnblogs.com/carle-09/p/11504544.html 可能是驱动版本不对&#xff0c;所以我重新去nvidia官网下载了驱动。 Official Drivers | NVIDIA 得到了NVID…

线性代数、矩阵计算

一、线性代数 1、对于向量&#xff0c;若a是标量&#xff0c;为a的绝对值乘以b的向量长度。 2、点乘 3、范数&#xff1a;向量或者矩阵的长度 L1范数&#xff1a;&#xff08;对向量&#xff09;每个元素的绝对值求和 L2范数&#xff1a;&#xff08;对向量&#xff09;torch.…

Cortex-M Fault

Cortex-M CPU 会在系统发生故障时引发异常。非法内存写入和读取、访问未通电的外设、执行无效指令、除以零以及其他问题都可能导致此类异常。通常在所有情况下都会引发 HardFault 异常。对于某些故障&#xff0c;可以启用不同的异常来专门处理这些情况。 Cortex-M 故障异常 …

Unity数据持久化3——Json

概述 基础知识 Json文件格式 Json基本语法 练习 可以搜索&#xff1a;Json在线&#xff0c;复制代码进去解析是否写错了。 Excel转Json C#读取存储Json文件 JsonUtility using System.Collections; using System.Collections.Generic; using System.IO; using UnityEngine;[Sy…

PCM、WAV,立体声,单声道,正弦波等音频素材

1&#xff09;PCM、WAV音频素材&#xff0c;分享给将要学习或者正在学习audio开发的同学。 2&#xff09;内容属于原创&#xff0c;若转载&#xff0c;请说明出处。 3&#xff09;提供相关问题有偿答疑和支持。 常用的Audio PCM WAV不同采样率&#xff0c;不同采样深度&#…

Mac安装多版本node

Mac下使用n模块去安装多个指定版本的Node.js&#xff0c;并使用命令随时切换。 node中的n模块是&#xff0c;node专门用来管理node版本的模块&#xff0c;可以进行node版本的切换&#xff0c;下载&#xff0c;安装。 1.安装n npm install -g n 2.查看版本 n --version 3.展…

sql:between and日期毫秒精度过多导致的查询bug

复现 一般情况下&#xff0c;前端传的日期值大多都是yyyy-MM-dd HH:mm:ss(标准格式)&#xff0c;比如2024-06-25 10:49:50&#xff0c;但是在测试环境&#xff0c;测试人员测出了一个带毫秒的日期&#xff1a;比如2024-06-25 10:49:50.9999999 这种情况下会出现查询bug SELEC…

《昇思25天学习打卡营第2天 | 张量 Tensor》

《昇思25天学习打卡营第2天 | 张量 Tensor》 《昇思25天学习打卡营第2天 | 张量 Tensor》 《昇思25天学习打卡营第2天 | 张量 Tensor》什么是张量&#xff08;Tensor&#xff09;张量的创建方式根据数据直接生成从NumPy数组生成使用init初始化器构造张量继承另一个张量的属性&a…

OVS:standalone模式下测试添加tag之后的vlan隔离

目录 1.新建一个ovs交换机 2.创建两个端口&#xff0c;分别配置tag2000和tag2001 3.为网桥德默认internal端口配置IP地址 4.创建两个ns 5.对两个ns进行手动的网络配置 6.再端口处于不通tag时检测两个ns之间的连通性结果为不通-ping--fail 7.将两个端口p1,p2 的tag设成一致…

office宏绕过杀软诱导点击实现主机控制

绕过防病毒扫描已经成为 BHIS&#xff08;Black Hills Information Security&#xff09;的一项运动。当我们为客户进行指挥控制&#xff08;C2&#xff09;测试时&#xff0c;我们从内部网络上的主机开始&#xff0c;创建一个反向连接到我们的C2服务器。然后&#xff0c;我们继…

Mysql中varchar类型数字排序不对踩坑记录

场景 在进行表设计时将版本号字段设计了为varchar类型&#xff0c;尽量从表设计阶段将数字类型列设计为int型。 再进行排序时如果版本号累计到了10及以上&#xff0c;那么再进行排序时则会出现问题。 比如下面执行排序时发现10被排在了第一位。 这是因为 varchar类型对数字…

Lua流媒体服务器支持(MP4视频、桌面直播、摄像头)

本来在做FFMPEG的项目&#xff0c;忽然想到Lua封装FFMPEG与SRS实现一个简易的直播网站何尝不是一个大胆的想法。 示例为初级版本&#xff0c;主要是用来验证可行性和功能性DEMO 演示效果&#xff1a; Lua流媒体直播服务器(支持MP4、桌面直播、摄像头)_哔哩哔哩_bilibili 代码简…

①分析胃癌组蛋白脱乙酰酶HDS模型-配对转录组差异

目录 HDS评分构建 ①数据加载 ②评分计算 做样本及评分展示图 ①数据处理 ②进行作图 分析配对的单细胞及转录组胃癌数据的 HDS评分,数据源于gastric-cancer - GitCode①胃癌单细胞和配对转录组揭示胃肿瘤微环境(文献和数据)_代码笔记:处理迄今为止最大的单细胞胃癌数…