AI PC行业深度研究报告:AI PC革新端侧AI交互体验

news2024/11/24 15:02:51

今天分享的人工智能系列深度研究报告:《AI PC行业深度研究报告:AI PC革新端侧AI交互体验》。

(报告出品方:华创证券)

报告共计:28页

点击添加图片描述(最多60个字)编辑

一、硬件端与内容端持续创新,AI PC 或有望成为首个大批量落地的 AI 终端

(一)联想首推 AI PC,2024 年 9 月有望上市

联想 All For AI,展示丰富人工智能创新成果。2023 年 10 月 24 日,在联想创新科技大 会(Lenovo Tech World 2023)上,联想集团董事长兼 CEO 杨元庆展示了联想首款 AI PC、 大模型压缩技术、人工智能双胞胎(AI Twin)等一系列人工智能创新科技成果。联想的 AI Twin 可以通过压缩模型使大模型终端设备上离线运行,在旅行规划需求下,AI Twin 会参考用户之前的旅行日记和笔记,为用户提供比公共模型更个性化的旅行计划。

基础模型包括三类,有助于分层提供不同类型服务。基础模型是在与人类价值体系相一 致的大量数据规模上训练的大型 AI 模型,因此它可以适应广泛的下游任务。基础模型分为公共、私人和个人三种,公共基础模型(Public FM)是所有人都可以获得的,私人基础模型(Private FM)是为了执行企业特定任务将信息保留在企业里的,个人基础模型 (Personal FM)可以基于个人数据提供个性化答案。

实现人工智能基础模型三个核心技术,联想将终端 AI 推理变为可能。在设备上集成智能 对于实现 AI 的全部潜力,即提供更高即时性、可靠性、个性化、安全性和隐私性至关重 要,能够在设备本地高效运行多个并发 AI 工作负载的技术是关键。其中包括三项核心技术:(1)私人模型的微调:首先使用公共数据进行训练得到公共基础模型(Public FM),它可 以执行一般的任务。然后通过使用企业特定数据进行额外训练,由此私人模型 (Private FM)可以理解公共领域任务也可以理解企业特定的任务。 (2)个人基础模型的模型压缩:发现基础模型中的耦合结构,评估这些结构的重要性。对于重要的 结构,分配更多 bits 来量化,对于不太重要的结构分配较少的 bit。通过这种联合修 建和量化算法,可以显著减小基础模型的大小,从而放进 PC 或智能手机中。(3)混合 AI 框架的数据管理和隐私保护:评估这个任务是公开的还是私人的,如果是公 开的,可以将此任务分派给所有基础模型。如果包含企业特定信息或个人信息,执行任务理解、任务分析、关键字屏蔽和取消屏蔽等操作,最后再使用这个混合 AI 框 架将所有内容重新组合成一个完整答案。

联想将与合作伙伴共同建立混合 AI 生态,首款 AI PC 有望于明年 9 月发布。未来的 AI 将是公共、私人和个人基础模型的混合体,联想将和所有合作伙伴一起建立混合 AI 生态 系统。联想将提供企业 AI 双胞胎和个人双胞胎 AI 两类服务;对于企业用户,联想将通过混合 AI 和域优化服务满足企业数据保护和安全需求;对于个人用户,联想将通过在终 端设备方面的优势,以混合方式提供模型服务,最大限度提高用户效益。

(二)从 Smart PC 到 AI PC,AIGC 驱动 PC 智能化新发展

Smart PC 推出已久,受限于成本压力普及缓慢。几年前就开始有厂商积极探索 Smart PC (智慧 PC)的使用场景,Smart PC 主要从应用场景出发(Always on Always),例如:人 机交互,包括语音智能唤醒、免接触式场景和开盖开机等功能。然而受限于成本和算力, 推进速度相对较慢。据群智咨询数据,为实现 PC 端智能化的自然语言交流,单在硬件成 本上至少需要额外付出约 2.7 美元左右来满足精确的语音录入与处理功能,使品牌方的 成本压力大大增加。混合 AI 从云到端,助力 Smart PC 向 AI PC 转化。AIGC 的迅速发展可有效解决 Smart PC 的成本压力问题,即:云端+本地端协作。利用云端的大数据处理能力丰富本地端的 PC 使用场景,依托于云端算力来提升本地性能平衡,会大大的助力 Smart PC 向着 AI PC 的方向进一步持续转化,提供更多的应用场景,这也对 AI PC 提出了本地端与云端混合发展的要求。

相比于传统 PC,AIPC 功能丰富且效率更高。传统 PC 仅能实现基础的数据处理和计算 功能,智慧 PC 可以实现本地特定场景的优化功能,而 AIPC 功能更加丰富,具备自然语言处理、图像识别等多种功能。同时本地+云协同工作,大幅提高运行效率,使得离线条 件下也能使用 AI 功能。交互方面,AIPC 提供简易化的操作界面,对用户技能要求较低, 让更多的用户能够使用人工智能来提高效率。

(三)隐私保护与低延迟催生 AIPC 需求,软硬件持续迭代为产品落地创造条件

大模型存在数据泄露等安全隐患,是企业及个人用户的核心关注点。2023 年 3 月 ChatGPT 首次遭遇了重大个人数据泄露,很多网友在 ChatGPT 网页左侧的聊天记录栏中 出现了他人的聊天记录内容。除此之外,今年 3 月自三星电子允许部分半导体业务员工 使用 ChatGPT 开始,短短 20 天有三起机密资料外泄事件。据 Cyberhaven 数据,在员工 直接发给 ChatGPT 的企业数据中,有 11%都是敏感数据。

终端 AI比云更安全,且时间延迟较低。目前常用的 AIGC 都是在云上实现,需要将个人数据上传到网络,存在泄露隐私的隐患。而未来 AIPC 的部分推理功能将发生在终端侧,用户既可以享受到 AIGC 带来的生产力提升,也无需担心上云导致的隐私泄露。对用户来说,云上的公共知识可以为其所用,但自己的人工智能数据无需分享。除安全性之外,终端 AI 节省了数据传输时间,大幅降低时间延迟。

多家厂商加速研发 AIPC,2024 有望迎来 PC 重大发展机遇。除联想之外,多家头部 PC厂商也在进行 AIPC 相关研发和合作。惠普电脑 CEO Enrique Lores 表示目前正在研发支持 AI 能力的 PC,称当前正与所有关键软件服务商和芯片供应商合作,将重新设计PC 的架构。戴尔与英伟达合作推出新的 AIGC 解决方案,同时戴尔将提供新的硬件设置、托管服务平台和计算机,以更快地运行客户所创建的生成式 AI项目。Acer 品牌创办人施振荣表示,Acer 目前已经与 CPU 厂商展开合作,预计将把 AIGC 或其他 AI 应用导入到终端设备上,相关 AI笔记本方案会在 2024、2025 年陆续推出。

2024 或将迎来 AIPC 规模出货元年,软硬件持续选代为产品落地创造条件。据群智咨询数据,预计 2024年全球AI PC 整机出货量将达到约 1300 万台。在2025 年至 2026年,AI PC 整机出货量将继续保持两位数以上的年增长率,并在 2027 年成为主流化的 PC产品类型,这意味着未来五年内全球 PC 产业将稳步迈入 AI时代。由于 AIPC 产品对硬件和软件基础设施的要求均有所提高,软硬件仍需持续迭代为产品落地创造条件。

二、硬件端:AI PC 催化硬件端迭代升级,英特尔 AI PC 芯片将于年底落地

(一)可获取性及安全性是办公领域核心问题,AI 从云端走向终端

人工智能引发数据安全问题,需平衡技术应用和隐私保护。随着人工智能技术的不断发 展和 AIGC 的应用,大量的个人和企业数据被采集、处理并传输到云端,而将数据传输 到云端存在数据泄露的风险。在应用人工智能技术的同时,仍需关注如何做好数据隐私保护问题。

AI从云端走向终端部署,最大幅度保障数据安全和运行稳定性,边缘计算是指发生在网络边缘的计算,更靠近数据源,而云计算发生在数据中心。云计算通常具有高可用性,高性能和高伸缩性,可以处理大规模数据和应用程序;而边缘计算通常具有低延迟、高带宽和实时功能,可以支持更多实时应用场景。除此之外,由于边缘计算中仅向云端传输少量信息或不传输信息,隐私性和安全性较高。同时,由于边缘 AI 不受网络访问限制,可离线使用,可充分保障系统稳定运行。

多种方法进行大模型压缩,从而将其部署至终端设备。目前常见的模型压缩有三种方式, 包括知识蒸馏、量化和权重剪枝。可以在不显著降低模型性能的前提下,节省存储空间、 提高计算效率、加速推理过程,使大型 AI 模型更容易部署到边缘设备或其他低功耗环境 中,从而拓展 AI 技术的应用领域。  知识蒸馏:通过训练轻量级模型(学生模型)来模仿重量级模型(教师模型),可以将大型 AI 模型的知识迁移到轻量级模型中,从而实现模型压缩。  量化:将浮点数权重参数转换为较低精度整数,从而降低模型的存储和计算需求。  权重剪枝:删除模型中较小的权重参数,从而减小模型的大小。为了防止模型过拟 合的情况,在压缩过程中需要加入正则项来平衡模型的泛化性能。

压缩模型终端运行的效果并不弱于原始大模型,有望催化混合 AI 架构。大模型的训练效 果并不是参数越多越好,较小参赛的模型经过微调也能具备相似甚至更好的效果。据上海人工智能实验室发表的论文《LLaMA-Adapter: Efficient Fine-tuning of Language Models with Zero-init Attention》的研究结果,基于 70 亿参数的模型 LLaMA-Adapter 在微调 180 万个参数后,回答问题的正确率高于多数大型模型,同时在 SOC(Social Science)领域的效果非常突出。

(二)终端离线 AI 对处理能力提出更高要求,硬件仍需持续迭代

高通实现安卓手机上跑十亿参数大模型,证明大模型在本地终端运行的可能性。2023 年 2 月 23 日,高通全球首次成功在搭载了骁龙芯片的安卓手机上运行了 Stable Diffusion。 Stable Diffusion 可以基于大模型从文本生成图片,其模型参数超过 10 亿个,计算量是智 能手机上运行的典型工作负载大小的 10 倍以上,而正是由于模型庞大、算力需求高、能耗高企,此前主要局限在云端运行。而搭载骁龙芯片的手机可以直接运行参数规模超过 10 亿的 Stable Diffusion,且只需要 15 秒左右就可以出图,精确度与云端处理接近。

边缘侧 AI 对终端的处理能力提出更高要求,终端处理器仍需持续迭代。以苹果 Siri 为 例,早期 Siri 在离线情况下仅支持通过预设的语音唤醒信号实现语音唤醒。2018 年苹果推出 A12 芯片,采用台积电 7nm 制程,NPU 由双核升级到八核,NPU 内核的面积是 A11 的 3.16 倍。搭载 A12 芯片的 iPhone XS 首次支持 Siri 离线运行,可以在离线条件下完成拨打电话、打开特定应用等预设简单请求。随着未来在终端运行大模型的复杂度持续提 高,终端处理器仍需持续迭代。

AI PC 带动散热、存储及外观设计创新,硬件仍需持续迭代。除了核心处理器外,AI PC 对笔记本电脑的其他零部件亦提出更高的要求。在终端运行大模型首先要解决散热问题, 要重新设计机器外壳和结构件,同时采用更好的散热材料。存储方面,为了提高数据传 输速度及存储容量,需采用更优质的存储器件。AI PC 带动笔记本电脑一系列的迭代与创新,有望驱动 PC 零部件价值量提升。

(三)具备 AI 功能的 AI PC 芯片将于年底推出,AI PC 加速落地

英特尔首款内置神经网络处理器的消费级芯片即将上市,消费级 AI 芯片走向市场。英特尔 Meteor Lake(14 代酷睿)将于 2023 年 12 月 14 日上市,该芯片首次将神经网络处理 单元(NPU)集成到 PC 处理器中。NPU 与 CPU、GPU 的主要区别在于学习能力,NPU 可 通过学习用户操作、计算任务属性,做出相应的预判来弹性调用 CPU 与 GPU 的运算能 力,大幅提升性能,同时降低功耗。该芯片采用新的 Intel4 制造工艺,相较于 Intel 7 制程工艺的 408nm 高性能库高度,Intel 4 的 240nm 达到了 2 倍的高性能逻辑库面积缩减。

英特尔宣布启动 AI PC 加速计划,构筑 AI PC 核心硬件基础。英特尔在近期“英特尔 on 技术创新大会”期间宣布,正式启动首个 AI PC 加速计划。英特尔将联合独立硬件供应 商(IHV)和独立软件供应商(ISV),利用英特尔在 AI 工具链、协作共创、硬件、设计 资源、技术经验和共同推广等方面的资源,在 2025 年前为超过 100 万台 PC 带来 AI 特 性,并由计划 12 月 14 日发布的英特尔酷睿 Ultra 处理器率先推动。处理器的性能是终 端运行 AI 及 AI PC 渗透的核心技术瓶颈,英特尔的布局构筑 AI PC 核心硬件基础,有望 驱动 AI PC 快速普及。

三、内容端:AIGC 快速发展,微软 Copilot 推出为 AI PC 内容端创造环境

(一)ChatGPT 使 AI 商业化初步落地,或可推动 AIGC 行业进入快速发展期

AI 被视为“第四次科技革命”,开启新一轮技术创新周期。人工智能概念最早于 1956 年 被提出,多年以来产业历经几轮技术快速发展周期。2012 年 AlexNet 神经网络模型问世, 成为一轮发展起点,并开启了 AI 在各行各业的应用,被视为人工智能 1.0 时代,但当时 仍存在模型碎片化等问题。2017 年 Google 团队提出的 Transformer 架构,开启了大模型为主流算法的人工智能 2.0 时代,模型参数呈现指数级增长。自 2018 年起,新一代 AI 技 术正在开始全新一轮的技术创新周期,而 GPT 也正是由此时诞生。

ChatGPT 代表通用人工智能突破的可能性,使得 AI 的“商业化”初步落地。ChatGPT 引发全球轰动的核心是代表着 AI 正在从感知智能向认知智能发展,代表通用人工智能突破 的可能性,正是“通用性”使得 AI 的“商业化”能够初步落地。此前运用人工智能的场景都 是专用人工智能模型,往往只适用于某具体领域;而 ChatGPT 及 GPT4.0 代表了人工智 能通用大模型方向的最新进展,“通用性”使得 AI 的“商业化”能够初步落地,而 AI 的通 用、商业化应用才能为各行各业具体赋能。目前 AIGC 的主要模式有文本生成、图像生成、音频生成,策略生成,跨模式生成及 Game AI。基于多种模式,AIGC 已应用于法律、 金融、工业、游戏等多种领域。

ChatGPT 具备爆款特性,或可推动 AIGC 行业进入快速发展期。众多学者将 ChatGPT 的 出现类比为“AI 的 iPhone 时刻”,关键在于 iPhone 和 Android 的推出加速了手机进入通用 化、智能化、商业化的民用时代。ChatGPT 的出世一度被认为是 iPhone 4 之后的又一次 革命,深刻改变人类生活和互联网格局。技术上,ChatGPT 一面市就展现出高完整度、 高体验性和高平台性,是成熟到一定程度的产物,而 iPhone 4 在软件和硬件方面都是高 标准、高适配;市场反应程度上,二者在短时间内都得到迅速普及,具有里程碑意义;时 代特征上,ChatGPT 和 iPhone 4 具有分别开启智能互联网时代和效率革命;二者都为用 户带来了效率的提升,iPhone 4 让大家的生活更高效、便捷、多样化,ChatGPT 则更直接 地为人类解决问题,扩展思维的多样性。

(二)生产力提升为 AIGC 率先渗透领域,PC 有望成为为 AIGC 核心交互入口

孪生编辑创作三大能力构建 AIGC 能力闭环。据中国信息通信研究院,AIGC 主要包括 三大核心能力,分别为孪生、编辑和创作。深度神经网络技术在大模型和多模态两个方 向上的持续突破,推动 AIGC 技术演化出智能数字内容孪生能力、智能数字内容编辑能 力和智能数字内容创作能力三大前沿能力。  孪生能力:将现实世界中的物理属性和社会属性高效、可感知地进行数字化。  编辑能力:高效率仿真和低成本试错为现实世界的应用提供快速迭代能力。  创作能力:算法创作能力的自我演化支持海量内容生态。

报告共计:28页

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1301795.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

爬虫 selenium语法 (八)

目录 一、为什么使用selenium 二、selenium语法——元素定位 1.根据 id 找到对象 2.根据标签属性的属性值找到对象 3.根据Xpath语句获取对象 4.根据标签名获取对象 5.使用bs语法获取对象 6.通过链接文本获取对象 三、selenium语法——访问元素信息 1.获取属性的属性值…

Leetcode—228.汇总区间【简单】

2023每日刷题&#xff08;五十六&#xff09; Leetcode—228.汇总区间 解题思路 我们可以用双指针left 和 right找出每个区间的左右端点。 遍历数组&#xff0c;当right 1< n 且 nums[right1]nums[right]1 时&#xff0c;指针right向右移动&#xff0c;否则区间 [left, …

15:00面试,15:06就出来了,问的问题太变态了。。

刚从小厂出来&#xff0c;没想到在另一家公司我又寄了。 在这家公司上班&#xff0c;每天都要加班&#xff0c;但看在钱给的比较多的份上&#xff0c;也就不太计较了。但万万没想到5月一纸通知&#xff0c;所有人不准加班了&#xff0c;不仅加班费没有了&#xff0c;薪资还要降…

成都工业学院Web技术基础(WEB)实验八:BOM、DOM基本操作

写在前面 1、基于2022级计算机大类实验指导书 2、代码仅提供参考&#xff0c;前端变化比较大&#xff0c;按照要求&#xff0c;只能做到像&#xff0c;不能做到一模一样 3、图片和文字仅为示例&#xff0c;需要自行替换 4、如果代码不满足你的要求&#xff0c;请寻求其他的…

c2-C语言--指针

1.用一级指针遍历一维数组 结论 buf[i]<>*(buf i) <> *(p i)<> p[i] #include <stdio.h>int main(){int buf[5] {10,20 ,30 ,40,50}; //buf[0] --- int // buf --&buf[0] ----int *int *p buf;//&buf[0] --- &*(buf0)printf(&quo…

声明式数据建模、定义简单易懂:下一代 ORM 助你效率倍增 | 开源日报 No.102

prisma/prisma Stars: 34.0k License: Apache-2.0 Prisma 是一个下一代 ORM&#xff0c;包括以下工具&#xff1a; Prisma Client&#xff1a;为 Node.js 和 TypeScript 自动生成的类型安全查询构建器Prisma Migrate&#xff1a;声明式数据建模和迁移系统Prisma Studio&#…

【解刊】IEEE(trans),CCF-A,IF7.9,潜力好刊

计算机类 • 好刊解读 今天小编带来IEEE旗下计算机领域高分好刊&#xff0c;CCF-A类推荐的期刊解读&#xff0c;如您有投稿需求&#xff0c;可作为重点关注&#xff01;后文有相关领域真实发表案例&#xff0c;供您投稿参考~ 01 期刊简介 IEEE Transactions on Mobile Compu…

科研试剂2913223-17-1激酶抑制剂 KWCN-41

KWCN-41 激酶抑制剂 2913223-17-1&#xff08;源自星戈瑞&#xff09; EFdA-TP 核苷逆转录酶抑制剂 950913-56-1 (RT) 3-O-Methylviridicatin TNF-α的抑制剂 6152-57-4 Zidebactam sodium salt β-内酰胺酶抑制剂 1706777-46-9 Triacsin C 酰基辅酶A合成酶抑制剂 76896-80…

【lesson4】数据类型之数值类型

文章目录 数据分类数值类型tinyint类型有符号类型测试无符号类型测试 bit类型测试 float类型有符号测试无符号测试 decimal类型测试 数据分类 数值类型 tinyint类型 说明&#xff1a;tinyint 有符号能存储的范围是-128-127&#xff0c;无符号能存储的范围是0~255 有符号类型…

AI 绘画 | Stable Diffusion 艺术二维码制作

前言 这篇文章教会你如果用Stable Diffusion WEB UI制作艺术二维码,什么是艺术二维码呢?就是普通二维码和艺术图片融合后的二维码图片,如下图所示。主要原理还是使用controlNet的control_v1p_sd15_qrcode_monster模型和光影模型control_v1p_sd15_brightness。 教程 准备…

推荐4个优秀的 Python 时间序列分析库

时间序列分析在金融和医疗保健等领域至关重要&#xff0c;在这些领域&#xff0c;理解随时间变化的数据模式至关重要。在本文中&#xff0c;我们将介绍四个主要的Python库——statmodels、tslearn、tssearch和tsfresh——每个库都针对时间序列分析的不同方面进行了定制。这些库…

【每日一题】1631. 最小体力消耗路径-2023.12.11

题目&#xff1a; 1631. 最小体力消耗路径 你准备参加一场远足活动。给你一个二维 rows x columns 的地图 heights &#xff0c;其中 heights[row][col] 表示格子 (row, col) 的高度。一开始你在最左上角的格子 (0, 0) &#xff0c;且你希望去最右下角的格子 (rows-1, column…

太阳能光伏企业网站建设效果如何

光伏行业近些年发展也比较迅速&#xff0c;其服务/产品拓展度较高&#xff0c;对企业来说&#xff0c;合作商较少更需要多地域寻找目标客户及信息承载展示、拓展等&#xff0c;传统线下方式单一且不足&#xff0c;线上成为众商家经营的方向。 1、品牌宣传、信息呈现难 太阳能…

C/C++ 题目:给定字符串s1和s2,判断s1是否是s2的子序列

判断子序列一个字符串是否是另一个字符串的子序列 解释&#xff1a;字符串的一个子序列是原始字符串删除一些&#xff08;也可以不删除&#xff09;字符&#xff0c;不改变剩余字符相对位置形成的新字符串。 如&#xff0c;"ace"是"abcde"的一个子序…

git 关于分支、merge、commit提交

最近开始用git终端提交代码&#xff0c;梳理了一些知识点 一 关于分支 关于分支&#xff0c;git的分支分为本地分支远程分支两种分支&#xff0c;在上传代码时&#xff0c;我们要确保当前本地分支连接了一个远程分支。 我们可以通过下面代码查看当前的本地分支&#xff1a; g…

.NET 8 编写 LiteDB vs SQLite 数据库 CRUD 接口性能测试(测试篇)

WebAppDbTest 项目测试 测试工具 ltt介绍安装使用方式1、Drill2、Hammer3、Nailgun 测试主机规格配置CRUD 性能测试对比1、ltt 工具测试1.1、AddSingle 单条数据添加1.2、AddBulk 批量数据&#xff08;1000&#xff09;条添加1.3、GetSingle 单条数据查询1.4、GetAll 多条&…

angular form 组件、双向绑定;反应式表单

1.使用双向绑定&#xff0c;以及angular的表单提交功能 app.moudle中引入 双向绑定 [(ngModel)]"text" ​​​​​​​ 效果 提交表单 2.反应式表单 在app.module.ts中引入在组件中引入&#xff0c;并放在一个变量里 在初始化时实列化这个module 定义规则 在html…

成都工业学院Web技术基础(WEB)实验五:CSS3动画制作

写在前面 1、基于2022级计算机大类实验指导书 2、代码仅提供参考&#xff0c;前端变化比较大&#xff0c;按照要求&#xff0c;只能做到像&#xff0c;不能做到一模一样 3、图片和文字仅为示例&#xff0c;需要自行替换 4、如果代码不满足你的要求&#xff0c;请寻求其他的…

【Python必做100题】之第四题(判断素数)

素数&#xff1a;约数只有1和本身的数叫素数 代码如下&#xff1a; a int(input("请随机输入一个数字&#xff1a;")) #键盘随机输入一个数字进行判断 flag False for i in range(2,a):if a % i 0: #在(2&#xff0c;a-1)之间但凡有一个可以整除就不是素数break…

java代码test

目录结构 对于使用ArrayList集合并使用Iterator遍历 package test2; import java.util.ArrayList; import java.util.Iterator;public class T8 {public static void main(String[] args) {// 创建ArrayList集合并添加元素ArrayList<String> arrayList new ArrayList&l…