目录
01 在终端侧算力上,动作最快的就是高通
02 模型优化,完成最后一块拼图
在WAIC上,高通展示的生成式AI创新让我们看到了未来的曙光。
生成式 AI 的爆发带来了意想不到的产业格局变化,其速度之快令人惊叹。
仅在一个月前,微软向全球发布了专为 AI 设计的“Copilot + PC”,为 AI PC 这一新品类设立了标杆。
这款最新的 Windows 个人电脑是迄今为止最快、最智能的,搭载的新型芯片可实现超过 40 TOPS(每秒万亿次操作)的 AI 算力,电池续航时间达一整天,并无缝接入全球最先进的人工智能模型。
发布时,只有骁龙 X 系列的 45TOPS 能满足这种 Windows 11 AI PC 的要求。
没体验过OpenAI最新版GPT-4o?快戳最详细升级教程,几分钟搞定:
升级ChatGPT-4o Turbo步骤https://www.zhihu.com/pin/1768399982598909952
如何使用WildCard正确方式打开GPT-4o,目前 WildCard 支持的服务非常齐全,可以说是应有尽有!
官网有更详细介绍:WildCard
目前,基于骁龙 X 系列平台的 Windows 11 AI PC 已在国内陆续上市,具备许多独特的 AI 功能,如通过回顾功能对存储资料进行 AI 搜索、设备端的 AI 图像生成与优化、实时翻译字幕和背景滤镜等。
结合终端侧最先进的大模型技术,人们可以在新设备上轻松与 AI 互动。AI 大模型能够实时获取系统内外的信息并作出有效回应,大幅提升工作效率。
还记得 OpenAI CEO Sam Altman 发布 GPT-4 时曾说过“与电脑交互从来都不是很自然的事情”,如今变革已经到来。
在人机交互方式的颠覆之后,人们注意到这些新设备的内在也有所不同:由 X86 架构主导的 Windows 笔记本在 AI PC 时代却采用了高通骁龙 X 系列芯片。
这并非简单替换。微软官方表示,Windows 11 中的部分生成式 AI 能力只能在骁龙芯片上正常运行。
为什么在生成式 AI 时代,计算机内部的“C 位”突然换人了?
在 7 月 4 日召开的 WAIC 2024 上,高通展示了一系列终端侧生成式 AI 能力,揭示了答案。
芯片的 AI 能力带动了设备形态的变革。
自 ChatGPT 问世以来,人们一直期待大模型等新技术带来的变革。
然而,这条道路异常艰难,在技术进步过程中,人们面临着数据、算法和算力的三重挑战。
生成式 AI 极度消耗算力,用于计算大模型的 GPU 都成了稀缺品,AI 计算芯片迅速成为各家硬件公司探索的方向。
01 在终端侧算力上,动作最快的就是高通
去年 10 月,高通在骁龙峰会上推出了第三代骁龙 8 移动平台(骁龙 8 Gen3),这块 SoC 在多核跑分中跑赢了苹果 A17 Pro。
由于 CPU 和 GPU 性能的大幅提升,NPU 性能直接翻倍,成为旗舰 AI 手机芯片的首选。
如今,搭载新一代芯片的 AI 手机已经大卖。与此同时,还有一个“未来式”——在骁龙大会上,高通介绍了全新设计的高性能 PC 芯片骁龙 X 系列平台。
其旗舰产品“骁龙 X Elite”大幅提升了移动 PC 的性能上限。
这款芯片采用 4nm 制程,搭载 12 大核的 Oryon CPU。与英特尔 Ultra 7 155H 相比,Oryon CPU 的单核同功耗性能领先 54%,同性能水平下能耗降低 65%。
在苹果 M3 芯片推出后,骁龙 X Elite CPU 在 Geekbench 多线程测试中表现比苹果新品好 28%。
GPU 方面,骁龙 X Elite 采用的 Adreno GPU 同功耗性能比 Ultra 7 155H 高 36%,达到相同性能时功耗仅为竞品的一半。
这款芯片最突出的亮点是面向下一代设备形态的 AI 算力。骁龙 X Elite 仅依靠 NPU 就能实现 45TOPS 算力,结合 CPU、GPU、NPU 的异构计算可以输出更高算力。
根据测算,在骁龙 X Elite 的支持下,新一代 AI PC 可以在终端侧运行超过 130 亿参数的生成式 AI 模型。
安蒙和纳德拉提到,新一代 AI PC 将把只有新形态系统架构才能实现的体验结合在一起。在 AI 算力和大模型结合后,我们使用 Windows 的体验如同初次遇见“开始”按钮一样——所有应用程序、体验都将有机整合到一键之上。
几个月后,这一预告变成了现实。现在,我们可以使用 AI PC 快速直观地检索所需内容,借助实时字幕突破语言障碍,利用 AI 图像生成能力进行创作。
未来,AI PC 的能力将覆盖学习、搜索与创作,彻底改变我们使用电脑的方式。
在芯片突破的同时,大模型技术的发展也在快速推进。
02 模型优化,完成最后一块拼图
最近,不论科技大厂还是创业公司都在加速研发“轻量级”AI 模型。
去年 7 月,Meta 的开源模型 LLaMA-2 70B 的性能已接近 GPT-3.5。
今年 4 月,LLaMA-3 8B 在 80 亿参数下达到了 ChatGPT 3.5 的性能水平。
上周,谷歌开源的 Gemma 2 已能在单块 GPU 上进行推理,性能超过了体量大于自身两倍的竞品。
有高通这样提供完整技术栈的存在,生成式 AI 的大规模落地已经按下了加速键。由此带动,变革正逐渐显现,这不由得让人想起 NPU 刚刚诞生时,上一波 AI 技术爆发的前夜。
很快,终端侧生成式 AI 带来的智能化将会无处不在。
如何使用WildCard正确方式打开GPT-4o,目前 WildCard 支持的服务非常齐全,可以说是应有尽有!
官网有更详细介绍:WildCard
推荐阅读:
GPT-4o不仅能写代码,还能自查Bug,程序员替代进程再进一步!
GPT-4替代大学生参加考试,94%成功作弊未被发现!