2024年了,苹果可以通话录音了

news2024/11/25 14:42:36

 

dd3f5d43598c2a98a8352180c00a09de.png

人不走空

 

                                                                      

      🌈个人主页:人不走空      

💖系列专栏:算法专题

⏰诗词歌赋:斯是陋室,惟吾德馨

 

da14e5cf865a427ea959fca470d8245a.gif

 

e6d2c45cbc09e5c0b8ed4033292cbc24.jpeg

 

6月11日凌晨,苹果在WWDC24大会上,密集输出了酝酿多时的AI应用更新。苹果对通话、对话、图片,乃至最令人一言难尽的Siri都做了“全家桶”式改造,可谓诚意满满。市场的反应是滞后的。或因出现了过多OpenAI的能力介入,大会后,“苹果市值一夜蒸发4213亿元”的话题也随之冲上热搜。但一夜过后,苹果股价又大涨7.26%,市值涨至31765亿美元,单日上涨超2150亿美元,合超15000亿人民币。

 

 

 

继OpenAI、微软、谷歌、Meta相继奔赴“AI高考”,掀起了一波波热浪后,苹果作为最后一个被万众期待的优等生,磨蹭许久,也终于交卷了。

 

6月11日凌晨,苹果2024年全球开发者大会(WWDC24)如约而至。不出所料,发布会上对AI功能的介绍吸引了最多目光,占据了多达一半的演讲时间。

 

 

2be832acc649c81d7b19eb1b40b565d8.png

 

此前,围绕着苹果与OpenAI的合作落地,苹果会不会借此改造一言难尽的Siri,苹果的AI命名(Apple Intelligence)问题,轮番上阵的预热和讨论,已经在互联网上持续了不短的时间。

 

最意味深长的部分则是,向来崇尚自有生态的苹果,虽然屡屡传出将允许OpenAI深度介入,但或出于“挣扎”,传言也数次被“辟谣”。发布会让猜测的靴子落地——苹果与OpenAI达成的,几乎是“颗粒度级”的合作。

 

很难说这样的升级,对于苹果究竟是喜是忧。最直观的是,市场反应惨淡:发布会进行同时,苹果股价便不断下跌,最终每股报收193.12美元,跌1.91%,市值缩水578亿美元至2.96万亿美元。

 

微博上有用户表示:比起AI能力,发布会最大亮点是——电话通话终于允许录音了。

 

 

c9dc723ff8b28f377a49e91f310672a6.png

▲ 图 / 科技博主@AshutoshShrivastava

 

 

 

0719ef548c791634947d37f960191b62.png

AI全家桶,OpenAI来套壳

 

c85063844dfa7c21a851a779c6bd19a4.png

 

大会开始,OpenAI创始人山姆·奥特曼(Sam Altman)被安排到了前排就座。这是他自2008年后第二次于公众视野亮相WWDC,似乎也预示着,苹果这次与OpenAI的合作,绝不寻常。

 

虽然5月以来,OpenAI、微软、谷歌、Meta已密集地上演了一场场“AI春晚”,展示了不少精彩技术;但AI距离普通人的理解,以及真实的场景落地还有不小距离。而苹果看起来,才是最有希望将“AI”拉入凡间的公司:可以用更贴近用户的手机AI功能,通过OS和各种App与生活交融。

 

这也是苹果在这次发布会上希望传达的调性,库克将苹果的升级概括为个人智能(personal intellegence)。他表示:“我们希望产品强大、易用、符合直觉、能和现有的产品集成、个人化。”

 

作为预热过场,苹果先用了一个多小时介绍了MR头显VisionPro、iOS、Watch OS、iPad OS、Mac OS乃至于Apple TV的一系列更新。这些“点缀前菜”让观众们听得不胜其烦,直到进度条拉到1小时后,Apple Intelligence才姗姗来迟——把One more thing放在最后,也是苹果的传统艺能。

 

很难讲苹果的AI升级究竟有多少震撼惊喜。其展示的各类功能,比如人工助手回答问题、修改图片、自动翻译、邮件摘要、润色文章等,在近期AI厂商和国内的AI手机发布上都“似曾相识”。但苹果的整合能力,还是能让人看到AI可能带来的深刻改变。

 

 

3825d60a2c9d364f2eb9ae8a7601d7d4.png

 

能显现出苹果最大决心的,无疑是为Siri引用了GPT-4o,让它变得更聪明。

 

回头看去,诞生于2011年的Siri,着实是起了大早赶了晚集。在ChatGPT横空出世前,Siri十几年来从智能助手,沦为了只会讲笑话和被“调戏”的对象,难用程度已“槽多无口”。

 

发布会前,外媒曾剧透,苹果对于是否要帮Siri全面接入ChatGPT,有过两极分化的“撕裂”讨论。从结果看,不论是在AI大潮中感到了沉重危机,还是对OpenAI最终认栽,苹果都痛下了决心,让Siri活成它该有的样子。

 

 

eb9d60ec8585bafa689481b8ed8c04f3.png

▲ Siri将支持文字交互

 

Siri的升级不可谓不多:苹果为其在主屏上设计了一个大光圈;基于Apple Intelligence能力,Siri具备了丰富的语义和大模型上下文理解能力,能理解用户对“那次”“那时”“那里”等代词的具体描述。在原本的语音交互外,Siri还将增加文字交互功能、跨App执行操作等新玩法。

 

现在,用户可以用文字、语音与Siri交流,它可以读懂用户说话间的犹豫——当遇到困难问题时,比如用户询问某道复杂菜式的做法时,Siri会提示是否需要唤起ChatGPT,并由后者详细作答。

 

有了GPT-4o的能力垫底,用户可以用文档、图片、PDF多模态对Siri提问,它也可以基于iPhone内的应用和数据库,做出反应。

 

比如,一个朋友在短信中提到新地址,用户可以让Siri把地址添加到联系人卡片上。用户也可以直接对Siri说:找到某张图片,并进行修图。或者在填表时,提示“帮我找到驾驶证号码”,并填到表格内。

 

苹果还在发布会上展示了一个智能示例,对Siri说,“我要去机场接妈妈了”,苹果便会读取妈妈的航班信息、时刻延误、机场交通,接着智能生成好时间表,填入日程中。

 

 

aefaf118bd1b1ea88627e4f9f9fe4026.png

▲ Siri可读取iMessage中的地址并添加到联系人卡

 

 

 

1f5b7ce288f8343c36e1f480d59ae148.png

iPhone 15 Pro以上能用,国行暂无缘

 

af2db1e637c99339f0472f7228aa0f8b.png

 

为了表达对AI智能化的诚意,苹果着实一股脑拿出了“全家桶”的选择。从通话、语音转文字、智能对话助手、图片处理,到访问第三方应用,苹果几乎对每项核心功能都进行了智能优化。

 

例如,Apple Intelligence支持智能回复邮件。面对长篇的邮件线程,用户仅需轻触屏幕,就可获取关键信息。iPhone可以对邮件快速总结提要,进行简单回复,同步翻译。

 

基于苹果内置芯片的强大算力,Apple Intelligence也把生成式模型部署在了iPhone、iPad和Mac本地,让苹果的原生系统多了不少新功能。

 

例如iPhone始终被诟病的无法通话录音,也终于做出了改变,更新后不仅能够录音,在AI加持下还能够提供文字转录、要点提取等服务。不过,使用通话录音时,考虑到隐私保护,对方将会收到相应通知。

 

针对无边记等写作应用,Apple Intelligence会帮助用户提供写作优化建议、内容校对等,用户可以从多个版本中挑选,调整文风以适应不同的读者和场合。例如,用户撰写邮件时,写作工具菜单会弹出润色选项,并提供智能回复邮件等功能。

 

 

5deaef33562ceb1336002a5cad63360c.png

 

最能让用户发挥个人想象力的功能还包括“智能图像生成”。苹果推出了Genmoji(表情生成)功能,支持用户通过自然语言描述生成表情符号;并进一步推出了Image Playground(图像游乐场),能够让用户自选服装、地点、配饰等关键词,在几秒钟内创造出有趣的图像。

 

 

0160479259247a11fa00c799a8b475c9.png

 

7cee4cc64ee081dc807d79608d04e99e.png

 

种种Apple Intelligence的功能更新,背后少不了和各家大模型,特别是OpenAI达成的颗粒级合作。如AI从业者“歸藏”所说:“连文字改写都用的ChatGPT,图像看起来用的是DALL-E(OpenAI于2021年发布的图像生成模型)。”

 

而对于以上的大模型调取,苹果宣布都将完全免费。用户不必创建账户,就可以免费使用ChatGPT,ChatGPT订阅用户也能关联自己的账户,并在苹果设备中接入付费功能。

 

包含上述功能的“英语试用版”系统将于今年夏天推出,并于今秋落地在iOS 18、iPadOS 18及macOS Sequoia中。但考虑到GPT-4o对大陆的访问限制,本次iPhone和Mac功能更新,可能基本与国行版本无缘。

 

按照官方说法,苹果还计划于明年推出更多AI功能。但由于以上功能需要A17 Pro芯片支持,用户必须要购买iPhone 15 Pro以上级别产品,才可以使用。

 

 

 

d6ea818e78d1276863c12ec56ca6fc36.png

苹果努力捍卫AI铁王座

 

51f2e966d6ac78e31c001f79f21e4889.png

 

实际上,这是一场并无多少秘密的发布会。几乎提前一星期,WWDC24的核心信息就被路透殆尽。可以预见的是,苹果发布的诸多功能,将很快引来友商跟随。而在大模型和AIGC时代,作为智能手机市场的“旧王”,苹果将如何捍卫铁王座,也将成为重要命题。

 

但某种程度上,对自有生态护城河格外重视的苹果,选择对OpenAI敞开大门,已经站在了被动的身位。虽然在大模型横空出世后,苹果一度也躬身入局尝试自研,但结果并不尽如人意。

 

去年,市场一度传出苹果正在积极自研大模型“Ajax”。今年3月苹果曾公布自研的MM1多态大语言模型,但后来并未对该模型开启公测,也未发布上线时间规划。

 

同月,在发布新款Macbook Air时,苹果也在宣传文案中首次强调了“AI”。4月,曾有媒体爆料称苹果正在研发一种运行于设备端的大型语言模型,该模型将优先保证响应速度和隐私保护能力。

 

不过这些,显然都未帮助苹果放大出强劲势能,挽救AI颓势。而友商们,还在不断通过各种合作,跑步入场AI硬件。

 

早在2023年,华为、小米、vivo、OPPO、荣耀等国产手机厂商,就已开始大模型试水,自研亦或接入外部大模型的努力,频频见于报端。

 

2023年7月,华为在开发者大会HDC上发布了盘古大模型3.0,官宣新一代智能操作系统HarmonyOS 4已接入了盘古大模型。一个月后,在年度演讲上,雷军透露小米的13亿参数版本自研大模型已经成功在手机端侧跑通。11月,vivo、OPPO先后推出蓝心大模型矩阵(BlueLM)和安第斯大模型(AndesGPT),同期搭载于手机亮相。

 

兜兜转转,苹果在手机大模型赛道的进度条显然落后了。而这在本已红海厮杀的智能手机市场中,无疑是极大劣势。

 

 

25fcade26aa8df861173e9c8c96e49bd.png

 

有开发者指出,目前还未有一家智能手机企业如苹果这样,如此大范围、细颗粒度地引入了AI大模型的嵌入。随之而来地,频繁端侧推理带来的高耗电问题能否解决?还要等苹果全面开放使用后,才有论断。

 

值得一提的是,2008年,年仅23岁的山姆·奥特曼曾来WWDC演讲,推广自己的首个创业项目,并于Apple Store上架了好友定位应用Loopt。16年后,凭借苹果与OpenAI的深度合作,山姆不仅再次成为WWDC座上宾,更摇身变为最大的隐形Boss,堪称最大赢家。

 

在大会结束后,山姆通过个人社交媒体发帖称:“非常开心与苹果达成伙伴关系,并将在今年晚些时候将ChatGPT嵌入他们的设备中。”

 

 

de9d3bf119f3b68eb7f1ac87f6b3104e.png

▲ 图 / 网络

 

对于OpenAI而言,在微软之后又收获了苹果这个重大的合作伙伴,意味着在大模型的浪潮里,又多了一块最重磅级别的压舱石。

 

不过苹果的合作,也未必代表着甘愿长期与OpenAI绑定,或许也只是在为自研进程争取时间。近期,Siri联合创始人达格·基特劳斯 (Dag Kittlaus) 预测:OpenAI 的合作对苹果来说可能只是短期到中期的关系。

 

(文中插图如无特别说明,均来自于苹果)

 


作者其他作品:

【Java】Spring循环依赖:原因与解决方法

OpenAI Sora来了,视频生成领域的GPT-4时代来了

[Java·算法·简单] LeetCode 14. 最长公共前缀 详细解读

【Java】深入理解Java中的static关键字

[Java·算法·简单] LeetCode 28. 找出字a符串中第一个匹配项的下标 详细解读

了解 Java 中的 AtomicInteger 类

算法题 — 整数转二进制,查找其中1的数量

深入理解MySQL事务特性:保证数据完整性与一致性

Java企业应用软件系统架构演变史

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1827639.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

使用Ventoy 替代Win_To_Go更好的随身系统

Ventoy支持在物理机上直接启动安装了 Linux/Windows 系统的 磁盘映像文件 。 系统是在真实物理机上运行,并不是在虚拟机里运行,没有性能损失。支持 Legacy BIOS 和 UEFI 模式。支持从任意磁盘启动磁盘映像。 Windows 支持固定大小以及动态扩展类型的 VH…

【C语言】二维数组(详解)

目录 1. 二维数组的创建 1.1 二维数组的概念 1.2 二维数组的创建 2. 二维数组的初始化 2.1 不完全初始化 2.2 完全初始化 2.3 按照行初始化 2.4 初始化时能省略行,但不能省略列 3. 二维数组的使用 3.1 二维数组下标 3.2 二维数组…

docker下载ridis

1、执行 docker pull redis:4.0.1 命令,下载 redis 镜像 (需确保装有并启动bocker) 通过docker启动redis 分配端口和端口映射 密码等 rootiZf8z985hmyc9bkejcfmqrZ:~# docker run --rm -d --name redis6379 -p 6379:6379 redis:4.0.1 --req…

外观模式(大话设计模式)C/C++版本

外观模式 C #include <iostream> using namespace std;class stock1 { public:void Sell(){cout << "股票1卖出" << endl;}void Buy(){cout << "股票1买入" << endl;} };class stock2 { public:void Sell(){cout << …

动态IP掉线该怎么解决?

动态IP可以说是做爬虫、采集数据、搜集热门商品信息中必备的代理工具&#xff0c;但在爬虫的使用中&#xff0c;总是会遇到动态IP掉线的情况&#xff0c;从而影响使用效率&#xff0c;本文将探讨动态IP代理掉线的几种常见原因&#xff0c;并提供解决方法&#xff0c;以帮助大家…

MSPM0L1306快速创建可移动工程(一)

设置成文本文件 宏定义 __MSPM0L1306__

CSS概述

CSS是一种样式表语言&#xff0c;用于为HTML文档控制外观&#xff0c;定义布局。例如&#xff0c; CSS涉及字体、颜色、边距、高度、宽度、背景图像、高级定位等方面 。 ● 可将页面的内容与表现形式分离&#xff0c;页面内容存放在HTML文档中&#xff0c;而用 于定义表现形式…

力扣136. 只出现一次的数字

Problem: 136. 只出现一次的数字 文章目录 题目描述思路复杂度Code 题目描述 思路 由于题目要求使用线性时间复杂度和常量级的空间复杂度&#xff0c;再加上找重复元素这个特性&#xff0c;我们可以想到使用位运算来求解&#xff1a; 1.任何数与其本身异或得0&#xff0c;任何…

仅1.6万元,100%源码交付企业级开源 AIoT 物联网平台,可视化Web组态大屏,二次开发项目...

100%源码交付&#xff0c;文末联系小编 01 AIoT 物联网平台 千丝物芯是一个简单易用的适合中小企业和个人使用的物联网平台&#xff0c;系统运行采用前后端分离&#xff0c;分别运行java后端和vue前端&#xff0c;项目依赖Mysql、Redis和Emqx消息服务器。 兼容多种传感器 支持百…

[大模型]XVERSE-MoE-A4.2B Transformers 部署调用

XVERSE-MoE-A4.2B介绍 XVERSE-MoE-A4.2B 是由深圳元象科技自主研发的支持多语言的大语言模型&#xff08;Large Language Model&#xff09;&#xff0c;使用混合专家模型&#xff08;MoE&#xff0c;Mixture-of-experts&#xff09;架构&#xff0c;模型的总参数规模为 258 亿…

时机:产品成功的关键因子

在商业世界里&#xff0c;产品成功与否往往与许多因素有关&#xff1a;优秀的创意、强大的团队、充足的资金等。然而&#xff0c;在这些因素之外&#xff0c;一个常被忽视但至关重要的因素就是“时机”。正如古语所言&#xff1a;“人为可做&#xff0c;天时难造”&#xff0c;…

【idea】解决springboot项目中遇到的问题

一、Maven报错Could not find artifact com.mysql:mysql-connector-j:pom:unknown in aliyunmaven解决及分析 报错 创建springboot项目&#xff0c;勾选数据库驱动&#xff0c;springboot版本为3&#xff0c;现在改成了2.7.2&#xff0c;Maven就发生了报错Could not find art…

计算机组成原理历年考研真题对应知识点(计算机系统层次结构)

目录 1.2计算机系统层次结构 1.2.2计算机硬件 【命题追踪——冯诺依曼计算机的特点(2019)】 【命题追踪——MAR 和 MDR 位数的概念和计算(2010、2011)】 1.2.3计算机软件 【命题追踪——三种机器语言的特点(2015)】 【命题追踪——各种翻译程序的概念(2016)】 1.2.5计算…

文章MSM_metagenomics(五):共现分析

欢迎大家关注全网生信学习者系列&#xff1a; WX公zhong号&#xff1a;生信学习者Xiao hong书&#xff1a;生信学习者知hu&#xff1a;生信学习者CDSN&#xff1a;生信学习者2 介绍 本教程是使用一个Python脚本来分析多种微生物&#xff08;即strains, species, genus等&…

享元和代理模式

文章目录 享元模式1.引出享元模式1.展示网站项目需求2.传统方案解决3.问题分析 2.享元模式1.基本介绍2.原理类图3.外部状态和内部状态4.类图5.代码实现1.AbsWebSite.java 抽象的网站2.ConcreteWebSite.java 具体的网站&#xff0c;type属性是内部状态3.WebSiteFactory.java 网站…

Tensorflow-GPU工具包了解和详细安装方法

目录 基础知识信息了解 显卡算力 CUDA兼容 Tensorflow gpu安装 CUDA/cuDNN匹配和下载 查看Conda driver的版本 下载CUDA工具包 查看对应cuDNN版本 下载cuDNN加速库 CUDA/cuDNN安装 CUDA安装方法 cuDNN加速库安装 配置CUDA/cuDNN环境变量 配置环境变量 核验是否安…

后端开发中缓存的作用以及基于Spring框架演示实现缓存

缓存的作用及演示 现在我们使用的程序都是通过去数据库里拿数据然后展示的 长期对数据库进行数据访问 这样数据库的压力会越来越大 数据库扛不住了 创建了一个新的区域 程序访问去缓存 缓存区数据库 缓存里放数据 有效降低数据访问的压力 我们首先进行一个演示 为了演示…

Python 全栈系列253 再梳理flask-celery的搭建

说明 最近做了几个实验&#xff0c;将结论梳理一下&#xff0c;方便以后翻看。 1 flask-celery 主要用于数据流的同步任务&#xff0c;其执行由flask-aps发起&#xff0c;基于IO并发的方法&#xff0c;达到资源的高效利用&#xff0c;满足业务上的需求。2 目前部署环境有算网…

餐厅点餐系统的设计

管理员账户功能包括&#xff1a;系统首页&#xff0c;个人中心&#xff0c;管理员管理&#xff0c;商品管理&#xff0c;用户管理&#xff0c;店家管理&#xff0c;广告管理 店家账户功能包括&#xff1a;系统首页&#xff0c;个人中心&#xff0c;商品管理&#xff0c;广告管…

基于System-Verilog的流水灯设计与仿真

文章目录 一、system Verilog1.语言基本介绍2.过程赋值和连续赋值 二、编写testbench仿真1.流水灯testbench2.2位全加器3.实验结果 一、system Verilog 1.语言基本介绍 像 Verilog 和 VHDL 之类的硬件描述语言 (HDL) 主要用于描述硬件行为&#xff0c;以便将其转换为由组合门…