苹果WWDC 2024或将推出AI生成的表情符号并宣布与OpenAI的合作|TodayAI

news2024/9/23 21:20:23

苹果正在为即将到来的WWDC(全球开发者大会)做准备,并将展示其生成式AI技术。根据Mark Gurman在Bloomberg的《Power On》通讯中的报道,苹果将在2024年的WWDC上讲述自己的AI故事,但这可能不会像Google、Microsoft或OpenAI展示的那样具有炫目的功能。

Gurman指出,苹果此次活动可能会推出一些基础的AI功能,例如转录语音备忘录或自动生成的表情符号。同时,苹果还将宣布与OpenAI的传闻中的合作伙伴关系。最近的传闻称,苹果将允许聊天机器人更深入地集成到其操作系统中,而OpenAI的ChatGPT将率先实现这一点。据Gurman透露,苹果正在与Google就类似的集成进行谈判,涉及Google的Gemini。此外,苹果也被传闻正在与Anthropic进行谈判,这些谈判始于OpenAI的“斯嘉丽·约翰逊事件”之前,强调了苹果可能需要不止一个iPhone聊天机器人合作伙伴的原因。

无论这些潜在合作伙伴关系意味着什么,苹果的AI方法显然将专注于实用性。Gurman提到,苹果可能会宣布一个显著的改进——“智能摘要”功能。这项功能将总结错过的短信、通知以及其他如网页、新闻文章、文档、笔记和其他形式的媒体内容。这在处理iOS通知时可能特别有用,因为通知可能会让人感到不堪重负且难以管理。如果仔细观察,这与Microsoft最近宣布的Recall功能略有相似,后者允许用户回顾在计算机上所做的事情。

此外,语音备忘录应用程序也可能会大幅提升AI生成的转录功能。Gurman指出,这对于回顾采访录音是关键,但也可能对学生录制课程以供日后参考非常有用。苹果设备已经有类似的功能,如自动生成的语音邮件转录和视频、音频以及对话的系统级字幕。

据报道,苹果还计划宣布AI驱动的设备内Spotlight搜索改进、Safari的互联网搜索,以及电子邮件和短信的写作建议。公司还可能使用AI来润饰照片并根据用户的短信即时生成表情符号,这类功能似乎总是会给这些公司带来麻烦。例如,Meta的持枪Waluigi AI贴纸或Google的不适当种族多样化的纳粹图片。

Gurman还提到,苹果可能会展示基于自家大型语言模型的更好、更自然的Siri语音,以及在Apple Watch上改进的Siri功能。在可能的情况下,苹果设备将本地完成所有这些工作,但对于复杂任务,它们会将处理转移到苹果自家的基于M2 Ultra的服务器上。总体而言,Gurman表示“在过去一年左右发布的设备”将获得大多数新的设备内AI功能。

除了AI功能外,Gurman称,苹果公司还可能会宣布一个iOS 18功能,允许用户将应用图标更改为不同颜色。目前可以通过iOS的快捷方式应用实现类似功能,但用户可能更欢迎一种更直接的方法。这一功能将是除了即将传闻中的iPhone主屏幕变化之外的又一改进,允许用户随意放置应用图标,而不是iOS强制的自上而下、从左到右的排列。未来可能还会出现更多的定制启动器。

苹果的全球开发者大会(WWDC)将于6月10日开幕,届时通常会发布iPhone和其他产品的新软件更新。无论苹果计划如何将更多AI功能引入iPhone,我们很可能会在那时听到相关消息。只有苹果知道iPhone及其其他产品的未来。但与此同时,这里有一些我们现在在新款iPhone上最喜欢的基于AI的功能。


 

数字化复制你的声音

苹果可能没有聊天机器人,但它已经在去年随iOS 17推出的一个功能中使用了AI。个人语音(Personal Voice)是一个辅助功能设置,使用设备内的机器学习,允许有语言丧失风险的人复制他们的声音,以便更容易与亲人沟通。为了学习你的声音,iPhone会要求你朗读150个短语。然后它使用AI分析你的声音并生成一个合成版本。要使用这种新合成的声音进行交流,你可以使用iPhone的文字转语音工具,将文本转换为语音,在FaceTime和第三方兼容应用中使用。如果你有兴趣了解如何在iPhone上克隆和存储你的声音,这里有一个分步指南。

轻松从iPhone图片中复制文本

实况文本(Live Text)是一个已经在运行iOS 15或更高版本的iPhone上可用的前端AI功能。这是一个计算机视觉工具,可以识别照片中的手写和打印文本,就像Google Lens一样。然后,可以通过简单的点击将图片中的文本复制和粘贴。实况文本在日常生活中常常派上用场。比如,你有一个手写的食谱想要数字化。在用iPhone拍摄该食谱的照片后,你可以将该文本复制并粘贴到Word文档中,作为数字备份。这里有一个详细的分步指南,教你如何做到这一点。竞争对手的手机制造商也加入了这个行列。Honor的Magic 6 Pro和Magic V2,它们运行公司的Magic OS 8软件,引入了具有类似功能的Magic Text功能。

改进的自动纠错

通过最新的软件更新,苹果还解决了一个最大的自动纠错问题。现在你可以轻松地使用脏话,而不会被苹果自动更改为诸如“duck”或“shut”之类的更温和的词。除了允许你轻松使用脏话外,自动纠错在更广泛的层面上也得到了改进。自动纠错现在可以更准确地修正错误,并提供更多定制的内联预测文本。苹果将这一改进归功于iOS 17的新变压器语言模型,该模型使用机器学习进行词语预测。它通过大量数据训练,能够学习上下文和模式,从而提供改进的结果,或者在这种情况下,能够复制人类的语音风格。

摄影智能

众所周知,iPhone依赖先进的算法以及计算摄影来实现大量相机功能。人像模式使用AI识别主体并创建散景效果,这是一个例子。另一个例子是电影效果模式,它使用AI模拟所需的光圈并动态调整焦点,以保持移动主体的清晰。iOS 17带来的新AI驱动功能之一是照片应用能够识别照片中的宠物,从而实现更好的照片组织。

未来的iPhone AI:Siri会变得更智能吗?

Siri自2011年以来一直存在,但即使它是市场上的第一个虚拟助手,也未能跟上竞争对手的步伐。然而,苹果的语音激活助手可能很快会变得更智能。据《信息报》9月的一份报告称,苹果计划使用大型语言模型(生成式AI的关键部分)来增强Siri。该文章中提到的一个例子解释了Siri如何能够响应简单的语音命令来完成更复杂的任务,例如将一组照片转换为GIF并发送给你的一个联系人。如果这一例子准确无误,这将代表苹果数字助手的一个重大进步。苹果已经使用AI来帮助Siri理解语言并以人类方式回应等,但它在处理上下文方面仍然存在困难。

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1701669.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

全球前五!ATFX 2024年Q1业绩狂飙,6240亿美元交易量彰显实力

5月,密集发布的报告显示,强者恒强是差价合约行业不变的竞争逻辑。而ATFX最新展现的业绩无疑是这一逻辑的有力例证。依照惯例,知名行业媒体Finance Magnates日前公布了全球经纪商最为关注的2024年第一季度行业报告。报告数据显示,A…

智慧校园建设规划方案

在信息化浪潮的推动下,智慧校园的建设已成为教育现代化的必然趋势。以创新科技赋能教育,打造智慧校园,旨在提升教学品质,优化管理流程,增强学生体验。构建智慧校园需要具有前瞻性的规划方案,它将以教育为核…

LLM 大模型学习必知必会系列(十二):VLLM性能飞跃部署实践:从推理加速到高效部署的全方位优化[更多内容:XInference/FastChat等框架]

LLM 大模型学习必知必会系列(十二):VLLM性能飞跃部署实践:从推理加速到高效部署的全方位优化[更多内容:XInference/FastChat等框架] 训练后的模型会用于推理或者部署。推理即使用模型用输入获得输出的过程,部署是将模型发布到恒定…

用友电子凭证解决方案,加速企业电子凭证全链路管理

2023年,财政部等9部委联合推进电子凭证数据标准及试点工作,目前逐步扩大试点范围,覆盖市场应用高频的9类凭证。2024年,财政部办公厅发布了《关于继续开展电子凭证会计数据标准深化试点工作的通知》对电子凭证进行全流程常态化处理…

google浏览器下载和相应驱动下载

1、chromedriver 115及115之后版本下载地址: https://googlechromelabs.github.io/chrome-for-testing/ 2、chromedriver 115之前版本下载地址(已停止更新115及之后版本): http://chromedriver.storage.googleapis.com/index.html…

前端开发工程师——数据可视化

canvas canvas绘制线段 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta http-equiv"X-UA-Compatible" content"IEedge"><meta name"viewport" content"widthd…

数据结构(五)队列

文章目录 一、概念二、逻辑结构&#xff1a;线性结构三、存储结构&#xff08;一&#xff09;顺序队列&#xff08;二&#xff09;循环队列1. 结构体定义2. 创建队列&#xff08;1&#xff09;函数定义&#xff08;2&#xff09;注意点&#xff08;3&#xff09;代码实现 3. 入…

抖音小店三种快速出体验分的方式,看看你想要去做哪一种?

大家好&#xff0c;我是电商小V 很多小伙伴开的新店都是没有体验分的&#xff0c;大家都知道起店的第一步就是先要出分&#xff0c;后期的话自己店铺的体验分越高&#xff0c;那么店铺的权重就越大&#xff0c;你的商品就会进入自然流量池&#xff0c;那么系统给你推荐的流量就…

echarts图表英文状态下图标的横向坐标轴显示中文

解决方法&#xff1a; 初始化图表时传入ZH(中文&#xff09;EN(英文)const locale ENinitChart() {this.chart echarts.init(this.$refs.chart, null, {locale: locale ,});this.setOptions();},

如何解决图纸加密的痛点

在当今信息高度发达的时代&#xff0c;图纸作为工程设计、制造、施工等领域的重要载体&#xff0c;其安全性显得尤为关键。然而&#xff0c;图纸加密却常常面临着诸多痛点&#xff0c;这些痛点不仅影响了企业的数据安全&#xff0c;也制约了行业的健康发展。 图纸加密的复杂性是…

深度解析:从概念到变革——Transformer大模型的前世今生以及大模型预备知识讲解[知存科技]

深度解析&#xff1a;从概念到变革——Transformer大模型的前世今生 点击&#xff1a;知存科技相关课程推荐 知存科技是全球领先的存内计算芯片企业。针对AI应用场景&#xff0c;在全球率先商业化量产基于存内计算技术的神经网络芯片。凭借颠覆性的技术创新&#xff0c;知存科…

微信公众号怎么做留言板功能

在繁忙的都市生活中&#xff0c;你是否常常感到孤单、渴望有一个可以倾诉心声的地方&#xff1f;今天&#xff0c;我要为大家介绍一个特别的角落——我们公众号的留言板功能。它不仅是一个留言板&#xff0c;更是一个情感交流的平台&#xff0c;一个可以让我们彼此心灵相通的桥…

论文阅读--GroupViT

视觉之前做无监督分割的时候&#xff0c;经常使用grouping方法&#xff1a;如果有一些聚类的中心点&#xff0c;从这写点开始发散&#xff0c;把周围相似的点逐渐扩充成一个group&#xff0c;这个group就相当是一个segmentation mask 右边是grouping block&#xff0c;左边的两…

【外汇天眼】市场如战场:交易中的攻防艺术

交易的成功如同生活&#xff0c;急功近利反而有害无益。在交易中&#xff0c;许多投资者常常面临亏损&#xff0c;急于挽回损失&#xff0c;频繁操作&#xff0c;结果却往往是越亏越多。交易需要耐心&#xff0c;不能急于一时&#xff0c;更不能与市场赌气。交易和生活一样&…

本周日晚8点预约宣讲会 | 深入了解项目,开启你的开源之旅!

引言 社区的亲爱的同学们&#xff01;为了帮助大家在这个夏天更好的参加“开源之夏”的活动&#xff0c;我们联合2位资深开源项目导师&#xff0c;给大家策划了这次“开源之夏”宣讲会。 这不仅是一个了解如何参与开源项目的机会&#xff0c;更是一个直接与项目导师面对面交流…

利用显著地面特征进行配送机器人定位的鲁棒方法

论文&#xff1a;Salience-guided Ground Factor for Robust Localization of Delivery Robots in Complex Urban Environments 作者&#xff1a;Jooyong Park&#xff0c;Jungwoo Lee&#xff0c;Euncheol Choi&#xff0c;Younggun Cho 收录&#xff1a;ICRA2024 利用显著…

AI大模型探索之路-实战篇4:深入DB-GPT数据应用开发框架调研

目录 前言一、DB-GPT总体概述二、DB-GPT关键特性1、私域问答&数据处理&RAG2、多数据源&GBI3、多模型管理4、自动化微调5、Data-Driven Multi-Agents&Plugins6、隐私安全 三、服务器资源准备1、创建实例2、打开jupyterLab 四、DB-GPT启动1、激活 conda 环境2、切…

mysql5.7允许root远程访问

mysql客户端工具配置完成后&#xff0c;测试联通失败&#xff0c;客户端真正连接mysql时&#xff0c;也报错不允许rootip连接。 这是由于mysql的root用户默认禁止远程访问&#xff0c;可以通过两种方式改表或者授权的方式开启远程访问。本文中使用改表的方法。按照如下操作即可…

如何让大模型更聪明?提升AI智能的关键策略

如何让大模型更聪明&#xff1f;提升AI智能的关键策略 &#x1f916; 如何让大模型更聪明&#xff1f;提升AI智能的关键策略摘要引言方向一&#xff1a;算法创新&#x1f680;1.1 自监督学习的崛起1.2 强化学习的应用 方向二&#xff1a;数据质量与多样性&#x1f4ca;2.1 数据…

【EVI】Hume AI 初探

写在前面的话 Hume AI宣布已在B轮融资中筹集5000万美元&#xff0c;由前Google DeepMind研究员Alan Cowen创立并担任CEO。该AI模型专注于理解人类情感&#xff0c;并发布了「共情语音界面」演示&#xff0c;通过语音对话实现互动。从 Hume AI 官网展示的信息&#xff0c;EVI 能…