AI语音助理来了,我们还需要手机吗?

news2024/11/25 21:29:05

0f8c05f2fdb3fb457bed63000f76b5ca.gif

你是如何召唤苹果手机的语音助手Siri的?

已经12岁高龄的Siri,它主要提供了三个类型的“辅助功能”。

1、调动声音、闹钟、备忘录等系统基础应用的控制能力。比如:Hi Siri,明早两点我有个2亿美金的合同要签,记得提醒我。

2、调用第三方软件。比如:Hi Siri,发微信给林志玲,我想约他一起看《热烈》。

3、联网搜索:比如:Hi Siri,今天晚饭想简单点,帮我看看,澳洲香槟蟹怎么做好吃?

Siri自诞生以来就被贴上了智能语音助理的标签,但它的定义更应该是自然语义处理工具,仅具有语音识别和语义理解能力,然后把理解的指令去调用手机应用。

说实话,Siri的功能挺鸡肋,会用,但频率不高。

ChatGPT+Siri,会不会等于钢铁侠的贾维斯?或者士官长的科塔娜?

这个答案是肯定的,大语言模型的加持势必会让第一代AI助理,包括像苹果Siri、微软Cortana、亚马逊Alexa、GoogleAssistant等,带来一次巨大的性能飞跃。

更好的自然语言的理解处理和推理反馈,加上语音识别,这才是人们梦寐以求的AI语音助理!

说到AI语音助理,第一想到的肯定是Siri,实际上,每个手机品牌都有自己的语音助理,小米的小爱同学,华为的小艺,三星的Bixby。

今天,我们就来看看,在这一次的AI浪潮里,这些手机厂商们会如何升级语音助手这个功能。

0b3aff42af31f950e37d5087ef93be43.jpeg

01

苹果:在考虑,别急

Siri进入苹果生态是在iPhone4S的发布会上,那是2011年。在当时的介绍视频里,Siri的介绍时间占据了影片20%的时长,充分展示了Siri强大的助理能力以及在当时十分前卫的交互操作。

10年过去了,iPhone更换了好几部,Siri还是那个Siri……

Siri会拥抱大语言模型吗?过去一年,公众对苹果进军这一领域充满期待,但苹果的表现却极其谨慎,以至于被认为是落伍了。

最近,《华尔街日报》等媒体透露,苹果已经建立了自己的大语言模型框架“Ajax”,并已经将其应用在地图、Siri等功能上。苹果还基于Ajax创建了一个聊天机器人服务,一些工程师称之为“苹果GPT”,类似于ChatGPT。

因而,我们有理由相信,Siri的大升级肯定会来,但又不会太快。从苹果少之又少的介绍中就能看出一二。当然,这也不难理解,相比于一些创业公司的激进做法,比如向公众开放Beta测试版之类,苹果要慎重得多,在面向市场阶段,他们会更希望提供一个可靠和稳定的版本。

02

三星:在研究了!我们考虑得相当充分

三星的语音助手是Bixby,诞生于2017年。三星有没有想让它拥有ChatGPT的能力?答案是肯定的。

7月,三星副总裁兼全球产品规划总监 Junho Park 提到了生成式 AI 技术的发展,他暗示 Bixby 将获得生成式人工智能功能。但是,三星到底会如何提升Bixby的功能?在这一点上三星同样表现得非常谨慎,鲜有相关的计划和内容披露。

非常有意思的一点是,与手机相比,科幻电影里人类助理的交互方式更适合的硬件或许是耳机。Junho Park说,“无线耳机是一种很好的沟通方式。它不需要任何屏幕,因此是生成人工智能的好地方。”

可以确定的是,三星正在积极探索将生成式人工智能融入其 Galaxy 产品的方法。这不仅包括智能手机,还包括智能手表、耳机、平板电脑。

03

小米:瞧好了,大招在后面

小米在AI方面的团队人数据说超过了1200人,而雷军在4月份更是发微博说,小米对大模型会全力以赴。小米集团总裁卢伟冰更直接:小爱同学就是小米大模型落地的代表。

小米集团AI实验室主任王斌在最近一次的采访中称,大模型最强的能力,简单来说就是它更理解人,它显然能优化人机交互的方式。小米的小爱同学、手机操作系统MIUI、汽车的座舱、IoT、机器人,都是应用大模型的典型场景。

可以相信的是,小爱同学一定会拥有类ChatGPT的能力!不过,按照王斌的说法,由于天生带着产品属性,小米大模型会跟场景结合得更紧密,它会围绕产品的节奏去做相应的发布规划。

04

华为:搞完了,快来玩

华为手机绝对是一众主流手机厂商里最激进的玩家,在8月份的华为开发者大会上,华为常务董事余承东明确表示,华为的盘古大模型将赋能全新的语音助理小艺。

从介绍看,主要是几方面的能力。

首先是交互,包括基于自然语言理解的设备控制,本机数字内容搜索,对话识别屏幕内容。这些其实与初代助理很相似,但语义理解能力是不是更强,还有待观察。

其次是生产力,小艺可以帮助用户快速摘要、文案内容辅助、图片二次创作等等。在今年 P60 系列的发布会上,对小艺说“找一下去年在公园看烟花的照片”,它就能在图库找到对应照片。而打开一张海报,通过对话就能让小艺直接识别海报中的活动地址,并启动导航到目的地。

另外,直接发送资讯链接、文档给小艺,对它说“这篇核心观点是什么”,它可以快速总结出要点,英文资讯也可以用中文进行摘要。

最后,ChatGPT上最热门的玩法,小艺似乎也可以做到,对着她说:“请写一篇关于大模型技术研讨的会议邀请函”,她就可以生成邀请函。

不得不说,很强大。这几乎就是ChatGPT的语音版本了,当然准确性是否能和ChatGPT一较高下还未可知,但科技感是拉满了。

不过,这些都是发布会展示内容,真正的开放测试将会在8月底,再晚一些,搭载 HarmonyOS 4.0 及以上的部分机型都可以升级该功能。

dd300b523de75adfd1f6c33b5220a722.jpeg

图片来源:由无界 AI生成

05

当我们迎来AI语音助理后,

还需要手机吗?

2021年,Siri横空出世,它被寄予了厚望。但很快,它就成了用户吐槽对象:确实能辅助用户使用手机,提供操作便利,但它与智能助理之间的差距实在太大了。

十年来,Siri们不尽如人意,但今天,情况很明显有变。语音助手毫无疑问是AI语言大模型的最佳切入口,借助大模型似乎可以把语音助手从“智障”的境地带出来,变成真正的AI语音助理。

它不仅幽默,还会和我们聊天,吐槽。

它甚至可以拥有自己的情感,自己的看法。

最好的是,它肯定会处理很多日常的事务,可以控制各种家用设备……

从苹果、三星、小米到华为,他们都对语音助手投入了很多关注,动作有快有慢,有的激进,有的谨慎。但无论如何,肯定的是,就快要迎来一个更智能的AI语音助理了。

就像人类一直想要飞一样,人类追求AI语音助理的梦也是天生的。它完全就是科技发展的必然品:完成人类语言和机械直接的“沟通”。

然而,手机虽然是实现AI智能助理更聪明的最佳场景,但最后成功的一定是手机品牌吗?AI智能助理可能压根就不需要手机。

巴比特园区开放合作啦!

c1a1a61e0aad64ec36a8579ad995fdbe.png

cc52c7394d1c6939e3048debb1e703d2.jpeg

1a28bc741b38b5f3a3dea2f8a4497c35.gif

中文推特:https://twitter.com/8BTC_OFFICIAL

英文推特:https://twitter.com/btcinchina

Discord社区:https://discord.gg/defidao

电报频道:https://t.me/Mute_8btc

电报社区:https://t.me/news_8btc

1774fad06a94aaa6429ab02e0f4bc4c7.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/867898.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

AT89C51单片机实现单片机串口互动(中断方式,单片机--单片机,应答)

说一下功能:客户机发送0x01到服务机 2服务单片机应答0xf2到客户机 3客户机接收到0xf2,发送信息153432这6个数字到服务机 4client发送完信息后发送0xaa结束通信 5server接收到0xaa后回复0xaa结束通信,从此老死不相往来 看代码: //发送端…

Arraylist集合

保存数据会经常使用到数组,但数组存在以下几个缺陷: 长度固定;保存的必须为同一类型的元素,(基本数据类型,或引用数据类型);使用数组进行增加元素的步骤比较麻烦; 这个时候就需要用一…

24届近3年南京信息工程大学自动化考研院校分析

今天给大家带来的是南京信息工程大学控制考研分析 满满干货~还不快快点赞收藏 一、南京信息工程大学 学校简介 南京信息工程大学位于南京江北新区,是一所以大气科学为特色的全国重点大学,由江苏省人民政府、中华人民共和国教育部、中国气…

【AI理论学习】手把手利用PyTorch实现扩散模型DDPM

手把手利用PyTorch实现扩散模型DDPM DDPM代码实现神经网络定义辅助函数位置嵌入ResNet block注意力模块分组归一化Conditional U-Net 定义前向扩散过程定义PyTorch数据集DataLoader采样训练模型采样后续阅读 参考链接 上一篇博文已经手把手推导了扩散模型DDPM,本文利…

1. 消息队列

消息队列 1.1. MQ 的相关概念 1.1.1. 什么是 MQ MQ(message queue),从字面意思上看,本质是个队列,FIFO 先入先出,只不过队列中存放的内容是message 而已,还是一种跨进程的通信机制,用于上下游传递消息。在…

性能测试—Jmeter工具

文章目录 性能测试1. 术语介绍2. 方法3. 应用场景4. 工具(Jmeter)4.1 介绍4.2 元件和组件4.2.2 元件4.2.1 组件 4.3 作用域4.4 参数化4.5 执行脚本 性能测试 1. 术语介绍 响应时间(Response time):对请求作出响应所需要的时间。 在互联网上对…

Tik Tok娱乐+电商MCN怎么做?

在美国外的热门市场中,TikTok 主要做的区域市场包括中东、拉美、欧洲和东亚,而这里面适合做电商的其实并不多。 欧洲、东亚都属于成熟市场,且 TikTok 本身在欧洲面临 DSA 法案更严格的审查,与在英国相同,欧洲各市场消…

【二分+贪心】CF1622 C

Problem - 1622C - Codeforces 题意: 思路: 首先,观察样例可知,肯定是把原本的最小值减到某个值,然后再复制几次 复制的时候肯定是从大到小复制 那把最小值减到哪个值是不确定的,考虑枚举这个值&#x…

并发编程--------JUC集合

并发集合 一、ConcurrentHashMap 1.1 存储结构 ConcurrentHashMap是线程安全的HashMap ConcurrentHashMap在JDK1.8中是以CASsynchronized实现的线程安全 CAS:在没有hash冲突时(Node要放在数组上时) synchronized:在出现hash…

STM32CubeMX之freeRTOS事件组

当有多个判断,才会执行的时候,就会有事件组 事件组就是24个标志位的组合,或操作或者与操作就可以操作其 例如发射导弹 需要很多人都同意才能发送 V1版本无法自动添加事件组 这里手动创建事件组 这里是基本的使用 置1操作 这里进行事件组的…

初创体验版彩虹知识付费商城源码 V3.4支持二级分类,多级分销,秒杀,砍价,团购,首页继续浏览

最新彩虹知识付费商城初创体验版,支持二级分类,多级分销,秒杀,砍价,团购,首页继续浏览,分站个人虚拟余额自定义,最新批量对接,批量下载图片,批量替换标题&…

工厂物流管理:提升生产效率的关键驱动力

工厂物流管理在现代制造业中扮演着至关重要的角色。它涉及到物料的采购、生产过程中的物料运输和仓储管理,以及最终产品的分发。 1. 定义和重要性: 工厂物流管理是指通过合理规划、组织和控制物流活动,确保物料和产品在生产过程中的高效流动。它的目标是…

【Java多线程学习7】Java线程池技术

线程池技术 一、什么是线程池 线程池顾名思义是管理一组线程的池子。当有任务要处理时,直接从线程池中获取线程来处理,处理完之后线程不会立即销毁,而是等待下一个任务。 二、为什么要使用线程池? 线程池的作用? 1、降低资源…

【大数据】Flink 详解(二):核心篇 Ⅲ

Flink 详解(二):核心篇 Ⅲ 29、Flink 通过什么实现可靠的容错机制? Flink 使用 轻量级分布式快照,设计检查点(checkpoint)实现可靠容错。 30、什么是 Checkpoin 检查点? Checkpoint …

四化智造MES(API)与金蝶云星空对接集成派工作业打通生产订单新增

四化智造MES(API)与金蝶云星空对接集成派工作业打通生产订单新增 对接系统:四化智造MES(API) MES建立统一平台上通过物料防错防错、流程防错、生产统计、异常处理、信息采集和全流程追溯等精益生产和精细化管理&#x…

mybatis如何生成和执行动态sql

文章目录 1. 相关代码2. SQL 语句解析全流程2.1 涉及到的重要类2.2 解析标签2.2.1 \<include>2.2.2 \<selectKey>2.2.3 处理 SQL 语句 3. 获取真正执行的sql 1. 相关代码 package com.boge.mapper;import com.boge.pojo.User;import java.util.List;public interf…

情感资源日记Resource Diary

什么是 Resource Diary &#xff1f; Resource Diary 是自托管的情感资源日记&#xff0c;允许用户跟踪特定任务的情感反应以进行趋势识别。 按照作者的设计&#xff0c;对每个任务&#xff0c;通过 /- 号来表达任务完成后的情绪&#xff0c;等级从 0 到 5 &#xff0c;其中&am…

大语言模型之三 InstructGPT训练过程

大语言模型 GPT历史文章中简介的大语言模型的的发展史&#xff0c;并且简要介绍了大语言模型的训练过程&#xff0c;本篇文章详细阐述训练的细节和相关的算法。 2020年后全球互联网大厂、AI创业公司研发了不少AI超大模型&#xff08;百亿甚至千亿参数&#xff09;&#xff0c;…

2023年中国政务云行业发展概况及发展趋势分析:政务云由基础设施建设向云服务运营转变[图]

政务云是指运用云计算技术&#xff0c;统筹利用已有的机房、计算、存储、网络、安全、应用支撑、信息资源等&#xff0c;发挥云计算虚拟化、高可靠性、高通用性、高可扩展性及快速、按需、弹性服务等特征&#xff0c;为政府行业提供基础设施、支撑软件、应用系统、信息资源、运…

QGIS3.28的二次开发六:VS不借助QT插件创建UI界面

上一篇博客我们说了在VS中如何使用QT插件来创建UI界面&#xff0c;但是我们二次开发QGIS的第一篇博客就说了&#xff0c;最好使用OSGeo4W中自动下载的QT进行QGIS二次开发&#xff0c;这样兼容性是最好的&#xff0c;那么该如何在VS中不使用外部安装的QT以及QT的VS插件情况下进行…