你是如何召唤苹果手机的语音助手Siri的?
已经12岁高龄的Siri,它主要提供了三个类型的“辅助功能”。
1、调动声音、闹钟、备忘录等系统基础应用的控制能力。比如:Hi Siri,明早两点我有个2亿美金的合同要签,记得提醒我。
2、调用第三方软件。比如:Hi Siri,发微信给林志玲,我想约他一起看《热烈》。
3、联网搜索:比如:Hi Siri,今天晚饭想简单点,帮我看看,澳洲香槟蟹怎么做好吃?
Siri自诞生以来就被贴上了智能语音助理的标签,但它的定义更应该是自然语义处理工具,仅具有语音识别和语义理解能力,然后把理解的指令去调用手机应用。
说实话,Siri的功能挺鸡肋,会用,但频率不高。
ChatGPT+Siri,会不会等于钢铁侠的贾维斯?或者士官长的科塔娜?
这个答案是肯定的,大语言模型的加持势必会让第一代AI助理,包括像苹果Siri、微软Cortana、亚马逊Alexa、GoogleAssistant等,带来一次巨大的性能飞跃。
更好的自然语言的理解处理和推理反馈,加上语音识别,这才是人们梦寐以求的AI语音助理!
说到AI语音助理,第一想到的肯定是Siri,实际上,每个手机品牌都有自己的语音助理,小米的小爱同学,华为的小艺,三星的Bixby。
今天,我们就来看看,在这一次的AI浪潮里,这些手机厂商们会如何升级语音助手这个功能。
01
苹果:在考虑,别急
Siri进入苹果生态是在iPhone4S的发布会上,那是2011年。在当时的介绍视频里,Siri的介绍时间占据了影片20%的时长,充分展示了Siri强大的助理能力以及在当时十分前卫的交互操作。
10年过去了,iPhone更换了好几部,Siri还是那个Siri……
Siri会拥抱大语言模型吗?过去一年,公众对苹果进军这一领域充满期待,但苹果的表现却极其谨慎,以至于被认为是落伍了。
最近,《华尔街日报》等媒体透露,苹果已经建立了自己的大语言模型框架“Ajax”,并已经将其应用在地图、Siri等功能上。苹果还基于Ajax创建了一个聊天机器人服务,一些工程师称之为“苹果GPT”,类似于ChatGPT。
因而,我们有理由相信,Siri的大升级肯定会来,但又不会太快。从苹果少之又少的介绍中就能看出一二。当然,这也不难理解,相比于一些创业公司的激进做法,比如向公众开放Beta测试版之类,苹果要慎重得多,在面向市场阶段,他们会更希望提供一个可靠和稳定的版本。
02
三星:在研究了!我们考虑得相当充分
三星的语音助手是Bixby,诞生于2017年。三星有没有想让它拥有ChatGPT的能力?答案是肯定的。
7月,三星副总裁兼全球产品规划总监 Junho Park 提到了生成式 AI 技术的发展,他暗示 Bixby 将获得生成式人工智能功能。但是,三星到底会如何提升Bixby的功能?在这一点上三星同样表现得非常谨慎,鲜有相关的计划和内容披露。
非常有意思的一点是,与手机相比,科幻电影里人类助理的交互方式更适合的硬件或许是耳机。Junho Park说,“无线耳机是一种很好的沟通方式。它不需要任何屏幕,因此是生成人工智能的好地方。”
可以确定的是,三星正在积极探索将生成式人工智能融入其 Galaxy 产品的方法。这不仅包括智能手机,还包括智能手表、耳机、平板电脑。
03
小米:瞧好了,大招在后面
小米在AI方面的团队人数据说超过了1200人,而雷军在4月份更是发微博说,小米对大模型会全力以赴。小米集团总裁卢伟冰更直接:小爱同学就是小米大模型落地的代表。
小米集团AI实验室主任王斌在最近一次的采访中称,大模型最强的能力,简单来说就是它更理解人,它显然能优化人机交互的方式。小米的小爱同学、手机操作系统MIUI、汽车的座舱、IoT、机器人,都是应用大模型的典型场景。
可以相信的是,小爱同学一定会拥有类ChatGPT的能力!不过,按照王斌的说法,由于天生带着产品属性,小米大模型会跟场景结合得更紧密,它会围绕产品的节奏去做相应的发布规划。
04
华为:搞完了,快来玩
华为手机绝对是一众主流手机厂商里最激进的玩家,在8月份的华为开发者大会上,华为常务董事余承东明确表示,华为的盘古大模型将赋能全新的语音助理小艺。
从介绍看,主要是几方面的能力。
首先是交互,包括基于自然语言理解的设备控制,本机数字内容搜索,对话识别屏幕内容。这些其实与初代助理很相似,但语义理解能力是不是更强,还有待观察。
其次是生产力,小艺可以帮助用户快速摘要、文案内容辅助、图片二次创作等等。在今年 P60 系列的发布会上,对小艺说“找一下去年在公园看烟花的照片”,它就能在图库找到对应照片。而打开一张海报,通过对话就能让小艺直接识别海报中的活动地址,并启动导航到目的地。
另外,直接发送资讯链接、文档给小艺,对它说“这篇核心观点是什么”,它可以快速总结出要点,英文资讯也可以用中文进行摘要。
最后,ChatGPT上最热门的玩法,小艺似乎也可以做到,对着她说:“请写一篇关于大模型技术研讨的会议邀请函”,她就可以生成邀请函。
不得不说,很强大。这几乎就是ChatGPT的语音版本了,当然准确性是否能和ChatGPT一较高下还未可知,但科技感是拉满了。
不过,这些都是发布会展示内容,真正的开放测试将会在8月底,再晚一些,搭载 HarmonyOS 4.0 及以上的部分机型都可以升级该功能。
图片来源:由无界 AI生成
05
当我们迎来AI语音助理后,
还需要手机吗?
2021年,Siri横空出世,它被寄予了厚望。但很快,它就成了用户吐槽对象:确实能辅助用户使用手机,提供操作便利,但它与智能助理之间的差距实在太大了。
十年来,Siri们不尽如人意,但今天,情况很明显有变。语音助手毫无疑问是AI语言大模型的最佳切入口,借助大模型似乎可以把语音助手从“智障”的境地带出来,变成真正的AI语音助理。
它不仅幽默,还会和我们聊天,吐槽。
它甚至可以拥有自己的情感,自己的看法。
最好的是,它肯定会处理很多日常的事务,可以控制各种家用设备……
从苹果、三星、小米到华为,他们都对语音助手投入了很多关注,动作有快有慢,有的激进,有的谨慎。但无论如何,肯定的是,就快要迎来一个更智能的AI语音助理了。
就像人类一直想要飞一样,人类追求AI语音助理的梦也是天生的。它完全就是科技发展的必然品:完成人类语言和机械直接的“沟通”。
然而,手机虽然是实现AI智能助理更聪明的最佳场景,但最后成功的一定是手机品牌吗?AI智能助理可能压根就不需要手机。
巴比特园区开放合作啦!
中文推特:https://twitter.com/8BTC_OFFICIAL
英文推特:https://twitter.com/btcinchina
Discord社区:https://discord.gg/defidao
电报频道:https://t.me/Mute_8btc
电报社区:https://t.me/news_8btc