小布助手,身入大千世界

news2024/12/24 21:33:51

c0b56f9f27f7ebc9f9551162e7e4ce3d.jpeg

在2018年—2019年,AI智能助手一度火热,成了科技行业的全新风口。智能音箱与手机中,我们能看到各种各样的智能助手横空出世,一度成为产品标配。

但随着时间缓缓冲刷,就像所有科技风口一样,有的AI智能助手随着产品、品牌的洗牌而悄无声息,也有的逐渐成为用户习惯的一部分,归于平淡。我们已经默认了AI智能助手在我们身边的价值,同时也默认了它的边界。

故事就这样结束了吗?

值得庆幸的是,并非如此。AI技术的持续升级,为AI智能助手的产品创新、功能提升带来了机会。而智能家居、数智人、元宇宙等新风口,为AI智能助手带来了新的应用场景。只是这些机会不再是短平快的,而是需要坚持长期主义去不断打破边界,步步为营,涓滴成海。

今昔对比,我们确实会发现有的AI智能助手消声匿迹,隐去身形;但也有的从无形中走出,获得更广袤空间中的具身——比如说,小布助手。

在不久之前举行的OPPO INNO DAY 2022中,OPPO发布行业首款服务于个人和家庭的具身助手类产品“小布家庭机器人”。这是小布助手第一次超越了产品边界,以更多样化的形式与用户见面。不仅如此,我们还可以看到最近一段时间小布助手频频发力,从被动唤醒到主动建议,从数智技术到超写实数字人。这些能力证明,AI智能助手并没有进入瓶颈,反而开始厚积薄发,发挥出超越AI智能助手的价值。

我们一起回溯一下,小布助手究竟是如何把这条路走通的。这是一条化被动为主动之路,一条由无形向具身之路,一条由AI通往大千世界的旅程。

f741a787ffd9d902615fdc8577d1f9ea.png

炼脑:小布助手的AI能力积累

距离小布助手发布至今,已经过去了四年。如果我们从因果律上来讨论,小布助手之所以能在四年后的今天不断向上发力,而不像很多同类产品那样悄无声息。最为核心的原因,在于OPPO对技术进化的长期主义态度。

在AI智能助手的创生期,各个厂商可谓争奇斗艳,而在数年之后,技术升级趋向放缓。但这种思路有个显著的问题:AI技术是一种长期技术。算法的持续升级、迭代,机器学习吸收更大体量数据,都将为用户带来更好的AI体验。

这种情况下,OPPO选择了更长远,也更符合技术本质的AI智能助手发展模式。在四年里,我们可以看到小布从来没有停下炼脑。在坚持研发投入的情况下,小布助手积累了海量交互数据、算法模型得到持续进化。为了辅助算法体验,OPPO还为其构建了更强大的云端算力,以及端云融合的机器学习系统、满足用户情感交互需求的情感引擎。四年累计不断的“炼脑”,是小布助手可以不断构建差异化,并最终走上更大舞台的底座。小布助手的AI能力积累,可以分为三个部分。

1.端云融合能力作为保障:端云融合的机器学习系统StarFire,搭配强大的云端算力,让小布助手有充沛的算力进行AI升级,不断吸收有效数据,提升算法精度。

2e668c011b18954943537f6bf5ecdb21.png

2.AI核心算法的持续升级:多模态交互、语音理解、情感分析能核心算法提升,让小布助手技术不断优化,为用户带来全双工、可见可说、一句话多指令、多模态情感交互等新功能,整体智能体验更加自然。

3.个性化解决方案的构建:四年间,小布助手申请了辅助用户完成操作指令的手机沉浸式交互智能助手、基于句式识别+意图映射的快速文本分类技术等数十项专利,具有独立知识产权的技术方案,保障了小布助手在多方面的独特性。

截至2020年12月31日,OPPO在AI领域的全球专利申请超过2400件,主要布局在计算机视觉、语音技术、自然语言处理、机器学习等方面。OPPO的AI能力,在中文语言理解测评基准(CLUE)总排行榜位列第五、成功问鼎百度千言文本相似度行业测评、获得百度千言情感分析行业第一、小布助手获中国信通院“可信AI”评估证书。长期、广泛的AI技术投入,为小布助手奠定了不断“炼脑”的基础。

667bae8059777e774e72934f9fae7e65.png

当算力、算法、数据等等因素累积到一定程度后,量变就会引发多米诺式的质变。

进化:变被动为主动的服务模式

46d8edd859a3a7e3a40d915afe5d5063.png

小布助手的蜕变逻辑,就是要与这个世界产生更为紧密的联系。从手机中你问我答的“工具”,变成主动帮助用户,为用户提供价值的朋友;变成更多场景、更多产品模式的驱动力。或许我们可以说,传统AI智能助手的边界之外,才是小布所瞄准的大千世界。

这条路的第一步,就是要在手机智能助手这个岗位上贡献更多。

小布助手的一个关键变化就是实现了从被动到主动的智能进化。早在2021年,小布建议这种让智能助手根据用户习惯与用户场景,整理各个APP功能的模式就已经上线。到了今年,这项能力持续升级。小布建议的主动建议能力实现了升级。小布助手正式上线了“小布建议卡片”,OPPO也随之成为首家发布主动建议“场景服务聚合卡片”的手机厂商。

4bf05c053093454e8832f55b32d359d3.png

相比智能助手传统的服务模式,主动服务的小布不需要用户想到之后再一问一答。而是可以根据用户所处场景与时间进行功能整合。

比如在旅行场景,小布建议可以为行前、行中、行后的用户提供不同类型的信息服务,并将这些服务聚合在同一张建议卡片上。用户无需频繁跳转、切换,就可以一键命令小布做好所需事项。根据目的地的不同,小布建议会将经典、美食等一系列吃喝玩乐信息进行主动智能推荐,帮助用户在出行前制定好清晰的游玩计划。并且,小布还会根据不同人群、不同假期的特点,给出不同的建议内容,真正体现出“千人千面”的服务特点。举例来看,在国庆假期这样的长假,小布建议就会根据用户是否出行,给出长途游玩建议或者周边游、市内游的差异化建议。如果有出行需求,那么小布建议会针对性地推荐亲子游、露营等更加契合相关人群的出行建议。

如今,小布建议在出行、起居、用机等方面都有了完善的体验。AI助手的价值,也不再仅仅停留在语音交互与信息流推荐两个方面,而是更深度整合了手机功能与用户需求、应用场景,让小布的智能能力成为交互中心,构建可以主动服务用户的智能体。

5d701410d455452199172239e35e0020.png

化身:由无形到具身的场景落地

小布独特的AI之路,第二步就是要跳出传统的应用界限,去更广袤的场景中发挥价值。当小布储备的数据、技术,乃至端云算力配合方式足够充分,小布本身就会变成差异化价值的聚合体。这样的小布助手,自然也可以成为更多产品的解决方案。

比如说,小布可以跳出手机,在机器人中发挥价值。在今年INNO DAY上小布正式对外发布“小布家庭机器人”,这是小布助手首次推出实体产品。小布也借着这次机会,获得了AI科学中经常讨论的具身价值。

从无形到具身,可以让小布助手更直接、生动地与用户进行交流,完成大量手机难以完成的功能与服务。比如小布家庭机器人,就专门面向老人、儿童,以及需要照顾的人,提供不打扰、无障碍、有温度的陪伴。小布家庭机器人,具备多模态交互与多场景服务能力,可以实现全双工语音免唤醒交互,并且主动识别用户情绪进行响应。除此之外,小布助手还可以带来视觉交互、触碰交互、行为交互、环境交互等能力,带来超过手机界限的服务价值,让不方便使用手机的用户感受到智能家居带来的帮助与温暖。

6083b6e6e2186e24fc392034b891fa57.png

小布家庭机器人有着多种能力。比如说可以基于人脸识别、语义理解、意图识别等AI能力,为老年人提供主动健康提醒、心率检测等健康能力;还可以基于人脸识别,主动找到需要接听电话的家庭成员,从而提供远程通信服务;同时还能够基于语义理解等技术,为家庭成员提供出门提醒、日期提醒、智能家居控制等居家陪伴能力。

d6ac941aa24a5c38711c14ed8f19e168.png

另一个小布跳出边界的方向,是走向数智人这一产业风口。经过不断推出数智人迭代,进行长期布局,小布最新推出了小布超写实数字人。这款数字人具有顶级的仿真程度,让小布在AI领域积累的“脑力”,可以更自然、亲和完成交互。

在超写实数字人方面,实时化的分布式渲染是关键。渲染需要消耗大量资源,因此调用云端算力是更好选择。但为了不让用户感觉出数字人丢帧、卡顿等问题,就需要实时化、分布式的云渲染来支撑,最大化提升数字人交互体验。小布在AI领域积累的端云协同能力,在云渲染领域又一次得到了激发。底座技术的长期储备,让小布永远向更多场景、更多产品输出“化身”的可能。

f66f97ff53019c31ec56e5cfa0f83160.png

主动与具身:向大千世界智能进化

a3eef860b721d8f640ac1a9ad5b4ab70.png

AI智能助手的边界在哪里?这个问题,可能需要AI行业与终端行业共同来进行一个重新思考。

从逻辑上来说,AI语音能力的想象空间非常丰富。语言交互是人类最熟悉,同时承载功能最多的交互方式。一款交互能力可观,对话体验优异的智能助手,完全有实力成为大量价值的底层驱动力。储备技术,长期发展,然后在适当的契机踏出边界,这就是小布助手在这条智能之路的独特走法。

从结果上看,小布助手已经打破了手机智能助手的界限,成为了新的业务支点与全场景产品基座。具体来看,它在三重意义上,打破了固往的产品边界:

1.以更多方式进行AI技术转化。突破了AI技术局限在信息流、问题服务的能力界限。

2.主动服务,增强了应用生态和开发者的触达能力。突破了智能助手的体验边界。

3.通过机器人、数智人等方式,延展了智能助手的产品形态和商业场景。突破了智能助手在终端品牌体系中的价值边界。

打破边界的小布,正迎来一个广阔的可能性。围墙之外,是大千世界。

3cd80cb0d54a48c2bf2ef1dd5022cd81.gif

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/111901.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

一种非侵入式幂等性的Java实现

今天我们来谈谈什么是幂等性? 引用百度百科的解析如下: 幂等(idempotent、idempotence)是一个数学与计算机学概念,常见于抽象代数中。 在编程中一个幂等操作的特点是其任意多次执行所产生的影响均与一次执行的影响相同…

3ds Max:标准几何体

三维软件中一般有许多非常复杂的命令,能够完成非常复杂的图形运算,但其实许多绚丽的图形也是由最基本的几何体构成,许多复杂的命令也是基本的运算程序的集合,就像是砖块,构成了复杂的大厦。任何一个几何体,…

【QGIS入门实战精品教程】3.4:QGIS创建、连接、打包GeoPackage数据库及数据入库案例详解

GeoPackage(以下简称gpkg),内部使用SQLite实现的一种单文件、与操作系统无关的地理数据库。在QGIS中可以很方便的实现GeoPackage的创建与连接等操作。 文章目录 一、QGIS创建GeoPackage1. 创建数据库2. 数据入库二、矢量数据打包为GeoPackage1. 加载shp文件2. 使用QGIS打包图…

微信键盘好用吗?

相信大家在手机上已经安装了一款自己比较熟练使用地输入法,最近微信推出了微信键盘,作为一名产品经理,当然不能错过试用它,我在第一时间下载进行了使用, 下面是我使用了几天的感受,与大家分享一下。 一、体…

2023年5大网络安全趋势加速发展

©网络研究院 Netwrix发布了2023年将影响各种规模组织的关键网络安全趋势。以下是你需要注意的五个具体趋势: 网络犯罪的业务将进一步专业化 Emotet、Conti和Trickbot等恶意软件的回归表明网络雇佣犯罪的扩张。特别是,勒索软件即服务的增长使没有深厚技术技能…

VSCode 最全实用插件

一、必备插件 🌾Chinese(中文) Settings Sync(配置同步到云端) 可以让我们的vscode配置同步到云端,当我们跟换电脑或者再次安装vscode的时候,只需要登录账号即可同步配置了 wakatime&#xf…

Linux_日志

1.日志的介绍 1.日志文件是重要的系统信息文件 ,其中记录了许多重要的系统事件,包括用户的登录信息、系统的 启动信息、系统的安全信息、邮件相关信息、各种服务相关信息等。 2.日志对于安全来说也很重要 ,它记录了系统每天发生的各种事情,通过日志来检查错误发生的…

Golang 【basic_leaming】3 流程控制

阅读目录Go 语言 if else (条件判断)Go 语言 if else 条件判断代码示例if 的特殊写法Go 语言 for(循环)for 循环 - 初始语句for 循环 - 条件表达式1 更美观的死循环写法2 只有一个条件的 for 循环for 循环 - 结束语句Go 语言 for range (键值循环)for ra…

前端自动化测试精讲

单元测试 端对端测试 持续集成方案,在项目中落地前端自动化测试 作者介绍 祯民,字节跳动前端开发工程师,掘金小册《SSR实战:官网开发指南》作者,公众号「祯民讲前端」作者。曾负责 抖音前端技术团队官网 和 字节官网…

RV1126笔记十二:实现RTMP单路拉流

若该文为原创文章,转载请注明原文出处。 一、介绍 相比推流,拉流就简单了一点,只需要连接RTMP服务器,获取流,把数据解码出来显示和播放就可以,使用的是易百纳板子,测试时音频输出是不正常的,所以只解析了视数据,不处理音频。如果想测试音频,建议用其他开发板,正点…

TikTok 加速团结独立站,跨境电商的又一次红利期?

TikTok近年来在国际上非常流行。2021年8月,TikTok的全球下载量首次超过Facebook,成为全球最大的下载量。TikTok的诞生打破了海外社交媒体的垄断,TikTok营销成为许多跨境卖家的重点之一。 封号事件发生后,许多跨境卖家开始向独立站…

我的周刊(第071期)

我的信息周刊,记录这周我看到的有价值的信息,主要针对计算机领域,内容主题极大程度被我个人喜好主导。这个项目核心目的在于记录让自己有印象的信息做一个留存以及共享。🎯 项目Free-TVUrl-Merge[1]免费 TvBox 影视站聚合&#xf…

H7068 DIGITAL SYSTEMS AND MICROPROCESSOR DESIGN: COURSEWORK 2022 verilog-仿真

内容: 给cpubank写testbench: 1.the testbench have test a variety of operations the sequence described: i) Reset: The test bench should first reset the register bank. The reset is synchronous. It should also set rrd1, rrd2, d, rwr, rwren to zero. ii) Stor…

自然语言处理NLP——图神经网络与图注意力模型(GNN、GCN、GAT)

目录 系列文章目录 一、图神经网络 1.图与图嵌入 2.GNN动机 2.1 CNN的缺陷与非结构性数据 2.2 图嵌入的缺陷 3.GNN详解 3.1 GNN简介 3.2 GNN模型 3.3 GNN框架 3.4 GNN局限与优化 二、图卷积神经网络 1.卷积 2.GCN详解 2.1 GCN动机 2.2 GCN简介 2.3 GCN思想与模…

前端(htmlCSSJavaScript)基础

关于前端更多知识请关注官网:w3school 在线教程全球最大的中文 Web 技术教程。https://www.w3school.com.cn/ 1.HTML HTML(HyperText Markup Language):超文本标记语言 超文本:超越了文本的限制,比普通文本更强大。除了文字信息…

Xcode 如何在 silicon Mac 上调试 iOS 版本的 App

功能需求 自从 M1 处理器 Mac 推出以后,我们可以用原生方式在 silicon Mac 系统上运行 iPhone 或 iPad 上的 App。 然而,当发现上架后的 iPhone / iPad App 在 silicon Mac 上运行表现异常时,我们如何在 Xcode 中调试它们呢?比如:在 silicon Mac 中 SwiftUI 弹出的 shee…

跳表Skiplist

介绍 对于有n个元素的链表,会分成log(n1),比如下图为四层,最下面是所有元素都有,往上面走隔着空元素越来越少,保证查询效率为logn 如何插入元素: 最关键的就是新插入的节点应该跨越多少层**——>由抛硬…

解析 Navicat 最受欢迎的功能 | SQL 查询编辑器与 SQL 创建工具

近期发起的线上投票调查中,我们很高兴地看到:SQL 查询编辑器、SQL 创建工具已成为用户最常用的功能之一,并且深受用户欢迎!在人类社会发展的历史长河中,离不开工具的演进与发展。而 Navicat 作为领先的数据库管理开发工…

setContentView学习(一)

setContentView流程分两种情况,一种是继承自Activity的情况,另一种是继承自AppCompatActivity的情况,下面分别介绍。 先说继承自Activity的情况,源码为android-30 public class Activity extends ContextThemeWrapper {public void setContentView(Lay…

【综合】简单加解密——寻找序列号

【综合】简单加解密——寻找序列号 下面文字对你可能有用(复制粘贴): #include <stdlib.h> #include <string.h> #include “malloc.h” #define MaxPass 66 // 最多66段密文 #define NumbPwdTable 5 // 密码表的份数 #define SizePwdTable 0x210 // 每份密码表占…