第一代AIGC硬件悄然爆发

news2024/9/29 11:26:10

文 | 智能相对论

 

作者 | 叶远风

看起来,这可能是一副正常的黑框眼镜,你戴上去彬彬有礼、斯斯文文;

实际上,它里边还装了一个“小伙伴”,你随时可以与它交流,谈天说地或者提出各种问题接受它的帮助;你化身为了科技极客,成为科幻片里带着有超能力的“小跟班”闯荡世界的酷炫主角……

这款眼镜是天猫精灵最近爆出的一款升级了大模型的智能随身眼镜工程机版本。

从官方透露的信息看,这个新型随身终端demo内置了AIGC能力,可以通过连续的语音交互实现对用户的全天候陪伴。

从B站博主透出的视频来看,对话、记录、生活技巧……以骨传导的方式,在没有人注意到的情况下,大量的交互就已经轻松实现。

逛街时需要寻找优质餐厅时,只要问一问,答案就传到了脑子里,带上一脸疑惑的朋友,出发;

减肥大计还没成功,又疑惑美食的热量时,可以马上在耳旁获得恰当食物的推荐,不用担心热量超标;

躺在沙发上吹着空调玩着王者荣耀,想知道辅助位该怎么玩时,小伙伴已经帮你应该玩什么英雄、怎么玩都安排好了……

尽管人工智能喊了几十年,但AIGC的到来,可能还是第一次能够让普通人直接感受到技术的澎湃力量。

实际上,除了天猫精灵的智能随身眼镜,AIGC硬件过去一段时间内已经出现集中化涌现的浪潮。

百度小度全面接入文心一言,甚至借势推出面向垂直领域的智能手机产品;

科大讯飞的星火一经发布,就宣布接入旗下的学习机产品以及智能办公产品;

此外,华米在其新款Amazfit Falcon运动智能手表上上线了ChatGPT表盘,拥有众多智能终端产品的小米更是爆出要自研大模型接入其生态产品中。

在国外,苹果批准了其AppleWatch硬件产品接入AIGC能力,智能眼镜公司Innovative Eyewear宣布将推出首款支持ChatGPT的智能眼镜。

而上述天猫精灵智能眼镜在开售日当天直接登上了天猫平台同品类热销榜第一。

这些都表明,第一代AIGC硬件正迎来爆发,这种爆发也展示了AIGC垂直化下的个人化、随身化产品发展路径和价值。

大模型想离“用户”更近

ChatGPT、通义千问、文心一言、讯飞星火……

大模型产品过去一段时间集中涌现,各自都刷了一波存在感,好不热闹。

实际上,这些能够聊天交互的产品,只是厂商们用最直观的方式向业界秀出自家大模型的技术肌肉罢了。

它们背后支撑的大模型,在打出影响力后走入垂直领域实现商业化,是共同的追求。

AIGC的大时代,走在前面的企业已经在探索更多场景。

而在商业化这件事上,厂商们的倾向各不相同——直观上,分为进入B端企业提供服务以及面向C端创新产品两种路径。

到底是朝向B端还是去C端,也引发过一系列的讨论甚至争论。

这波浪潮的源头OpenAI,倾向于面向企业提供服务,收取订阅费,来快速实现数亿美元的营收目标。

这也成为不少国内厂商的选择。

而实际上,大模型的原本含义就是“预训练的大参数量算法模型”,它本质的意义体现在“预训练”上,能够经过微调就快速适应对应的场景,在不需要提供大量数据喂养的情况下就能形成一个可落地的应用,从而在提升AI能力的同时加速AI创新的速度。

但从大模型的技术落地来说,垂直化是生来就有的基因。

在企业级服务十分旺盛的欧美,OpenAI优先选择了面向企业们收订阅费。

而在中国市场,虽然随着To B数字化、智能化服务的高速发展,厂商最终也需要全面面向企业提供服务,它们还多了一项选择,那就是依靠蓬勃发展的C端市场,在各类C端产品或服务上,展现AIGC的能力。

过去已经发展了很多年的智能终端,具备商业化的三大优势:大市场容量、深度服务的价值潜力、易于通过语音助手实现AIGC能力嫁接。

简单说,市场大、潜力深、好上手,容易得到普遍选择。

这一点,也得到研究机构与厂商实践的共同证明。

中国信通院在《AIGC与ChatGPT:现状、趋势及治理》中认为,智能语音助手将是重要的AIGC应用方向;

国盛证券在其研究报告中提到,智能助理将成为下半年的超级应用,大模型让人类可以指挥搭载在智能音箱、耳机、汽车等各种设备中智能助理帮自己完成各种任务。

智能随身眼镜这类陪伴式产品,底层支撑就是智能语音助手。

此前,百度的智能音箱已经传出要搭载AIGC能力,讯飞星火大模型一经发布就直接应用到了其学习机硬件产品上,让学生用户可以直接与学习机英文聊天。

在推出智能随身眼镜前,天猫精灵也已经在4月份公开首个接入千问大模型的智能硬件demo。

过去市场上出现过的所有智能化硬件终端,都可以“再造一遍”。

音箱、耳机、汽车、手机,甚至所有的智能家居,都可以通过搭载语音助手实现“AIGC化”。

国盛证券说智能助理/AI伙伴或将是下一个超级应用,丝毫不夸张。

只不过,更进一步看,在诸多智能终端中,并不是所有产品都能快速凸显。

那些承袭“可穿戴设备”概念的随身终端们,借AIGC,或将率先落地展现出新的价值。

三大条件齐备,大模型再造智能终端

一个AIGC智能终端的落地,无非看三个方面:

产品属性是不是契合AIGC、能碰撞出最大价值,这直接决定市场接受度;

技术是不是能够跟上,这决定产品功能品质;

赛道是不是有强烈的动因去融合AIGC,这决定长远的商业化深度。

而以智能随身眼镜为代表的随身终端,在诸多智能终端中,当下无疑更贴合这些要求。

1、产品属性:声音带来更直接的价值落地

在漫威电影《钢铁侠》中,AI管家贾维斯帮助钢铁侠管理大大小小的事务。

这一设定被众多电影沿用,几乎每个科幻片,都能看到一个形影不离的设备陪伴在主角身边,提供各种帮助,甚至不执行任务只是单纯“接受倾诉”。

OpenAI的创始成员Andrej Karpathy也曾表示,他要创立一个“贾维斯”。

声音交互+全能+随身,成为“贾维斯”们共同的特点。

在所有智能终端设备中,因为种种限制,声音交互成为最常用、最便捷、最直接产生AIGC价值的方式。

而“随身”又让这种价值实现变得更加高频,让“助手”价值与日常生活更加紧密贴合。

毕竟,人们的活动范围总是在变,但随身设备一直在身边。

可以看到,虽然天猫精灵的智能随身眼镜在产品形式上更像是AR眼镜,但至少在当下,它本质上还是走的声音交互+随身的路子,是一个被“科幻化”方式隐藏的耳机。

国盛证券在其报告中也认为,在户外、旅途或者需要私密性的场景,最合适的语音智能载体是耳机,“因为人类物理条件限制,耳机在未来可见维度内都是优质入口。”

上班“摸鱼”,开会帮助录音记录会议纪要,逛街帮忙寻找吃喝玩乐好地方,甚至深夜接受倾诉、成为社恐用户的好朋友……

天猫精灵试图打造的,就是科幻片中那个形影不离的生活与工作伙伴。

2、技术供给:全链条技术已经储备完成

在每一个大模型产品的发布会现场,正常的演示过程往往都是输入文字然后AIGC创作一个答案呈现出来。

这就带来一个问题:当AIGC进入随身终端,需要声音交互的时候,除了大模型本身的能力,还需要一系列技术的支持来构成技术链条:

感知阶段,ASR技术,将听到的语音转成文本输入给大模型;

决策+创造阶段,NLP(即大模型本体),接受信息后创造内容输出;

表达阶段,TTS技术,将文本转化成自然流畅的语音传递给用户。

对智能随身眼镜来说,这还没完,要带来私密的声场,还需要配合精密的骨传导技术。

只有具备一系列技术储备的玩家,才有资格上桌,这里没有什么黑马的机会。

天猫精灵的智能随身眼镜,一方面需要搭载千问大模型的场景化应用,另一方面也离不开这些年来依靠智能音箱在ASR、NLP、TTS技术上的长期积累。

作为一款创新产品,其背后的新工程技术研发也值得关注。

比如这次用到的骨传导技术采用了所谓“振子专利技术”,优化了骨传导发声装置的连接模式,让振动响应更加稳定、更小噪音、更低失真。

而且,植入的组件还需要小型化,保证可以安放进9.9mm的镜腿之中。

科技和体验,都拒绝笨重。

当然,天猫精灵有了这一系列技术储备,并不仅仅应用于眼镜,未来在耳机、头盔等穿戴设备中也有用武之地。

如果智能随身眼镜取得成功,未来可以期待更多随身终端的AIGC创新。

3、变革需求:AIGC契合了赛道突破自我的需要

很长一段时间以来,可穿戴设备处在概念火热但产品进展缓慢的处境当中。

随身终端搭载大模型,实现AIGC能力后,更多价值创造的可能性就出现了。

陪伴、闲聊、推荐餐厅、网上购物、办公、检索信息……一个随身设备都能提供。

中国信通院云计算与大数据研究所内容科技部副主任刘硕,把这种AIGC给原有赛道的价值改变,称为“破坏式创新”——AIGC对随身终端的价值,不再是基于原有产品逻辑的优化,而是一种打破后的“再造”。

智能随身眼镜给AR带来的改变就是如此,反过来,也受这种变革需求的驱动。

以旅游场景为例,以前的AR眼镜能够在看到一家酒店后提供相应的信息供决策已经很了不起,现在,内置的“小伙伴”可以通过语音分析用户需求、检索网络信息、为用户做出建议,甚至帮助用户操作下单,完成旅游计划的构建。

有理由相信,更多不温不火的随身终端甚至智能终端赛道亟待这样的创新。

随身终端的AIGC竞逐,仍在回归行业本身

搭载AIGC的随身终端带来了全新的效率和场景需求满足能力,激发了新的市场空间,不仅能够为用户提供具体的服务,还在创建一个拥有多维度参与力量的生态系统。

智能终端,一直在各种方式、路径,在各种工作、生活场景中向用户提供丰富的服务。

AIGC的加入,或许还能让过去的智能终端产品竞争摆脱同质化。

例如,在传统声音交互的典型智能终端——智能音箱的产品角逐中,很难说厂商间有什么太大的差异——以数据库、知识图谱的方式回应用户需求,各个产品基本上“你有我也有”。

但当大模型成为新的底座基础设施,并将AIGC能力输送到随身终端后,各个产品能力的强弱将形成巨大的差异化。产品角逐将变为硬实力角逐。

*本文图片均来源于网络

#智能相对论 Focusing on智能新产业新服务,这是智能的硬件 NO.217深度解读

此内容为【智能相对论】原创,

仅代表个人观点,未经授权,任何人不得以任何方式使用,包括转载、摘编、复制或建立镜像。

部分图片来自网络,且未核实版权归属,不作为商业用途,如有侵犯,请作者与我们联系。

•AI产业新媒体;

•澎湃新闻科技榜单月度top5;

•文章长期“霸占”钛媒体热门文章排行榜TOP10;

•著有《人工智能 十万个为什么》

•【重点关注领域】智能家电(含白电、黑电、智能手机、无人机等AIoT设备)、智能驾驶、AI+医疗、机器人、物联网、AI+金融、AI+教育、AR/VR、云计算、开发者以及背后的芯片、算法等。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/545787.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

深度学习之构建MPL神经网络——泰坦尼克号乘客的生存分析

大家好,我是带我去滑雪! 本期使用泰坦尼克号数据集,该数据集的响应变量为乘客是生存还是死亡(survived,其中1表示生存,0表示死亡),特征变量有乘客舱位等级(pclass&#x…

广告投放的关键成功因素:广告归因与广告效果监测

在当今竞争激烈的市场环境中,广告归因和广告效果监测成为了广告投放中至关重要的环节。通过深入了解广告归因和广告效果监测的方法,企业可以更好地评估广告投放的成效,并做出精确的决策,以提高广告效果和最大化投资回报。 本文将带…

昆仑万维“勇闯”百模大战:一个“无懈可击”的商业故事话本?

文丨智能相对论 作者丨沈浪 新能源火了做新能源,元宇宙火了做元宇宙。 如果一个热点领域没有昆仑万维的身影,那一定是这个领域还不够“热”,爆不了。 但凡是热到爆的领域,昆仑万维虽迟但到。 不过,这样说可能有些…

【计算机网络基础】章节测试3 数据链路层

文章目录 判断题选择题辨析题应用题 判断题 相对于广域网而言,局域网的误码率较低。√ 交换机是依据IP地址来转发数据包的。 局域网使用集线器作为网络连接设备时,逻辑上是星型结构。 PPP协议应首先满足的需求是简单,以使得协议在实现的时…

Go语言的学习【2】基础语法

目录 代码组成部分字符串格式化字符数据类型变量遇到的问题及解决办法1 代码组成部分 Go 程序可以由多个标记组成,可以是关键字,标识符,常量,字符串,符号。 在 Go 程序中,一行代表一个语句结束。 如果你…

【linux】图文并茂,让你轻松掌握Linux基本指令

目录 一,前提 二, 在root身份下,管理用户 1. 判断身份 2. 创建用户 3. 销毁用户 三,文件增,删,移动指令 1. pwd——查看路径 2. ps ——打开文件目录 3. touch——创建文件 4. nano——打开文件 5.…

【大数据】Presto(Trino)REST API 与执行计划介绍

文章目录 一、概述二、环境准备三、常用 REST API1)worker 节点优雅退出2)提交SQL查询请求3)获取查询状态4)获取查询结果5)取消查询请求6)获取Presto 节点信息7)获取Presto服务器使用统计信息8&…

功率放大器电路中的三极管和MOS管,究竟有什么区别?

学习模拟电子技术基础,和电子技术相关领域的朋友,在学习构建功率放大器电路时最常见的电子元器件就是三极管和场效应管(MOS管)了。那么三极管和MOS管有哪些联系和区别呢?在构建功率放大器电路时我们要怎么选择呢&#…

干货 | 利用SPSS进行高级统计分析第一期

Hello,大家好! 这里是壹脑云科研圈,我是喵君姐姐~ 你是否还在为分析实验数据而感到头疼?你是否还在苦于自己不知道如何选择合适的模型来分析数据? 本期我们就来为大家带来了利用SPSS软件进行高级统计分析…

【学习日记】在不可联网电脑上安装Python和深度学习环境

测试环境 Hyer-V上开了个虚拟机,win7-64位企业版,全新未安装任何环境的最基本的操作系统。 因为不联网安装,而且是win7这种古老的操作系统,确实会遇到很多问题。做个记录。 安装Python 打开python-3.7.8.exe 安装程序 此时可能…

离岗识别 yolov5模型

离岗识别通过yolov5网络模型技术,离岗识别可以自动识别现场画面中人员离岗脱岗睡岗等行为,发现违规行为立即抓拍告警。YOLOv5在YOLOv4算法的基础上做了进一步的改进,检测性能得到进一步的提升。虽然YOLOv5算法并没有与YOLOv4算法进行性能比较…

Unity3d 开发Pico4程序闪退弹窗【版权保护】检测的解决方法

前言 最近在进行基于Pico4的应用开发,然后在部分设备上程序是无法正常进入的,而且总是弹出这个版权保护的窗口: 按理说正常的自己开发的测试的程序不应该有这种限制,查询后发现是 PICO 内置了版权保护机制。应用上架后&#xff0…

研发工程师玩转Kubernetes——通过文件创建Service

在《研发工程师玩转Kubernetes——部署应用》一文中,我们使用kubectl expose创建了一个Service,暴露了一个Pod上的nginx服务。这篇文章我们将使用文件的形式创建Service。 为了增加有趣性,我们采用《研发工程师玩转Kubernetes——构建、推送自…

与众不同的夜间开关交互效果

这个夜间模式切换开关效果是不是很炫酷,在短视频曾刷到过是一个国外的设计师看似是为了难为我们前端开发设计了一个元素超多且动画复杂的开关切换效果。 结果在逛 codepen 的时候发现真的被一个大佬给做出来了,效果真的很不错,而且还在原来的…

矩池云教程|体验 OpenAI 最近推出的 3D 生成模型 Shap-E!

Shap-E 是由 OpenAI 最近推出的3D生成模型,使用者可以通过简单的文字或图像进行三维模型的生成,OpenAI 认为相比于点云的生成模型Point-E,Shap-E的收敛更快。本文将展示如何在矩池云上体验3D模型生成。 Shap-E:https://github.co…

自动生成测试用例_接口测试用例自动生成工具

前言 写用例之前,我们应该熟悉API的详细信息。建议使用抓包工具Charles或AnyProxy进行抓包。 har2case 我们先来了解一下另一个项目har2case 他的工作原理就是将当前主流的抓包工具和浏览器都支持将抓取得到的数据包导出为标准通用的 HAR 格式(HTTP A…

软件测试需要学会写代码吗?

无论是刚入测试行业的萌新,还是已经在测试行业闯荡了两三年的小司机们,都会琢磨一个问题:如果要持续发展下去,我要不要懂代码? 在软件测试初级阶段,不需要编程能力。但是任何一个职业,都会追求…

【网络协议详解】——IPv6协议(学习笔记)

📖 前言:IPv6 协议是未来互联网的发展方向,它的推出为网络通信和互联带来了更大的便利性和更广阔的发展空间。相比于 IPv4,IPv6 支持更多的地址空间、更高效的路由和唯一的全球性地址等特点,可以更好地满足未来数字化时…

Mac电脑 Vscode : Flutter 开发环境搭建(最细节教程)

参考链接: MacVSCode安装flutter环境_mac vscode配置flutter_GalenWu的博客-CSDN博客 mac搭建Flutter环境以及初始化项目 - 简书 注意: *下载xcode 就包含git了, *苹果芯片和intel 芯片需要的环境不同,苹果芯片需要安装: Im…

攻防世界web新手区部分题解

前言:博主是个安全小白,正在努力学习中,会随着学习进度不定期更新完善本篇博客。 这里是目录 1.robots2.view_source3.backup4.disabled_button5.get_post6.cookie7.ics-068.PHP2 1.robots 题目描述: X老师上课讲了Robots协议,小宁…