Meta与Ray-Ban合作推出了一款全新智能眼镜外观时尚,而且搭载了能够“看到“你所看到的一切的人工智能技术

news2025/4/6 9:17:04

每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

“嘿,Meta,看看这个,告诉我哪些茶是无咖啡因的。”

当在Meta位于纽约总部戴着一副Meta Ray-Ban智能眼镜说出这句话时,正盯着桌上用记号笔涂黑了咖啡因标签的四个茶包。耳边传来轻微的点击声,紧接着Meta的AI声音告诉我,洋甘菊茶可能是无咖啡因的。它正在阅读标签并使用生成式AI做出判断。

这是我正在测试的一个功能,从今天开始就会推出到Meta的第二代Ray-Ban眼镜上 —— 这个功能是Meta首席执行官马克·扎克伯格在去年九月新眼镜发布时已经承诺的。这些AI功能,可以通过Meta眼镜上的摄像头查看图像,并用生成式AI进行解读,原本计划于2024年推出。Meta比我预期的更早引入了这些功能,尽管早期访问模式仍然非常是测试版。除了将Bing支持的搜索添加到Ray-Ban的新更新中,这增强了眼镜已有的语音激活功能,Meta的眼镜正在迅速获得新能力。

这次演示让我惊叹,因为我从未见过类似的东西。我看过一部分:Google Lens和其他手机上的工具已经在使用相机和AI,而Google Glass —— 十年前 —— 有一些翻译工具。然而,Meta眼镜调用AI来识别我周围世界中的东西的方式简单直接,感觉相当先进。我很兴奋能够尝试更多。

这些眼镜没有显示屏,AI只回应声音。但Meta View手机应用程序会保存照片和AI的回应以供日后查看。 Meta 多模态AI:目前的工作方式 目前这项功能还有限制。它只能通过拍照来识别你所看到的东西,然后AI进行分析。在发出语音请求后,你会听到快门声,然后几秒钟后会有回应。语音提示也很长:Meta眼镜上的每一个语音请求都需要以“嘿,Meta”开始,然后你需要跟上“看看并”(我最初以为需要说的是“嘿,Meta,看看这个”)来触发拍照,紧接着是你想让AI做的事情。“嘿,Meta,看看并告诉我用这些食材有哪些食谱。” “嘿,Meta,看看并编一个有趣的标题。” “嘿,Meta,看看并告诉我这是什么植物。”

每个请求都会触发快门声,然后是AI阅读图像并解释它的几秒钟暂停。这与手机上的AI相机应用程序的工作方式类似,除了戴在你脸上并且通过声音控制。

每个AI的回应和它查看的照片都储存在与眼镜配对的Meta View手机应用程序中。我喜欢这一点,因为它是后来的视觉/书面记录,就像记忆提示的笔记。我可以想象在某处漫步并提出问题,将其用作我的眼睛的某种头戴式Google搜索,无论是购物还是其他。

Meta的这款智能眼镜,不仅仅是科技的尖端产物,它的辅助功能也非常值得关注。想象一下,当我戴着这副没有配我视力的试验款Meta眼镜,询问它我正在看什么时,尽管回答在细节和准确性上有所不同,但它确实能给出一个大概的指引。它甚至能识别出我手中的眼镜,注意到镜片带有蓝色调(蓝黑框架,相当接近实际情况)。

不过,这副眼镜有时也会“产生幻觉”。比如我问桌前碗中的水果,它正确地列出了橙子、香蕉、火龙果和苹果,但错误地认为还有石榴(其实并没有)。当我让它为窗前的一个大毛绒熊猫编写标题时,它创造了一些可爱的标题,但有一个与实际情况不符,描述了一个孤独地看手机的场景。

当我看着一份西班牙语菜单,询问眼镜显示辛辣菜肴时,它能读出一些菜名并为我翻译关键食材,但当我再次询问含肉的菜肴时,它又用西班牙语回答了。

这项技术的可能性令人兴奋,而且可能极其有用。Meta承认,这次早期推出旨在发现漏洞并帮助改进眼镜上的AI工作方式。我发现有些时候需要频繁说“嘿,Meta,看看”,但这个过程可能会随着时间改变。当进行即时图像分析时,提出直接的后续问题有时可以不用再说“看看”,但这种做法的成功率可能会有所不同。

这种AI被Meta称为“多模态AI”,因为它结合了相机和语音聊天的功能,是公司计划将来将多种形式的输入混合在一起的AI的先驱,包括更多的感官数据。Qualcomm专注于AI的芯片组在Meta的新款Ray-Ban上已经准备好承担更多任务。Meta还计划随着时间的推移使这一过程更加无缝。

Meta首席技术官Andrew Bosworth曾在去年九月说,尽管眼镜现在需要语音提示来激活和“看到”以节省电池寿命,但最终它们将“配备足够低功耗的传感器,能够检测到触发意识的事件,进而触发AI。这正是我们正在努力实现的梦想。” Meta还在研究将多种形式的感官数据融合在一起的AI工具,以备更先进的未来可穿戴设备。

现在,这还是一个早期访问的测试版。Meta在这一阶段使用匿名查询数据来帮助改进其AI服务,这可能会引起一些关注隐私的人的担忧。我还不清楚具体的选择加入细节,但一旦最终的AI功能推出,可能是明年,更多离散的数据共享控制似乎可能到位。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1320613.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

adb详细教程(五)-复制文件、截屏、录屏

adb对于安卓移动端来说,是个非常重要的调试工具。在进行安卓端的开发或测试过程中,有时需要了截屏或录屏,在设备上操作完成后再将文件导入电脑非常繁琐。​如果使用adb指令在进行截屏或录屏则会便捷许多。此篇文章介绍了如何使用adb指令进行文…

LLMs 玩狼人杀:清华大学验证大模型参与复杂交流博弈游戏的能力

作者:彬彬 编辑:李宝珠,三羊 清华大学研究团队提出了一种用于交流游戏的框架,展示了大语言模型从经验中学习的能力,还发现大语言模型具有非预编程的策略行为,如信任、对抗、伪装和领导力。 近年来&#x…

React系列:配置@别名路径并配置联想

🍁 作者:知识浅谈,CSDN签约讲师,CSDN博客专家,华为云云享专家,阿里云专家博主 📌 擅长领域:全栈工程师、爬虫、ACM算法 💒 公众号:知识浅谈 🔥网站…

【NI-RIO入门】扫描模式

于NI KB摘录 所有CompactRIO设备都可以访问CompactRIO扫描引擎和LabVIEW FPGA。 CompactRIO 904x 系列是第一个引入 DAQmx 功能的产品线。 扫描引擎(IO 变量) – 主要为迁移和初始开发而设计。控制循环频率高达 1 kHz1,性能控制器上的频率更…

mysql使用全文索引+ngram全文解析器进行全文检索

表结构:表名 gamedb 主键 id 问题类型 type 问题 issue 答案 answer 需求 现在有个游戏资料库储存在mysql中,客户端进行搜索,需要对三个字段进行匹配,得到三个字段的相关性,选出三个字段中相关性最大的值进…

干货,教你服务号改为订阅号

服务号和订阅号有什么区别?服务号转为订阅号有哪些作用?我们都知道,服务号一个月只能发4次文章,但是订阅号每天都能发文章。不过在接收消息这一方面,服务号群发的消息有消息提醒,并显示在对话框&#xff1b…

客观题测试-第7章查找

第1关:查找客观题测试(一) 1、关键字可以唯一地标识一个数据元素。 A、对 B、错 2、二叉排序树是一个动态查找表。 A、对 B、错 3、如果顺序表中各元素的查找概率相同,在顺序查找时,查找不成功的平均查找长度因…

回归预测 | MATLAB实现SABO-LSTM基于减法平均优化器优化长短期记忆神经网络的多输入单输出数据回归预测模型 (多指标,多图)

回归预测 | MATLAB实现SABO-LSTM基于减法平均优化器优化长短期记忆神经网络的多输入单输出数据回归预测模型 (多指标,多图) 目录 回归预测 | MATLAB实现SABO-LSTM基于减法平均优化器优化长短期记忆神经网络的多输入单输出数据回归预测模型 &a…

Linux线程——常用API

线程创建 函数原型及头文件 #include <pthread.h> int pthread_create(pthread_t *restrict tidp, const pthread_attr_t *restrict attr, void *(*start_rtn)(void *), void *restrict arg);参数解读 tidp当pthread_create成功返回时&#xff0c;由tidp指向的内存单元…

通过基准配置文件(Baseline Profiles)提升你的Android应用性能

通过基准配置文件提升你的Android应用性能 应用程序性能与用户体验直接相关&#xff0c;具有至关重要的意义。在开发者社区中&#xff0c;存在许多方法来提高应用程序性能。在本文中&#xff0c;您将通过利用基准配置文件&#xff08;Baseline Profile&#xff09;深入了解其中…

采购oled屏幕,应注意什么

在采购OLED屏幕时&#xff0c;应注意以下几点&#xff1a; 规格和参数&#xff1a;了解OLED屏幕的规格和参数&#xff0c;包括尺寸、分辨率、亮度、对比度、响应时间等。确保所采购的屏幕符合项目的需求和预期效果。 品质和可靠性&#xff1a;选择具有可靠品质和稳定性的OLED屏…

Spirng02

一、Spring中Bean的生命周期 当我们启动Spring项目的时候,就会初始化Spring的容器,Spring就会扫描启动引导类所在包及其子包中类的注解,并调用这些加了注解的类的构造方法创建对象(控制翻转),再创建了这些类的对象之后,就会找使用了Autowired注解的地方进行赋值(依赖注入)。随后…

如何访问AWS私有网络中的RDS (Mysql)

文章目录 小结问题及解决连接问题如何使用本地的Mysql Workbench对RDS进行访问 参考 小结 在AWS私有网络中部署了RDS (Mysql), 尝试通过外网成功地进行了访问. 问题及解决 连接问题 在AWS私有网络中部署了RDS (Mysql), 进行外网进行访问碰到了各种问题. 以下连接超时&…

ARM-----DMA笔记

1.DMA简介 DMA(Direct Memory Access) —直接存储器存取&#xff0c;是单片机的一个外设&#xff0c;它的主要功能是用来搬数 据&#xff0c;但是不需要占用 CPU &#xff0c;即在传输数据的时候&#xff0c; CPU 可以干其他的事情&#xff0c;好像是多线程一样。 数据传输支持…

computed 和 watch 的奇妙世界:让数据驱动你的 Vue 应用(上)

&#x1f90d; 前端开发工程师&#xff08;主业&#xff09;、技术博主&#xff08;副业&#xff09;、已过CET6 &#x1f368; 阿珊和她的猫_CSDN个人主页 &#x1f560; 牛客高级专题作者、在牛客打造高质量专栏《前端面试必备》 &#x1f35a; 蓝桥云课签约作者、已在蓝桥云…

RAG检索增强技术在知识库智能检索场景下的应用实践

如果你对这篇文章感兴趣&#xff0c;而且你想要了解更多关于AI领域的实战技巧&#xff0c;可以关注「技术狂潮AI」公众号。在这里&#xff0c;你可以看到最新最热的AIGC领域的干货文章和案例实战教程。 一、知识检索增强的基本概述 1.1、知识检索增强技术提出的背景 1.1.1、L…

【AD封装】2.0间距排针排母插件贴片(带3D)

包含了我们平时常用的2.0间距的排针&#xff0c;排母&#xff0c;贴片的插件的都有&#xff0c;总共100种封装及精美3D模型。完全能满足日常设计使用。每个封装都搭配了精美的3D模型哦。 2.0排针排母是一种电子连接器&#xff0c;通常用于电路板上的电子元件之间的连接。它由一…

【Python】人工智能-机器学习——不调库手撕贝叶斯分类问题

1. 作业内容描述 1.1 背景 数据集大小150该数据有4个属性&#xff0c;分别如下 Sepal.Length&#xff1a;花萼长度(cm)Sepal.Width&#xff1a;花萼宽度单位(cm)Petal.Length&#xff1a;花瓣长度(cm)Petal.Width&#xff1a;花瓣宽度(cm)category&#xff1a;类别&#xff0…

深入理解Spring Security授权机制原理

原创/朱季谦 在Spring Security权限框架里&#xff0c;若要对后端http接口实现权限授权控制&#xff0c;有两种实现方式。 一、一种是基于注解方法级的鉴权&#xff0c;其中&#xff0c;注解方式又有Secured和PreAuthorize两种。 Secured如&#xff1a; 1 PostMapping("…

推荐几款值得收藏的3DMAX插件

推荐几款值得收藏的3DMAX插件 StairGenerator StairGenerator一键楼梯插件&#xff0c;不需要花费太多的时间&#xff0c;轻松从2D平面图生成3D楼梯模型&#xff0c;生成的楼梯模型细节丰富真实。 【主要功能】 1.简单&#xff1a;轻松实现2D到3D建模。 2.具有最详细三维结…