结合多模态 AI 谷歌展示 AR 眼镜原型机;Meta 被曝开发带摄像头的 AI 耳机丨 RTE 开发者日报 Vol.204

news2024/9/20 22:33:20

在这里插入图片描述

开发者朋友们大家好:

这里是 「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@CY,@JLT,@鲍勃

01有话题的新闻

1、结合自家多模态 AI 助手「Project Astra」,谷歌 I/O 大会展示 AI+AR 眼镜原型机

今日凌晨,谷歌召开了其 2024 I/O 大会,本次大会核心围绕 AI,并展示了 Gemini、AI Overviews、Ask Photos 等新产品或新能力。

在这过程中,谷歌展示了一个结合了自家多模态 AI 助手「Project Astra」的 AR 眼镜演示视频片段。据了解,Project Astra 除了拥有常见多模态 AI 大模型的音频、文本以及视觉处理能力外,它还能记住并且推理它所看到的一切。

谷歌表示,Astra 的工作原理是「连续编码视频帧,将视频和语音输入组合到事件时间线中,并缓存这些信息以进行有效调用」。(@陀螺科技)

2、OpenAI 联合创始人兼首席科学家伊利亚·苏茨克沃将离职

北京时间 5 月 15 日早间,OpenAI 联合创始人伊利亚·苏茨凯弗(Ilya Sutskever)在社交媒体平台上宣布,他将在近十年后离开公司。苏茨凯弗称:「我对接下来的事情感到兴奋——这是一个对我个人非常有意义的项目,我将在适当的时候分享细节。」

在苏茨凯弗离职之际,奥特曼在社交媒体上表达了自己的想法。他写道:「这让我感到很难过,伊利亚无疑是我们这一代最伟大的人之一,是我们这个领域的一盏指路明灯,也是一位亲爱的朋友。他的才华和远见是众所周知的,但他的热情和同情心同样重要。」与此同时,奥特曼还宣布了雅各布·帕奇科(Jakub Pachocki)为该公司新一任的首席科学家。(@腾讯科技)

3、传 Meta 正开发内置摄像头 AI 耳机,可识别物体翻译外语

5 月 14 日消息,据 The Information 报道,Meta 正在探索开发带有摄像头的 AI 耳机,希望这种设备能用来识别物体和翻译外语。

三位「内部人士」透露,该项目的内部代号为 Camerabuds,目前还不清楚该产品的最终设计会是入耳式耳机还是头戴式耳机,不过 Meta 的 CEO 扎克伯格已经尝试过几种可能的设备设计,但他对这些产品原型都不满意。内部人士表示,Meta 公司领导层原本预计在今年第一季度正式批准一款原型设计,但许多测试人员发现大量问题,包括长发可能会遮挡耳机上的摄像头、耳机重量太大、续航太短、发热影响体验等。

除了 Meta 外,几家其他科技公司也在研发 AI 可穿戴设备,包括 Humane 和 Rabbit 在内的几家初创公司最近也推出了自家「AI 专用设备」,Meta 内部人士表示,包括扎克伯格等 Meta 领导层目前都希望加速 AI 耳机的开发过程,因为他们相信 Meta 的竞争对手也将开发类似的设备。(@搜狐科技)

4、腾讯混元文生图模型全面开源,包含模型权重、推理代码、模型算法等完整模型

5 月 14 日,腾讯宣布旗下的混元文生图大模型全面升级并对外开源,目前已在 Hugging Face 平台及 Github 上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。该模型支持中英文双语输入及理解,参数量 15 亿。升级后的混元文生图大模型采用了与 Sora 一致的 DiT 架构,不仅可支持文生图,也可作为视频等多模态视觉生成的基础。(@ CSDN)

5、字节跳动自研大模型家族即将亮相

火山引擎宣布,字节跳动自研大模型家族将于今日 9:30 举办的「2024 春季火山引擎 FORCE 原动力大会」首次亮相。同时,火山引擎大模型服务平台火山方舟也将迎来重大升级。凤凰网科技此前曾报道,字节跳动在 AI 方面的布局,主要集中在 Flow 部门。该部门目前的核心产品有:

AI 对话助手豆包( 海外版为 Cici)
对标 GPTs 的 AI bot 开发平台扣子(海外版为 Coze )
面向二次元群体的话炉

另外,在组建 Flow 部门前,字节跳动还在大模型上部署了代号为「seed」的团队,专注于模型层的研发。(@爱范儿)

6、苹果 iOS 18 或将推出广告屏蔽功能,英国报纸集团与新闻媒体协会对其发出警告

据外媒报道,苹果正准备在 iOS 18 软件更新中为 Safari 浏览器加入一个基于 AI 的隐私功能,该功能可以删除广告或其他不需要的网站内容。对此英国报纸集团警告苹果公司,推出任何屏蔽广告的「网络橡皮擦「(web eraser)工具,都将使新闻业的财务面临可持续性风险。

NMA(News Media Association、英国新闻媒体协会)向苹果英国政府事务主管表示,这个功能将影响新闻媒体行业在网络上的收入,新闻媒体行业需要资金来运行,而广告是他们的主要收入来源。编辑们则担心 AI 工具会选择性更改或删除文章内容,改变文章原意。目前一些新闻媒体已经在其网页上增加了对广告拦截插件的检测,若检测到广告拦截插件,会要求用户将其关闭,否则将不允许用户继续浏览。(@IT 之家)

02有态度的观点

1、朱啸虎评 GPT-4o:称大模型技术迭代曲线明显放缓

金沙江创业投资基金主管合伙人朱啸虎点评 GPT-4o,他认为:

1.大模型的技术迭代曲线明显放缓。

2.开始卷免费,说明 GPT 的用户和收入增长都已经碰到瓶颈,不是深度绑定大厂的模型公司基本已经出局。

3.应用会迅速爆发,推理成本再降一个数量级就会普及出现 AI 时代的国民应用。

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

在这里插入图片描述

素材来源官方媒体/网络新闻

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1680392.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

数据可视化的艺术:使用Matplotlib和Seaborn揭示数据故事

引言 数据可视化是数据分析中的关键一环,它帮助我们理解数据模式、趋势和异常。在Python中,Matplotlib和Seaborn是两个流行的数据可视化库,它们提供了丰富的图表和图形选项,使数据的可视化变得简单而强大。 Matplotlib&#xff…

16.ABA问题

文章目录 ABA问题1.什么是ABA问题?2.ABA问题解决方案2.1.使用AtomicStampedReference解决ABA问题2.2.使用AtomicMarkableReference解决ABA问题 ABA问题 因为CAS操作的原子性能高,在JUC中广泛被应用,但是如果使用的不合理,CAS操作就…

创新方便的在线评审软件——原理图设计的利器

概述 在当今数字化时代,原理图设计已成为许多领域中不可或缺的一环。然而,对于设计师们来说,如何高效地进行评审却是一个挑战。 传统的评审方式往往需要多人齐聚一堂,耗时耗力。设计师们需要亲自填写评审意见,这不仅…

表现层设计模式_1.MVC模式

1.MVC模式三个核心模块 MVC是一种目前广泛流行的软件设计模式。近年来,随着Java EE的成熟,MVC成为了Java EE平台上推荐的一种设计模式。MVC强制性地把一个应用的输入、处理、输出流程按照视图、控制、模型的方式进行分离,形成了控制器…

算法学习(7)-树

目录 开启“树”之旅 二叉树 堆--优先队列 并查集 开启“树”之旅 是不是很像一棵倒挂的树?也就是说它是根朝上, 而叶子朝下的。不像?哈哈,来看看下面的图你就会觉得像啦。 你可能会间: 树和图有什么区别&#xff…

Hive的排序

order by 全局排序,因此只有一个reducer,设置了多个reducer也不起作用.-- 设置reducer的个数为2 set mapred.reduce.tasks2; -- 查询 select * from user_install_status_limit order by uptime limit 10;order by 在hive.mapred.mode strict 模式下,必须指定 limit,否则执行…

东莞酷得电子方案 遥控水弹坦克车

首先遥控小车是一种能够通过无线遥控器进行远程操控的小型机器人。遥控小车应用了哪些软硬件技术呢?本文将从以下几个方面进行详细介绍。 遥控小车应用了多种软硬件技术,涉及底盘结构、动力系统、传感器、控制器等多个方面。 底盘结构:遥控…

2023年全国职业院校技能大赛(高职组)“云计算应用”赛项赛卷5(私有云)

#需要资源(软件包及镜像)或有问题的,可私聊博主!!! #需要资源(软件包及镜像)或有问题的,可私聊博主!!! #需要资源(软件包…

prompt工程策略(三:使用 LLM 防护围栏创建系统提示)

原文:我是如何赢得GPT-4提示工程大赛冠军的 原文的原文: How I Won Singapore’s GPT-4 Prompt Engineering Competition !!本内容仅适用于具有 System Prompt(系统提示)功能的 LLM。具有这一功能的最著名 …

vue-pure-admin项目内复制文字粘贴到word中之后存在边框问题

vue-pure-admin项目内复制文字粘贴到word中之后存在黑色边框是由于reset.scss文件内设置了通配符的border样式 修改前 代码 *, ::before, ::after {box-sizing: border-box;// 添加这个样式会导致复制的文字粘贴到word中带有边框问题border-color: currentColor;border-styl…

优秀博士学位论文分享:复杂场景下高精度有向目标检测的研究

优秀博士学位论文代表了各学科领域博士研究生研究成果的最高水平,本公众号近期将推出“优秀博士学位论文分享”系列文章,对人工智能领域2023年优秀博士学位论文进行介绍和分享,方便广大读者了解人工智能领域最前沿的研究进展。 “博士学位论…

华为Pura独立?或将成立全新子品牌

近日,华为官方公布了P系列将正式升级为“Pura”系列的消息,并且有可能演变成为一个全新的子品牌。多年以来,P系列一直以影像功能与颇具时尚感的设计而闻名。而这次品牌升级似乎并不局限于智能手机,经营范围似乎覆盖了手表、珠宝等…

CleanMyMac X v4.14.6中文破解版,让您的电脑像新的一样

小编给您带来CleanMyMac X v4.14.6中文破解版,CleanMyMac X破解版是应用在MacOS上的一款Mac系统清理优化工具,使用cleanmymac x 中文破解版只需两个简单步骤就可以把系统里那些乱七八糟的无用文件统统清理掉,节省宝贵的磁盘空间。 CleanMyMa…

STM32的FLASH学习笔记

不同型号的 STM32,其 FLASH 容量也有所不同,最小的只有 16K 字节,最大的则达到了1024K 字节。大容量产品的闪存模块组织如图所示: STM32 的闪存模块由:主存储器、信息块和闪存存储器接口寄存器等 3 部分组成。 ​ ①主…

【LInux】<基础IO> 文件操作 | 文件描述符 | 重定向

👦个人主页:Weraphael ✍🏻作者简介:目前正在学习c和算法 ✈️专栏:Linux 🐋 希望大家多多支持,咱一起进步!😁 如果文章有啥瑕疵,希望大佬指点一二 如果文章对…

OpenHarmony 实战开发——ArkUI容器类API介绍

容器类,顾名思义就是存储的类,用于存储各种数据类型的元素,并具备一系列处理数据元素的方法。在 ArkUI 开发框架中,容器类采用了类似静态的语言来实现,并通过 NAPI 框架对外提供。通过对存储位置以及属性的限制&#x…

如何找到MySQL中存储引擎所对应的表空间并且打开?

在上节课我们学习了数据库(MySQL)进阶:存储引擎,有不少同学产生疑惑,到底要怎么找到表空间并且打开啊?这节课我们就来探讨。 首先,根据这个路径:C:\ProgramData\MySQL\MySQL Server…

k8s的网路配置

目录 1、k8s相关网络类型 1.1 K8S中Pod网络通信 1.2 Overlay Network 1.3 VXLAN 1.3.1 vlan和vxlan的区别 2、Flannel 2.1 简介 2.2 Flannel工作原理 2.3 ETCD之Flannel提供说明 2.4 Flannel部署 2.4.1 在node节点上操作 2.4.2 在master01节点上操作 2.4.2.1 安装f…

SVDD(Singing Voice Deepfake Detection,歌声深度伪造检测)挑战2024

随着AI生成的歌声快速进步,现在能够逼真地模仿自然人类的歌声并与乐谱无缝对接,这引起了艺术家和音乐产业的高度关注。歌声与说话声不同,由于其音乐性质和强烈的背景音乐存在,检测伪造的歌声成为了一个特殊的领域。 SVDD挑战是首个…

Android实践:查看Activity信息

问题:本地Android SDK的monitor无法正常运行,看不了进程相关信息,确认当前显示Activity十分不便 解决办法:使用adb shell指令可以快速查看 命令: adb shell dumpsys activity activities 这个命令用于获取Android设…