微软预计年底实现实时语音界面;硅基智能开源 AI 数字人交互平台 Duix丨 RTE 开发者日报

news2025/1/11 19:58:06

在这里插入图片描述

开发者朋友们大家好:

这里是 「RTE 开发者日报」 ,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE(Real-Time Engagement) 领域内「有话题的 新闻 」、「有态度的 观点 」、「有意思的 数据 」、「有思考的 文章 」、「有看点的 会议 」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。

本期编辑:@JLT,@鲍勃

01有话题的新闻

1、Meta 推出 LLM Compiler 代码优化模型,可搭配其他 AI 改善代码生成 / 编译能力

IT 之家 6 月 30 日消息,Meta 前天推出了一款名为「LLM Compiler」的模型,该模型基于 Meta 现有的 Code Llama 打造,主打代码优化,目前相关模型已登陆 Hugging Face,提供 70 亿参数及 130 亿参数两个版本,允许学术及商业使用。

Meta 认为,尽管业界各大语言模型已在各种编程代码任务中展现了出色的能力,但此类模型在代码优化还有进步空间,目前推出的 LLM Compiler 模型便是一款专为优化代码任务设计的预训练模型,能够模拟编译器对代码进行优化,或将「已经过优化的代码转换回原本的语言」。

IT 之家获悉,LLM Compiler 在 5460 亿个 LLVM-IR 和汇编代码标记的庞大语料库上进行了训练,据称能够达到 77% 的“代码优化潜力”,开发者可以自由将相关模型配合其他 AI 模型一起使用,从而改善生成代码的质量。(@IT 之家)

2、荣耀宣布与字节豆包大模型达成合作

据火山引擎官方消息,荣耀与字节豆包大模型现已达成合作,豆包大模型家族中的语音识别、角色扮演等多款模型将助力荣耀构建移动办公领域垂直模型落地应用的基础能力。据介绍,豆包大模型将为荣耀手机用户提供基于文档理解的互动问答、按照指定格式一键生成会议纪要,以及包括工作总结、演讲稿、会议议程、广告文案、现代诗等在内的多类型、多体裁、多风格智能辅助创作。

具体来看,以撰写企业全员活动邀请函这一场景为例,豆包大模型可以提供活动信息、撰写要求,并生成邀请函框架及具体内容,用户也可以通过自然语言对话来对成文进行后续的多次修改。(@CSDN)

3、马斯克宣布 xAI 将在 8 月份推出 Grok-2 大模型,预计年底推出 Grok-3

7 月 1 日消息,据国外媒体报道,在 3 月份推出 Grok-1.5,4 月份推出 Grok-1.5V 之后,由马斯克创立并领导的人工智能初创公司 xAI,在今年还将对 Grok 系列大模型进行两次重大更新,先后推出 Grok-2 和 Grok-3。

Grok-2 和 Grok-3 大模型将在今年推出,是由马斯克在社交媒体上透露的,其中 Grok-2 将在 8 月份推出,Grok-3 则是将在年底推出。

此外,马斯克还透露,计划年底推出的 Grok-3,将在 10 万块英伟达的 H100 上训练,有可能超越目前的人工智能基准,并真正抓住全球人工智能爱好者的想象力。(@TechWeb)

4、OpenAI CEO Sam Altman:GPT-5 将带来「巨大飞跃」

7 月 1 日消息,根据 Aspen Ideas Festival 上的一次访谈,Sam Altman 提到,开发「GPT-5」还需要一些时间。「我们目前持乐观态度,但还有很多工作要做。」Sam Altman 表示。

目前尚不清楚 GPT-5 的发布日期,但 Sam Altman 表示它将是「巨大飞跃(significant leap forward)」,或许是相较于其前辈 GPT-4 而言。此前,Sam Altman 曾公开表示 GPT-4「有些糟糕」,并委婉地称之为「充其量只是有点尴尬」。

Sam Altman 进一步解释说:「我希望它能取得重大飞跃。GPT-4 经常犯很多错误,比如在推理方面表现不佳,有时还会完全跑偏,犯下低级错误,就像连一个六岁孩子都不会犯的一样。」

Sam Altman 关于 GPT-5 的言论暗示,这个模型可能仍处于早期开发阶段。这可能归因于复杂算法、数据问题以及 GPT-5 本身庞大的体量。Sam Altman 将大型语言模型的开发类比为 iPhone 的发布,「第一款 iPhone 仍然存在很多漏洞,但足以让人们使用。」(@IT 之家)

5、硅基智能开源 AI 数字人交互平台 Duix,可快速创建部署逼真数字人

该平台旨在帮助开发者简化智能数字人的创建和部署过程,提供了丰富的工具和支持,无需技术团队的介入,即可在各种终端设备上部署数字人。用户可以下载多种数字人模型,适用于不同行业需求,并且该项目已开源,便于开发者进行二次开发和个性化定制。功能包括语音输入、语音输出、实时交互和多终端支持等。

此外,平台还提供虚拟助理服务,可应用于乘客服务、自动化客户服务、智能咨询服务、虚拟主持人等场景,提升用户体验和服务效率。(@AI 科技评论)

02有态度的观点

1、微软 AI CEO Mustafa Suleyman:今年年底,我们将拥有实时的语音界面,允许完全动态的交互

在近日阿斯彭思想节上,微软 AI 负责人 Mustafa Suleyman 与著名财经记者 Andrew Ross Sorkin 进行了一场深入对话。

Mustafa Suleyman 预计年底将实现实时语音界面,实现完全动态交互。Suleyman 强调, AI 的发展并不会像加密货币那样成为一时的热潮,而是会持续对社会产生深远影响。他指出,当前的 AI 技术已经在多个领域展现了其价值,这与加密货币在短时间内的表现形成鲜明对比。

在谈及中美技术竞争时,Suleyman 呼吁在保持竞争的同时,也应寻求合作的机会。他指出,尽管中美之间存在技术上的分裂,但全球化背景下的合作仍然是不可忽视的趋势。通过共同努力,双方可以在各自的技术生态系统中找到共存的方式。(@有新 Newin)

2、扎克伯格最新万字洞察:信息流媒体将转向个人及 AI 互动,看好这三类硬件

Meta CEO 扎克伯格预测,未来十年信息流媒体将转向个人及 AI 互动,智能眼镜将逐步取代手机。他看好全息眼镜、神经腕带等三类硬件,认为它们将改变人类互动方式,提升个性化体验。

扎克伯格强调 AI 技术将多样化,助力创作者和小企业定制 AI,丰富用户互动。他还提到,技术发展将使更多人追求创造力,AI 不会取代创意工作,而是提供新工具。(@有新 Newin)

写在最后:

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创,感兴趣的朋友请通过开发者社区或公众号留言联系,记得报暗号「共创」。

对于任何反馈(包括但不限于内容上、形式上)我们不胜感激、并有小惊喜回馈,例如你希望从日报中看到哪些内容;自己推荐的信源、项目、话题、活动等;或者列举几个你喜欢看、平时常看的内容渠道;内容排版或呈现形式上有哪些可以改进的地方等。

在这里插入图片描述

素材来源官方媒体/网络新闻

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1886722.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

基于matlab的控制系统串联校正—相位超前校正问题实例

1.问题 为了改进闭环系统性能,可以采用串联校正,这里用相位超前校正,即 α 常取 0.07~0.2 ,选择适当的 α 与 τ , 要使 针对新的开环传递函数 G ’ K (S)Gc(S) G(S) H(S) ,画出开环 Bode 图&#xff…

停车场车牌识别计费系统,用Python如何实现?

关注星标,每天学习Python新技能 前段时间练习过的一个小项目,今天再看看,记录一下~ 项目结构 说明: datefile文件夹:保存车辆信息表的xlsx文件 file文件夹:保存图片文件夹。ic_launcher.jpg是窗体的右上角…

Laravel swagger接口文档生成和管理

Laravel swagger接口文档生成和管理 接口开发随着时间推移接口会越来越多,随着多部门之间的协作越来越频繁, 维护成本越来越高, 文档的可维护性越来越差, 需要一个工具来管理这些接口的文档, 并能够充当mock server给调用方使用 这里推荐swagger生成和管理接口文档&…

Python入门 2024/7/2 While

目录 while循环的基础应用 循环输出十次:键盘敲烂,月入过万 计算1~100的和 用while循环练习猜数字 while循环的嵌套应用 打印九九乘法表 输出不换行的功能 while循环的基础应用 格式: while 条件: 条件满足时&#xff0c…

昇思25天学习打卡营第1天|yulang

今天主要了解了深度学习框架之昇思MindSpore的初学入门,没想到 ai学习入门如此简单,不愧是华为大手笔,提供的学习环境配置如此之高。这个平台有点类似百度飞桨,大大降低了AI开发门槛,使用户能够快速实现想要的模型&…

从零开始:如何设计一个现代化聊天系统

写在前面: 此博客内容已经同步到我的博客网站,如需要获得更优的阅读体验请前往https://mainjaylai.github.io/Blog/blog/system/chat-system 在当今数字化时代,聊天系统已成为我们日常生活和工作中不可或缺的一部分。从个人交流到团队协作,从客户服务到社交网络,聊天应用…

科技与水利的深度融合实践:揭秘智慧水利技术如何助力水利行业解决传统难题,推动水资源管理向精细化、智能化方向发展

本文关键词:智慧水利、智慧水利工程、智慧水利发展前景、智慧水利技术、智慧水利信息化系统、智慧水利解决方案、数字水利和智慧水利、数字水利工程、数字水利建设、数字水利概念、人水和协、智慧水库、智慧水库管理平台、智慧水库建设方案、智慧水库解决方案、智慧…

HR 如何用好人才测评系统?

HR 如何用好人才测评系统? 人才测评已经广泛应用在企业招聘、人才选拔,人才盘点,岗位晋升,绩效考评等领域,帮助HR提升人力资源管理效率,更好的发掘人才优势,在教育培训方面,人才测评…

我做了个C++算法学习网站,从语法到算法再到数据结构,全方位为算法竞赛小伙伴护航

哈喽,各位小伙伴大家好,我是大李。 最近半个月,我做了个《C算法宝典》并更新了40多篇教程,目前还在更新中,内容从语法到算法和数据结构,全方位为算法竞赛小伙伴护航。 温馨提示:如果你或你的朋…

prescan软件中导入路径文件txt/lpx

由于博主收到的是lpx格式的路径文件,因此,第一步 1.记事本打开 ctrla 全选 ctrlc 复制 2.新建一个excel 鼠标定位到第一行第一列的格子 ctrlv 复制 3.数据栏“分列”功能 4. (0.1递增的数列,纬度,经度,高程) 导入…

解决obsidian加粗字体显示不突出的问题

加粗字体显示不突出的原因:默认字体的加粗版本本来就不突出 解决方法:改成显示突出的类型Microsoft YaHei UI 【效果】 修改前:修改后: 其他方法: 修改css(很麻烦,改半天也不一定奏效&#…

中国民间网络外交组织(CCND)

中国民间网络外交组织Chinese Civil Network Diplomacy简称(CCDN) 是由中国网民建立起来的一个网络外交组织,深度贯彻党的主张和网民意志的统一,为保护中国中华优秀传统文化,民族自信,国家安全,民族利益,社…

pandas数据分析(4)

修改DataFrame数据的最简单的方法是通过loc和iloc属性为某些元素赋值。 首先构造一组数据 通过标签或位置设置值 也可以一次修改多个值: 通过布尔索引设置数据 将所有来自China,或者年龄20以下的人名字设置为匿名: 通过替换值设置数据 如果…

【讨论C++继承】

讨论C继承 继承定义继承方式和访问限定符 基类和派生类的赋值转换继承中的作用域派生类的默认成员函数继承和友元继承和静态成员菱形继承虚拟继承 继承是面向对象程序设计中,使代码可以复用的重要手段,它允许程序员在保持原有类特性的基础上进行扩展。 继…

CVPR 最佳学生论文,一键启动「BioCLIP 生物分类的层次预测 Demo」,帮你快速识别生物种类

很多生物由于外形的相似程度较高,难以使用肉眼进行区分。美国俄亥俄州立大学、微软研究院、加州大学欧文分校、伦斯勒理工学院共同发布了「BioCLlP: A Vision Foundation Model for the Tree of Life」, 基于 TREEOFLIFE-10M 这样的大规模标记数据集&…

海参海胆数据集:探索现实世界水下图像增强的创新之旅(目标检测)

亲爱的读者们,您是否在寻找某个特定的数据集,用于研究或项目实践?欢迎您在评论区留言,或者通过公众号私信告诉我,您想要的数据集的类型主题。小编会竭尽全力为您寻找,并在找到后第一时间与您分享。 在当今…

【触想智能】工业平板电脑在新能源领域上的应用分析

工业平板电脑是一种具有高性能和稳定性的计算机设备,适用于在恶劣环境下进行数据采集、运营管理和现场操作。 随着新能源技术的快速发展,工业平板电脑不断地得到应用,并且已成为新能源领域中的重要工具之一。本文将从四个方面探讨工业平板电脑…

springboot项目jar包修改数据库配置运行时异常

一、背景 我将软件成功打好jar包了,到部署的时候发现jar包中数据库配置写的有问题,不想再重新打包了,打算直接修改配置文件,结果修改配置后,再通过java -jar运行时就报错了。 二、问题描述 本地项目是springBoot项目…

短视频预算表:成都柏煜文化传媒有限公司

短视频预算表:精打细算,打造高质量视觉盛宴 在数字时代,短视频以其独特的魅力迅速占领了互联网内容的半壁江山,成为品牌宣传、文化传播乃至个人表达的重要载体。然而,每一个成功的短视频背后,都离不开一份…

试用笔记之-汇通来电显示软件

首先汇通来电显示软件下载 http://www.htsoft.com.cn/download/httelephone.rar