AI大模型日报#0527:豆包大模型披露评测成绩、天工AI日活超100万、AI初创集体跳槽OpenAI

news2024/9/8 10:21:59

导读:AI大模型日报,爬虫+LLM自动生成,一文览尽每日AI大模型要点资讯!

目前采用“文心一言”(ERNIE 4.0)、“零一万物”(Yi-Large)生成了今日要点以及每条资讯的摘要。欢迎阅读!

《AI大模型日报》今日要点:豆包大模型在评测中显示性能较上一代提升19%,尤其在中文能力上超越GPT-4。Snowflake通过收购AI观测平台TruEra,增强其AI数据云功能与可信度,助力企业确保AI应用准确高效。昆仑万维旗下天工AI凭借卓越技术,DAU超过100万,成为用户活跃的AI内容创作平台。中国电信发布支持30种方言的语音识别大模型,推动方言文化保护。博世团队提出参考神经算子,高效解决工业偏微分方程问题,显著降低学习复杂度。此外,CVPR 2024线上分享会公布日程,聚焦计算机视觉领域最新成果。陈丹琦团队推出SimPO方法,通过微调8B模型超越Claude3 Opus,为大型语言模型优化提供新思路。港大与字节跳动提出多模态大模型新范式Groma,模拟人类先感知后认知过程,提升交互性与指向性。马斯克则计划建造世界最大超算中心,投入10万块H100训练Grok以追赶GPT-4。同时,OpenAI在领导层股权争议和安全团队解散挑战后,迎来AI安全领域资深专家加盟,致力于加强AGI的安全准备工作。

标题: 豆包大模型披露评测成绩,较上一代“云雀”提升19%
 


摘要: 科技记者报道:豆包大模型在火山引擎原动力大会上发布,以低价策略进入市场,并在内部测试中显示出较上一代云雀模型提升19%的性能。在11个主流公开评测集上,豆包模型总分76.8分,优于其他国产模型,并在代码能力、专业知识和指令遵循方面有显著提升。尽管GPT-4在这些评测集上仍保持领先,豆包模型在中文能力上超越GPT-4。第三方评测结果预计将在未来一到两个月内公布。
网址: 豆包大模型披露评测成绩,较上一代"云雀"提升19% | 量子位
 
标题: 速递|Snowflake 宣布收购 AI 观测平台 TruEra!
摘要: Snowflake 宣布收购 AI 观测平台 TruEra,旨在增强其 AI 数据云的功能和可信度。TruEra 提供评估和监控 LLM 应用和 ML 模型的能力,帮助企业确保 AI 应用的准确性和高效性。此次收购将整合 TruEra 的技术团队,包括三位联合创始人,并进一步提升 Snowflake 在 AI 和 ML 数据治理方面的能力。Snowflake 表示,此次收购是其在生成式 AI 和机器学习能力上持续投资的一部分,以帮助客户最大化数据价值。
网址: 速递|Snowflake 宣布收购 AI 观测平台 TruEra!|Snowflake|ai|snowflake|truera|唱片|迷你专辑|音乐专辑_手机网易网
 
标题: 昆仑万维宣布天工AI每日活跃用户(DAU)超过100万
 


摘要: 昆仑万维旗下天工AI用户活跃度创新高,DAU超100万。受益于前瞻AI战略与领先产品能力,天工AI聚焦用户体验,优化产品,打造贴近用户场景的AI产品。据QuestMobile数据,3月月活跃用户近千万,成为国内AIGC APP月活跃用户第三。4月17日发布天工3.0与天工SkyMusic,模型技术强大,AI音乐领域领跑全球。4月访问量激增122.58%,增速榜单全国第二。天工AI以用户体验为中心,推出AI搜索研究/增强模式、AI PPT等功能,用户活跃度与留存数据屡创新高。智能体平台吸引用户创建UGC智能体,成为国内领先的AI智能体平台。自2023年4月17日推出以来,天工AI凭借卓越技术与领先产品性能,迅速获得用户青睐。下一步,昆仑万维将推动AI技术应用落地,优化模型技术与用户体验,打造用户首选的人工智能内容创作平台,赋能用户生成高质量AI UGC内容,为我国AI产业发展贡献力量。
网址: 昆仑万维宣布天工AI每日活跃用户(DAU)超过100万 | 机器之心
 
标题: 换了30多种方言,我们竟然没能考倒中国电信的语音大模型
 


摘要: 中国电信人工智能研究院(TeleAI)近日发布了业内首个支持30种方言自由混说的“星辰超多方言语音识别大模型”,该模型可同时识别理解粤语、上海话、四川话、温州话等各地方言,是国内支持最多方言的语音识别大模型。该模型通过构建超30种、超30万小时的高质量方言数据库,解决了方言数据稀疏的问题,并自主研发了星辰语音识别大模型。团队首创“蒸馏 + 膨胀”联合训练算法,实现了80层模型稳定训练,并通过超大规模语音预训练和多方言联合建模,使单一模型支持30种方言自由混说语音识别。该模型在国际权威赛事中斩获冠军,并在多项基准测试中表现出色,打破了单一模型只能识别特定单一方言的困境。星辰超多方言语音识别大模型已在多个场景中应用,包括智能客服系统,并有望在更广泛的社会生活场景中发挥价值,同时推动对方言文化的保护。
网址: 换了30多种方言,我们竟然没能考倒中国电信的语音大模型 | 机器之心
 
标题: 博世团队提出参考神经算子,学习偏微分方程解对几何变形的平滑依赖
 


摘要: 科技记者报道: 博世人工智能中心(BCAI)的研究人员开发了一种名为参考神经算子(RNO)的新型神经网络架构,旨在更高效地解决工业应用中常见的偏微分方程问题。传统的神经算子方法需要大量数据来训练模型,以确保解的准确性,这在仿真成本高昂的工程设计优化领域尤其困难。RNO 通过学习解对几何形状微小变化的依赖性,显著提高了数据利用效率。 RNO 方法的核心在于其能够预测参考解在几何形状微小扰动下的变化。这种方法不仅降低了学习复杂度,还在准确度上大幅领先基准模型,实现了高达80%的误差减少。RNO 的分层架构包括编码器、积分算子层和解码器,通过预测解的变化量而非直接预测解本身,降低了学习难度。 研究人员通过一系列实验验证了RNO的有效性,包括与多种基线模型的比较。RNO在所有测试问题上的表现均优于其他模型,尤其是在处理复杂几何形状变化的数据集时,展现了良好的泛化能力和处理自由形式变形的能力。这一创新方法为工程设计优化领域提供了高效、灵活的工具,特别是在单次仿真成本高昂的场景中。
网址: 博世团队提出参考神经算子,学习偏微分方程解对几何变形的平滑依赖 | 机器之心
 
标题: 大模型时代的计算机视觉!CVPR 2024线上分享会全日程公布
 


摘要: 自从 OpenAI 发布 ChatGPT 以来,科技界对大型语言模型和人工智能生成内容(AIGC)的关注度显著提升。在计算机视觉(CV)领域,研究热点也在不断变化。为了快速了解 AI 领域的最新科研成果与发展趋势,参加顶级会议论文分享会是一个有效途径。CVPR(计算机视觉与模式识别会议)作为 CV 领域的顶级会议,今年共收到 11532 份论文投稿,其中 2719 篇被接收,录用率为 23.6%。为了促进国内 CV 社区的学术交流,机器之心计划于 2024 年 6 月 1 日举办「CVPR 2024 线上论文分享会」,邀请 AI 社区成员参与。分享会将包括 Keynote 演讲和论文分享环节,并邀请顶级专家和论文作者就 CV 热门主题进行交流。
网址: 大模型时代的计算机视觉!CVPR 2024线上分享会全日程公布 | 机器之心
 
标题: 陈丹琦团队新作:微调8B模型超越Claude3 Opus,背后是RLHF新平替
摘要: 科技记者报道:陈丹琦团队推出新方法SimPO,这是一种简化的RLHF(Reinforcement Learning with Human Feedback)替代方案,旨在提升大型语言模型的性能。SimPO通过微调8B模型,成功超越了Claude 3 Opus,并在多项测试中表现出色。与DPO(Direct Preference Optimization)相比,SimPO不仅性能更优,而且资源消耗更低,训练时间和GPU使用量大幅减少。 SimPO的核心在于简化训练流程,摆脱了对参考模型的依赖,并通过长度归一化的对数概率来构建奖励函数,鼓励模型生成简洁且高质量的回复。此外,SimPO还引入了奖励差异项来加强优化信号,使模型能够更清晰地区分正负样本。 在AlpacaEval 2和Arena-Hard等基准测试中,SimPO调整后的模型表现超越了其他优化方法,包括DPO。同时,SimPO的开销也大幅减少,训练时间和GPU消耗均有所降低。 尽管SimPO展现出巨大潜力,但作者也指出了一些不足,如未明确考虑安全性和诚实性,以及在某些需要密集推理的任务上表现下降。未来,团队计划通过集成正则化策略等方法来改进SimPO。 SimPO的成果已开源,并迅速被大模型微调平台Llama-Factory引进。这项技术的创新性应用为大型语言模型的优化提供了新的思路。
网址: 陈丹琦团队新作:微调8B模型超越Claude3 Opus,背后是RLHF新平替 | 量子位
 
标题: 港大字节提出多模态大模型新范式,模拟人类先感知后认知
 


摘要: 香港大学和字节跳动商业化团队的研究人员提出了一种名为Groma的新范式,旨在提升多模态大模型的感知定位能力。Groma通过区域性图像编码来增强模型对图像中物体位置的识别,从而在视觉任务中实现更准确的定位。这种新方法允许模型将文本内容与图像区域直接关联起来,显著提升了对话的交互性和指向性。Groma的核心思路是将定位功能转移到多模态大模型的vision tokenizer中,利用vision tokenizer的空间理解能力来发现并定位潜在的物体,而无需外接专家模型。研究人员采用超过8M的数据来预训练Region Proposer,以提高定位的鲁棒性和准确性。实验结果显示,Groma在多个基准测试中表现优异,包括Grounding Benchmarks和VQA Benchmark。这种先感知后认知的模型设计不仅符合人类的视觉过程,还避免了重新训练大语言模型的计算开销。字节跳动正持续加大对顶尖人才和前沿技术的投入力度,参与行业顶尖的技术挑战和攻坚。
网址: 港大字节提出多模态大模型新范式,模拟人类先感知后认知 | 量子位
 
标题: 马斯克烧几十亿美元造最大超算中心,10万块H100训练Grok追赶GPT-4o
 


摘要: 科技巨头间的AI竞赛愈演愈烈,马斯克不甘落后,宣布将建造世界最大的超算中心。他的xAI公司发布了Grok 1.5,并计划推出Grok 2,但受限于算力不足。马斯克表示,训练Grok 2需要约2万个基于Hopper架构的英伟达H100 GPU,而Grok 3及更高版本将需要10万个H100芯片。特斯拉财报显示,公司受到算力限制,马斯克计划部署8.5万个H100 GPU。他希望在2025年秋季前让这台超级计算机运行起来,并与Oracle合作共建。这个「超级计算工厂」一旦完工,规模将至少是当前最大GPU集群的4倍。然而,Meta、微软和OpenAI也在积极扩建算力,竞争激烈。英伟达成为关键供应商,其H100和即将推出的B100 GPU将助力科技巨头升级算力。马斯克还指出,除了芯片短缺,电力供应将成为未来AI发展的主要限制因素。
网址: 马斯克烧几十亿美元造最大超算中心,10万块H100训练Grok追赶GPT-4o|英伟达|马斯克|电力_新浪新闻
 
标题: AI初创集体跳槽OpenAI,Ilya出走后安全团队重整旗鼓!
 


摘要: OpenAI面临领导层股权争议和AI安全团队解散的双重挑战。据报道,高级领导层对股权回收条款知情并签署,而安全团队的解散和未兑现的资源承诺引发了外界对OpenAI安全承诺的质疑。然而,随着Indent的CEO Fouad Matin及其团队加入OpenAI,致力于AGI安全准备,公司似乎正在重整旗鼓。Matin在AI安全和产品设计方面有着丰富的经验,他的加入可能会为OpenAI的安全工作带来新的活力。
网址: AI初创集体跳槽OpenAI,Ilya出走后安全团队重整旗鼓!|AI_新浪新闻
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1703061.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

9.游戏中真正的无敌

上一个内容:8.什么是HOOK 在 7.封装读写游戏数据的功能2 中写是无限循环给生命值的内存地址赋值达到无敌的效果,这个方式有很大的弊端比如如果怪物的攻击力很高我们碰一下我们就得死这样的情况无限赋值也没用了,所以给内存写值的方式实现的无…

HTTP 与 HTTPS 对比

HTTP:HTTPS:超文本传输协议 超文本传输安全协议加入SSL/TLS协议,依靠证书来验证服务器的身份需要到CA申请证书,需要一定费用TCP 协议 80 端口 TCP 协议 443 端口更耗费服务器资源

深度学习环境安装教程-anaconda-python-pytorch

首先是anaconda的安装,可以从下面地址下载安装包 Index of /anaconda/archive/ | 清华大学开源软件镜像站 | Tsinghua Open Source Mirror 尽量选择最新的日期的anaconda进行安装,我这里是windows电脑,因此选择了windos-x86_64.exe&#xf…

idea中git拉取失败

之前clone好好的,今天突然就拉取不下来了。很多时候是用户凭证的信息没更新的问题。由于window对同一个地址都存储了会话。如果是新的会话,必须要更新window下的凭证。 然后根据你的仓库找到你对应的账户,更新信息即可。

Windows10映射网络驱动器之后不显示映射盘

目录 背景解决步骤1、按 Windows R 打开运行2、打开注册表编辑器3、 System上新建-- DWORD(32bit)4、对新建的文件重命名5、将EnableLinkedConnections的数值改为16、退出注册表编辑器,重启系统。 知识扩展断开连接备份注册表 背景 目前有一台NAS服务器,和一台lin…

知了汇智赵老师:揭秘OpenHarmony鸿蒙设备开发新路径

在数字化浪潮风起云涌的今天,鸿蒙系统作为华为自主研发的分布式操作系统,正以其强大的生态构建能力和广泛的应用前景,引领着物联网领域的新潮流。在这个关键时刻,知了汇智作为产教融合平台型服务机构,勇担时代使命&…

网络通讯聊天工具的实现

学习网络与通信,实现聊天界面能够通过服务器进行私聊和群聊的功能。 1.服务器:ServeSocket 客户端先发送消息给服务器,服务器接受消息后再发送给客户端。 利用服务器随时监听。等待客户端的请求,一旦有请求便生产一个socket套接…

openEuler系统通过shell脚本安装openGauss 5.0.0企业版

上次提到的开机自启动的配置,获得了LD的称赞,然而LD的要求,都是“既得陇复望蜀”的,他又期望我们能实现openGauss安装的“自动化”,于是尝试了下用shell脚本部署,附件中的脚本实测有效,openEule…

aws lakeformation跨账号共享数据的两种方式和相关配置

lakeformation授权方式分为 基于tag的授权基于命名资源的授权 先决条件 跨账号共享数据的先决条件(命名资源和tag授权都需要) 分两种情况 如果账户中没有glue data catalog资源策略,则LakeFormation跨账户授予将照常进行 如果存在glue d…

使用高性能NIO框架netty实现IM集群对聊方案

文章目录 前言技术积累什么是nettynetty如何实现IM如何实现IM集群 实战演示基础配置netty搭建IM集群redis发布订阅 实战测试 前言 在前面的博文中我们分享了原生websoket集群搭建,也用redis 发布订阅实现了集群消息正常有序分发。但是有不少同学希望风向一期netty实…

基于生命周期评价法的农田温室气体排放估算;农田CH4和N2O排放模拟;农田碳库模型和土壤呼吸等

目录 专题一 温室气体排放模拟研究 专题二 农田CH4和N2O排放模拟 专题三 农田碳库模型和土壤呼吸 专题四 基于生命周期评价法的农田温室气体排放估算 专题五-六 基于过程模型的温室气体排放模拟 专题七 案例模拟与疑难解答 更多应用 农业是甲烷(CH4&#xff…

List基本使用(C++)

目录 1.list的介绍 2.list的使用 list的构造 list的size() 和 max_size() list遍历操作 list元素修改操作 assign()函数 push_front(),push_back 头插,尾插 pop_front() pop_back 头删尾删 insert()函数 swap()函数 resize()函数 clear()函数 list类数…

yolov10 瑞芯微 rknn 部署 C++代码

yolov10 目标检测rknn的C部署来了。 特别说明:如有侵权告知删除,谢谢。 直接上代码和模型,欢迎参考交流 【完整代码和模型】 1、rknn模型准备 pytorch转onnx,onnx再转rknn模型这一步就不再赘述,请参考上一篇 【yolov1…

TPM之VMK密封

本篇文章主要介绍基于TPM的Bitlocker全盘加密时,VMK密钥的密封(Seal)流程,至于TPM、Bitlocker、密钥保护器、VMK密钥等这些东西是什么,这里不做解释,需要自己脑补一下(╮(╯▽╰)╭)。 首先看看一张结构图(来自网络),了解一下TPM加密的基本框架与流程: 同样,基于…

关于读书,你可能没想到的陷阱、问题和思考

最近经常看到有人问:AI 已经这么发达了,如果以后的 AI 会更智能,那我们还有必要读书吗? 我认为:还是十分有必要的。 为什么呢?因为读书其实不仅仅是为了获取知识,它更重要的一个作用&#xff0c…

数据结构-堆排序问题

需要在数组里面进行排序,我们可以采取堆排序对其解决问题 版本1: 创建一个数组等大的堆,把数组里面的数值输入到堆里面进行堆排序,但是这样的弊端就是,不是顺序排序 版本2: 每次我们取堆顶然后打印&#xf…

3440亿!国家大基金三期正式落地,关注半导体与算力芯片!

重磅消息来了! 5月24日,注册规模3,440亿元人民币的“国家集成电路产业投资基金三期股份有限公司”正式成立,这也意味着,传闻已久的**“国家大基金三期”正式落地!** 企查查股东信息显示,该公司由财政部、国…

移动云:开发者手中的未来钥匙

《移动云:开发者手中的未来钥匙》 引言一、无缝集成,加速开发进程二、数据智能,洞悉用户心声三、安全合规,护航创新之旅四、成本优化,助力轻装前行总结 引言 在科技日新月异的今天,移动云已成为推动行业变革…

文件夹类型异常成文件:原因解析与恢复策略

在数字时代,数据的安全与完整性对于个人和企业都至关重要。然而,有时我们可能会遇到一种令人困惑的情况:原本应该是文件夹的图标,却突然变成了文件的图标,这就是所谓的“文件夹类型成文件”问题。本文将深入探讨这一现…

(原创)从右到左排列RecycleView的数据

问题的提出 当我们写一个Recycleview时,默认的效果大概是这样的: 当然,我们也可以用表格布局管理器GridLayoutManager做成这样: 可以看到,默认的绘制方向是: 从左到右,从上到下 那么问题来了…