1 大模型「强崩溃」!Meta新作:合成数据有「剧毒」,1%即成LLM杀手
新智元|阅读原文
1%合成数据,就能让模型瞬间崩溃!甚至,参数规模越大,模型崩溃越严重。Nature封面一篇论文证实,用合成数据训练模型就相当于「近亲繁殖」,9次迭代后就会让模型原地崩溃。随着越来越多的合成数据出现在训练集中,一种新的现象应运而生:「模型崩溃」。所谓「模型崩溃」,是指随着时间的推移,LLM或大型图像生成器在其前几代生成的数据上进行递归训练,导致性能下降,直至模型完全丧失能力的情况。围绕着这个问题,AI学界和业界的大佬依旧莫衷一是,尚未达成一致的结论。
2 李飞飞「数字表兄弟」破解机器人训练难题!零样本sim2real成功率高达90%
新智元|阅读原文
在用模拟环境训练机器人时,所用的数据与真实世界存在着巨大的差异。为此,李飞飞团队提出「数字表亲」,这种虚拟资产既具备数字孪生的优势,还能补足泛化能力的不足,并大大降低了成本。数字表亲虽然没有直接模拟现实世界的对应物,却仍然能够捕获相似的几何和语义功能。这样,它就大大降低了生成类似虚拟环境的成本,同时通过提供类似训练场景的分布,提高了从模拟到真实域迁移的鲁棒性。
构建一组数字表亲由三个连续步骤组成:
- 数字表亲匹配:利用第一步提取的信息,结合预先准备的3D模型资产数据集,为检测到的每个对象匹配相应的数字表亲。
- 场景生成:对选择的数字表亲进行后处理并编译在一起,生成一个物理上合理且完全交互式的模拟场景。
- 信息提取:首先,从输入的RGB图像中提取对象信息。
通过这三个步骤,ACDC能够自动创建与输入图像语义相似但不完全相同的虚拟场景,为机器人策略训练提供多样化的环境。
3 国际银行家:ChatGPT等将彻底颠覆银行业务
AIGC开放社区|阅读原文
生成式AI在银行业最有前景的应用之一是增强研究和分析能力。这项技术可以显著提高金融研究的速度、深度和规模,使分析师能够以前所未有的效率生成洞察力并做出决策。
通过分析大量结构化和非结构化数据,生成式AI驱动的系统可以比传统方法更早、更准确地识别潜在风险。
生成式AI为更深入的调查和风险分析开辟了新的可能性。一些关键应用包括:验证实体信息、更新风险概况和进行筛选检查;可以整理相关信息,建议调查线索,甚至起草调查报告;帮助合规团队通过总结关键变化及其对KYC/AML流程的影响,跟上不断演变的法规。
4 除了Ilya,刚拿诺奖的Hinton还教出了这些AI博士
机器之心|阅读原文
自近日获知自己摘得诺贝尔物理学奖之后,76 岁的人工智能教父 Geoffrey Hinton 便「闲不住」了。
Hinton 表示自己非常幸运,遇到了很多聪明的学生,他们取得了非常大的成功,有的做出了伟大的成果。其中他为弟子 Ilya「解雇」奥特曼而感到自豪,并认为奥特曼现在更关心利润而不是安全。他同时呼吁加强对 AI 安全以及由好奇心驱使的基础研究的支持。
对此,你怎么看?
详情查看参与互动赢蚂蚁周边
支付宝开放平台-开发者社区
「AGI 之路」 内容库
欢迎你的投稿!戳我进群
支付宝/钉钉扫码加入支付宝开发者钉组织,可了解支付宝开放能力最新动态,订阅文档更新消息,和同城同行业交流业务,与支付宝产研沟通交流。