AI大模型日报#0626:首款大模型芯片挑战英伟达、面壁智能李大海专访、大模型测试题爆火LeCun点赞

news2024/10/5 20:20:36

导读:AI大模型日报,爬虫+LLM自动生成,一文览尽每日AI大模型要点资讯!

目前采用“文心一言”(ERNIE-4.0-8K-latest)生成了今日要点以及每条资讯的摘要。欢迎阅读!

《AI大模型日报》今日要点:今日AI大模型领域的资讯涵盖了多个方面,从企业级应用到技术创新均有涉及。OpenAI平台主管的访谈聚焦于如何服务企业级金融,而字节跳动发布的Seed-TTS语音合成大模型则展现了语音生成技术的最新进展,能够生成与真人几乎一样的语音。在视觉生成方面,旷视科技开源的AI人像视频生成框架MegActor通过输入静态肖像图片即可生成表情丰富的视频。商汤绝影大模型与吉利集团子品牌翼真汽车的合作,则标志着AI大模型在智能座舱体验方面的新应用。 同时,在AI生成内容版权问题上,陈丹琦团队的研究提出了避免生成版权角色的策略。在硬件方面,Etched公司推出的首款大模型专用ASIC芯片Sohu,挑战了英伟达的市场地位。而新的大模型Benchmark的推出,则引发了对GPT-4等顶尖大模型推理能力的讨论。此外在生命科学领域,全新蛋白质大模型ESM3和清华大学团队发布的细胞大模型scFoundation,均体现了AI在模拟生物进化和细胞研究中的应用潜力。最后,面壁智能CEO李大海分享了对端侧模型的看法,强调了其在AI落地中的现实意义。这些进展共同展示了AI大模型在技术创新和应用拓展方面的活力。

标题: OpenAI如何服务企业级金融 | OpenAI平台主管1.5万字访谈 (全文+视频)
摘要: 这个链接可能存在安全风险,为了保护您的设备和数据安全,请避免访问此链接。
网址: OpenAI如何服务企业级金融 | OpenAI平台主管1.5万字访谈 (全文+视频)|aws|openai|人工智能|企业级金融|初创公司|大模型|谷歌_手机网易网
 
标题: 耳朵没错,是声音太真了,字节豆包语音合成成果Seed-TTS技术揭秘


摘要: Seed-TTS是字节跳动豆包大模型团队发布的语音生成大模型,能生成与真人几乎一样的语音,包括发音瑕疵,且能模仿人类说话。它可以根据文本生成全新语音,并带上原素材的声音特征,实现音色定制,甚至可以根据小说情节和不同角色特质,呈现对应人物和情绪的“说书”。该模型已在C端产品上线,并获得用户好评。技术亮点包括细节建模、高自然度和稳定性、数据覆盖量级大、模型设计等,研究价值在于试图回答过去未解决的问题,如语音建模的适合性、语音表征设计等。此外,Seed-TTS同时提供了基于语言模型和扩散模型的两种技术方案。
网址: 耳朵没错,是声音太真了,字节豆包语音合成成果Seed-TTS技术揭秘 | 机器之心
 
标题: 旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情包
 


摘要: 旷视科技发布了新的开源AI人像视频生成框架MegActor,只需输入静态肖像图片和视频文件,即可生成表情丰富、动作一致的AI人像视频。MegActor采用原始视频驱动方式,能够捕捉细致表情和运动信息,生成更加保真且动作一致的视频。该框架通过条件扩散模型、前景背景分割等技术解决了ID泄露和背景干扰问题。MegActor支持不同驱动视频和画风,训练数据全部来自公开可获取的开源数据集。目前,MegActor已完全开源,供开发者和用户使用。
网址: 旷视开源的AI人像视频生成太炸了!输入照片即可模仿任意表情包 | 机器之心
 
标题: 当AGI遇见「陆地空客」,商汤绝影大模型上车LEVC
 


摘要: 6月25日,吉利集团子品牌翼真汽车(LEVC)首款豪华纯电MPV翼真L380在浙江乌镇发布,被誉为“陆地空客”。该车依托AI大模型,提供创新的智能座舱体验,由中国智能座舱领军企业商汤绝影与LEVC联手打造。商汤“日日新5.0”大模型在多项评测中超越GPT-4,为翼真L380提供“AI闲聊”、“美图壁纸”和“童话绘本”等解决方案,将为用户带来全新智慧出行体验。此次上市标志着商汤“日日新5.0”首次正式量产上车,为百年英国高端汽车品牌注入通用人工智能(AGI)新活力。
网址: 当AGI遇见「陆地空客」,商汤绝影大模型上车LEVC | 机器之心
 
标题: 陈丹琦团队新作:教你避免成为任天堂的被告
 


摘要: 陈丹琦团队发布新研究,教如何避免AI生成版权角色。研究构建评估套件,包含50个流行版权角色,发现模型易生成版权角色,且间接锚定也可能触发版权内容生成。团队探讨几种策略,发现结合提示重写和负面提示最能减少版权角色生成风险,同时保持用户意图一致性。研究者提醒用户和模型部署者需警惕间接锚定,建议结合使用负面提示等技术。该研究由普林斯顿等多所大学共同完成,论文已发布。
网址: 陈丹琦团队新作:教你避免成为任天堂的被告 | 量子位
 
标题: 一张顶20张H100!首款大模型专用芯片挑战英伟达,哈佛辍学华人创办
 


摘要: 科技初创公司Etched推出首款大模型专用ASIC芯片Sohu,该芯片专门针对Transformer算法进行优化,实现每秒处理50万个tokens的高吞吐量,性能超越英伟达H100达20倍,且成本更低。Etched由两位哈佛辍学生创办,已完成1.2亿美元A轮融资,Peter Thiel等知名投资人参与。Sohu芯片的推出可能改变AI推理领域的竞争格局,尽管有质疑声音认为专用芯片可能面临架构过时的风险,但Etched团队认为专用化是提升性能和效率的关键。业界对此充满关注与讨论。
网址: 一张顶20张H100!首款大模型专用芯片挑战英伟达,哈佛辍学华人创办 | 量子位
 
标题: 大模型测试题爆火,GPT-4和Claude3都跪了,LeCun转发:新Benchmark
摘要: 科技新闻要点: 1. 新的大模型Benchmark在推特上引起热议,LeCun也转发并点赞。 2. GPT-4和Claude 3等顶尖大模型在面对逻辑学中的“动物过河”问题时均未能给出正确答案。 3. 网友定义新名词“劣效比率”来衡量模型表现,但更多是一种玩笑,不太能比较出模型能力。 4. 针对此Benchmark,12款国产大模型如文心一言、通义千问等也进行了测试,结果全军覆没。 5. 测试显示,大模型在推理能力方面仍有不足,且训练数据对模型输出有显著影响。 6. 模型未能仔细读题,导致无法识别问题中的变化,进一步证实了训练数据与输出的关系分析。
网址: 大模型测试题爆火,GPT-4和Claude3都跪了,LeCun转发:新Benchmark | 量子位
 
标题: 模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞
 


摘要: 继AlphaFold 3更新后,生命科学领域又迎来大模型ESM3。该模型由Evolutionary Scale AI初创公司开发,专注于蛋白质序列、结构和功能的推理,具有多模态能力,在27.8亿个蛋白质上训练,能模拟进化过程。ESM3已开源,并与AWS和英伟达合作,但模型权重尚未在HuggingFace公开。该模型训练参数达98B,使用了Andromeda集群。ESM3通过掩码语言模型训练,能实现「全对全」预测,有助于设计新蛋白质。其能力随规模增加涌现,可自我改进并与实验结果对齐。ESM3的开发是生物学可编程化的重要一步,旨在模拟5亿年的进化。
网址: 模拟5亿年自然进化史,全新蛋白质大模型ESM3诞生!前Meta老将力作LeCun转赞|训练_新浪新闻
 
标题: 1亿参数的细胞大模型来了!登Nature子刊,清华大学团队发布scFoundation:对2万基因同时建模
 


摘要: 近年来,大规模预训练模型在人工智能领域掀起新浪潮,通过从海量数据中提取深层规律,服务于不同领域的多样化任务。在生命科学领域,基于细胞的“语言”开发人工智能细胞大模型,有望为生命科学和医学提供全新的研究工具。然而,训练大规模单细胞数据面临诸多挑战,如数据库缺失、处理难度大等。清华大学张学工教授、马剑竹教授和百图生科宋乐博士合作研究,于2024年6月发表题为“Large-scale foundation model on single-cell transcriptomics”的论文,介绍了名为scFoundation的细胞大模型。该模型基于5千万个细胞的基因表达数据训练,能同时处理约2万个基因,采用非对称设计减少计算和内存挑战,为基因网络推断和转录因子识别提供了新的研究思路。此外,该模型在细胞测序深度增强、药物响应预测等任务中表现出卓越性能,提供了人工智能在单细胞研究中的新范式。研究人员还构建了全面的单细胞数据集,并设计了一种名为RDA的预训练任务,考虑了测序深度的高方差。该模型有望为生命科学和医学研究提供强大的新工具。
网址: 1亿参数的细胞大模型来了!登Nature子刊,清华大学团队发布scFoundation:对2万基因同时建模 - 智源社区
 
标题: 对话面壁智能李大海:离用户更近的端侧模型,才是 AI 落地更现实的途径
 


摘要: 科技记者提炼要点: 2026年,面壁智能计划推出达到GPT-4水平的端侧模型,基于独特理解的Scaling Law,在8B模型上已实现多模态能力。在Google和Apple推出端侧模型后,该领域变得热门。面壁智能CEO李大海认为,端侧模型因离用户更近而更具现实意义。在AGI Playground 2024上,李大海分享了心路历程和对端侧模型的看法,强调了效率、隐私和环境互动的重要性。他相信,端侧模型将像私人管家一样,成为用户信任的伙伴。
网址: 对话面壁智能李大海:离用户更近的端侧模型,才是 AI 落地更现实的途径 | 极客公园
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1865739.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

深入理解计算机系统 CSAPP 家庭作业7.12

A:refptr (unsigned)(ADDR(r.symbol) r.addend - refaddr) 0x4004f8 (-4) - 0x4004ea 0xa B:refaddr 0x4004d0 0xa 0x4004da refptr 0x400500 (-4) - 0x4004da 0x22 ​​​​​​​

第三届人工智能、物联网与云计算技术国际会议(AIoTC 2024)

第三届人工智能、物联网与云计算技术国际会议(AIoTC 2024)将于2024年9月13日-15日在中国武汉举行。本次会议由华中师范大学伍伦贡联合研究院与南京大学联合主办、江苏省大数据区块链与智能信息专委会承办、江苏省概率统计学会、江苏省应用统计学会、Sir Forum、南京理工大学、南…

1.Android逆向协议-环境搭建

免责声明:内容仅供学习参考,请合法利用知识,禁止进行违法犯罪活动! 内容参考于:易锦网校 不是安卓逆向吗?为什么写java代码?因为逆向的时候涉及java语言 JDK环境搭建:JDK是JAVA语…

云计算-期末复习题-框架设计/选择/填空/简答(2)

目录 框架设计 1.负载分布架构 2.动态可扩展架构 3.弹性资源容量架构 4.服务负载均衡架构 5.云爆发结构 6.弹性磁盘供给结构 7.负载均衡的虚拟服务器实例架构 填空题/简答题 单选题 多选题 云计算期末复习部分练习题,包括最后的部分框架设计大题(只是部分…

ITSG、COST-G、Tongji和WHU Level-2数据产品读取绘图(Matlab)

数据介绍: ICGEM International Center for Global Gravity Field Models (gfz-potsdam.de) ITSG 2018:Institute of Geodesy at Graz University of Technolog(格拉茨理工大学大地测量研究所) 2018版本,最高60阶球谐…

通信系统网络架构_3.移动通信网络架构

移动通信网为移动互联网提供了强有力的支持,尤其是5G网络为个人用户、垂直行业等提供了多样化的服务。以下从业务应用角度给出面向5G网络的组网方式。 1.5GS与DN互连 5GS(5G System)在为移动终端用户(User Equipment,…

JVM专题十二:JVM 中的收集器二

上一篇JVM专题十一:JVM 中的收集器一咱们介绍了垃圾收集器的分类,已经主流的分代垃圾收集器重点看了CMS与三色标记算法,本篇咱们继续来看意G1、ZGC等。 G1收集器 G1(Garbage-First Garbage Collector)是一种服务器端的…

Gone——golang依赖注入框架介绍

文章目录 Gone是什么特性小试牛刀概念与启动流程人话版本鬼话版本代码版本 关于Logo Gone是什么 首先,Gone是Golang的一个轻量级的依赖注入框架,目前依赖注入的装配流程是通过反射来实现的;虽然golang的反射一直被人诟病太慢,但是…

是时候系统性的的学习那些开发中必备的软件了!

大家好,我是 王有志,一个分享硬核 Java 技术的金融摸鱼侠,欢迎大家加入 Java 人自己的交流群“共同富裕的 Java 人”。 最近小组内心来了两个实习生,各方面都很不错,基础知识扎实,勤奋好学(卷&…

Win10,Win11电脑重装系统怎么操作,简单一步搞定【保姆级教程】

电脑重装系统怎么操作?电脑使用时间长了,就会出现系统崩溃、病毒感染或者是系统文件损坏等问题。这个时候我们就可以对电脑进行系统重装,也就是恢复电脑出厂设置。现在市面上有很多系统重装工具可以帮助我们解决难题,如果您是电脑…

【ajax实战03】拦截器

一:axios拦截器 拦截器分类: 请求拦截器以及响应拦截器 拦截器作用: 在请求或响应被then或catch处理前拦截它们 二:请求拦截器 作用: 发起请求之前,调用一个配置函数,对请求参数进行设置…

如何使用 Postgres 折叠您的堆栈 实现一切#postgresql认证

技术蔓延如何蔓延 假设您正在开发一款新产品或新功能。一开始,您的团队会列出需要解决的技术问题。有些解决方案您将自行开发(您的秘诀),而其他解决方案您将使用现有技术(可能至少包括一个数据库)来解决。…

LDO芯片手册,实例应用分析

在进行电路设计时LDO是经常用到的,尤其在为芯片,晶振等敏感电路进行供电时应用更多,下面选取一款比较常用的LDO芯片,一起进行更深入的学习。 SGM2036特点简介 SGM2036,圣邦微一款比较常用的LDO芯片手册 可以先大致看…

面试题-CAS(compare and swap)

1.CAS机制 悲观锁:始终假定会发生并发冲突,因此会屏蔽一切可能违反数据完整性的操作。 乐观锁:假设不会发生并发冲突,因此只在提交操作时检查是否违反数据完整性。 执行CAS操作时,比较内存位置的值(主内存的值)与预期…

fiddle查看请求耗时 设置超时背景

windows 下,打开 fiddler 时直接用 快捷键:CTRL R 打开 或 从路径:Rules -> Customize Rules… 打开 // 显示每行请求的服务端耗时时间 public static BindUIColumn("TimeTaken/ms", 120)function TimeTaken(oS: Session):Stri…

信号与系统实验-实验五 离散时间系统的时域分析

一、实验目的 1、理解离散信号的定义与时域特征,掌握在时域求解信号的各种变换运算; 2、掌握离散系统的单位响应及其 MATLAB 实现的方法; 3、掌握离散时间序列卷积及其 MATLAB 实现的方法; 4、掌握利用 MATLAB 求解微分方程&a…

倍增法找lca——最近公共祖先

对于结点x和y,需要找他们的最近公共祖先 一个最简单的办法就是沿着x和y的父节点一个一个往上找 这样的时间复杂度是o(n),对于较大的数据量会TLE 今天要使用的方法是利用倍增来加速这个找lca的过程 倍增算法: 按2的倍数来往上找&#xff0…

Python 基础 (标准库):堆 heap

1. 官方文档 heapq --- 堆队列算法 — Python 3.12.4 文档 2. 相关概念 堆 heap 是一种具体的数据结构(concrete data structures);优先级队列 priority queue 是一种抽象的数据结构(abstract data structures)&…

C#+uni-app医院HIS预约挂号系统源码 看病挂号快人一步

​​​​​​​ 提到去大型医院机构就诊时,许多人都感到恐惧。有些人一旦走进医院的门诊大厅,就感到迷茫,既无法理解导医台医生的建议,也找不到应该去哪个科室进行检查。实际上,就医也是一门学问,如何优化…

【STM32 RTC实时时钟如何配置!超详细的解析和超简单的配置,附上寄存器操作】

STM32 里面RTC模块和时钟配置系统(RCC_BDCR寄存器)处于后备区域,即在系统复位或从待机模式唤醒后,RTC的设置和时间维持不变。因为系统对后备寄存器和RTC相关寄存器有写保护,所以如果想要对后备寄存器和RTC进行访问,则需要通过操作…