AI大模型日报#0529:杨红霞创业入局“端侧模型”、Ilya左膀右臂被Claude团队挖走

news2024/9/20 19:31:34

导读:AI大模型日报,爬虫+LLM自动生成,一文览尽每日AI大模型要点资讯!

目前采用“文心一言”(ERNIE 4.0)、“零一万物”(Yi-34B)生成了今日要点以及每条资讯的摘要。欢迎阅读!

《AI大模型日报》今日要点:前字节跳动大语言模型专家杨红霞离职创业,专注开发端侧AI模型,其团队已获数千万美元投资,投后估值达1.5亿美元。端侧模型因成本低、移动性强及数据安全优势,正成为行业新宠。 教育科技方面,网易有道推出了“子曰”教育大模型及三大AI创新应用,包括AI全科学习助手、新一代虚拟人口语教练与知识库问答引擎,强化其在AI商业化领域的领先地位,并积极参与行业大模型标准制定。 在科研领域,香港理工大学等机构联合开发的上下文分子微调方法,为大语言模型在化学任务上的应用提供了新范式,显著提升了模型在分子描述与结构间翻译的能力。 字节跳动研究人员提出的物理引导方法,通过新的扩散模型让蛋白质动起来,填补了AlphaFold3在蛋白质动态行为刻画上的空白,为药物设计和生物过程理解提供了更强大的工具。 此外,OpenAI在经历高层变动后,正致力于开发新一代大模型,并加强安全保障工作,而竞争对手Anthropic则挖角了OpenAI前研究人员,双方在大模型领域的竞争愈发激烈。 另一方面,阿里云开发了首个全生物系统的核酸与蛋白语言融合模型LucaOne,其训练推理代码已开源,并在多种生物任务中表现出色,为AI在生物科学的应用开辟了新路径。 最后,在蚂蚁集团首次对外开放的技术日上,众多基于大模型的创新应用亮相,凸显了AI在智能生活、金融、医疗健康等领域的广泛潜力与落地进展。

标题: 独家|杨红霞创业入局“端侧模型”,投后估值 1.5 亿美元
摘要: 字节跳动前大语言模型专家杨红霞离职创业,专注于开发端侧AI模型,目标是打造AI Agent。她的团队已获得数千万美元投资,估值1.5亿美元。杨红霞曾领导阿里达摩院的M6模型项目,并在字节跳动AI Lab担任要职。随着通用大模型格局收缩,端侧模型因其成本低、移动性强、数据安全等优势,成为行业新热点。
网址: 独家|杨红霞创业入局“端侧模型”,投后估值 1.5 亿美元|ai|杨红霞|端侧模型|视频生成模型|陈伟_手机网易网
 
标题: 持续领跑教育科技,有道再发「子曰」教育大模型全新应用
 


摘要: 网易有道在北京举行了“子曰”教育大模型媒体交流会,展示了其最新技术进展和三大AI创新应用:AI全科学习助手“有道小P”APP、新一代虚拟人口语教练Hi Echo 3.0和新一代知识库问答引擎QAnything。CEO周枫强调了“模型即应用”的时代,并表示有道将聚焦场景开拓和应用落地,提升产品效率和交互体验。有道已推出超10款大模型落地应用,并在AI商业化上取得突破性进展,一季度会员销售额同比增长140%。有道还参与了行业大模型标准制定工作,助力国家大模型产品发展。新应用“有道小P”集成了多种场景下的互动答疑与交互功能,并将在手机端便捷使用。Hi Echo 3.0则针对中国学生学习英语的需求,提供了雅思口语练考服务。QAnything作为企业AI大脑,已服务了20多个行业的上百家客户。有道积极拓展多样化的应用场景,并不断提升模型能力,同步提升模型和产品。
网址: 持续领跑教育科技,有道再发「子曰」教育大模型全新应用 | 机器之心
 
标题: 为百亿参数LLM化学应用提供新范式,香港理工大学提出上下文分子微调
 


摘要: 香港理工大学、上海交通大学和上海人工智能实验室的研究人员联合发表了一篇论文,介绍了他们开发的上下文分子微调(ICMA)方法,这是一种新颖的范式,用于在大语言模型中进行分子-描述翻译。ICMA通过混合模态上下文召回、召回后重排和上下文分子微调三个阶段,提高了模型在分子和分子文本描述之间进行翻译的能力。研究人员在ChEBI-20和PubChem324K数据集上进行了实验,结果显示ICMA能够显著提升性能,甚至接近或达到最新的基准水平。该方法的贡献在于它不需要额外的领域预训练,为大语言模型在化学任务上的应用提供了新的思路,并通过学习上下文例子中分子描述片段与分子SMILES结构的对应关系,精细化了分子描述和分子的对齐。此外,ICMA对模型的大小和类型不那么敏感,即使是较小的模型也能获得性能提升。这项研究表明,大语言模型可以成为上下文分子学习的有效工具,为科学领域的应用提供了新的方法和思路。
网址: 为百亿参数LLM化学应用提供新范式,香港理工大学提出上下文分子微调 | 机器之心
 
标题: 填补AlphaFold3空白,字节跳动提出物理引导的方法让蛋白质动起来
 


摘要: 科技记者报道: 世界在不断变化,分子也在持续运动,这使得对蛋白质等生物分子的功能研究需要从静态单一结构预测转向动态构象分布的探索。这种转变对于理解蛋白质与其他分子的相互作用、识别潜在药物位点以及设计更具特异性和效力的治疗药物至关重要。然而,传统的分子动力学模拟方法因其昂贵和耗时的特性,难以跨越长的时间尺度来观察重要的生物过程。 近年来,深度学习在蛋白质结构预测领域取得了显著进展,但包括Deepmind的AlphaFold 3在内的模型仍然主要专注于预测静态单一结构,对蛋白质动态行为的刻画还不够充分。 为了解决这一问题,来自字节跳动 ByteDance Research 的研究人员提出了一种名为CONFDIFF的蛋白质构象生成扩散模型。该模型利用物理知识来引导模型与真实世界对齐,同时规避了实时力场和能量计算的复杂性,相比传统方法有巨大的加速。 CONFDIFF模型在SE(3)空间上构建了一个非条件的生成扩散模型,通过预测主链原子坐标和主链朝向来构建蛋白质构象。为了充分利用先验结构和序列信息,CONFDIFF使用目标序列的预训练表示训练了一个基于序列的条件生成模型来引导上述的非条件模型,使生成构象既多样化又符合相应的结构与序列约束。 为了使分布符合能量玻尔兹曼分布,研究者提出了能量与力场引导方法,其中最重要的是计算中间时刻的能量梯度(即力场)。研究者使用神经网络来预测这个量,并创新性提出了两种匹配训练方法并推导了相应公式。 在快速折叠蛋白质和牛胰蛋白酶抑制剂两种包含分子动力学模拟生成构象的蛋白质数据集上,CONFDIFF模型在预测构象分布和预测残基接触等方面表现优于其他模型。力场引导的方法也相对更优于能量引导的方法。 这项研究为扩展蛋白质结构的探索提供了新的工具,有助于更准确地预测蛋白质动态构象,为药物设计和生物过程的理解提供了强有力的支持。
网址: 填补AlphaFold3空白,字节跳动提出物理引导的方法让蛋白质动起来 | 机器之心
 
标题: 奥特曼挂帅新团队,OpenAI新一代大模型开训,前任高管却「投敌」了
 


摘要: OpenAI,一家领先的人工智能研究公司,正在开发其下一个前沿模型,预计将显著提升其在实现通用人工智能(AGI)方面的能力。这一消息是在公司经历了一系列高层变动和安全问题争议之后发布的。联合创始人兼首席科学家Ilya Sutskever宣布离职,超级对齐团队也被解散,引发了外界对OpenAI研究安全性的担忧。 为了应对这些担忧,OpenAI董事会宣布成立新的安全与保障委员会,由董事会主席Bret Taylor、董事Adam D’Angelo和Nicole Seligman、以及首席执行官山姆・奥特曼领导。该委员会的任务是在未来90天内评估并进一步发展OpenAI的开发流程和保障措施,并向董事会提出建议。 安全与保障委员会的成立是OpenAI在加强其安全工作方面的一个重要步骤,也是对过去争议的一种回应。前董事会成员Helen Toner在播客节目中透露,前董事会是在Twitter上得知ChatGPT发布的,这表明了董事会与管理层之间存在沟通问题。Toner还讲述了导致董事会成员不再信任奥特曼的原因,以及奥特曼最终如何重回OpenAI。 在安全团队重组的同时,前OpenAI超级对齐团队的共同领导者Jan Leike宣布加入竞争对手Anthropic,继续从事超级对齐研究。Leike的离开是由于他与OpenAI领导层在公司核心优先事项上存在长期分歧。 总体而言,OpenAI在追求技术进步的同时,正努力解决安全和治理问题,以确保其人工智能的发展能够造福全人类。
网址: 奥特曼挂帅新团队,OpenAI新一代大模型开训,前任高管却「投敌」了 | 机器之心
 
标题: AlphaFold 3不开源,统一生物语言大模型阿里云先开了!
 


摘要: 科技记者报道: 阿里云飞天实验室生物智能计算团队开发了首个全生物系统的核酸语言+蛋白语言的融合基座模型,名为LucaOne。该模型不仅能识别DNA、RNA与相应蛋白质之间的内在联系,还在基因分类、蛋白质相互作用预测、热稳定性预测等7种不同类型任务中表现出色。LucaOne的训练推理代码及相关数据目前均已开源,与未开源的AlphaFold 3形成鲜明对比。LucaOne在核酸序列和其对应蛋白的正负样本数据集中,预测准确率高达0.85,远超业内最好预训练模型组合。此外,LucaOne在流感H3N2病毒疫苗有效性预测中准确率可达100%。这一突破性进展为AI在生物科学领域的发展开辟了新的篇章。
网址: AlphaFold 3不开源,统一生物语言大模型阿里云先开了! | 量子位
 
标题: Ilya左膀右臂被Claude团队挖走!奥特曼砍掉的超级对齐算力,Anthropic给了
 


摘要: 科技记者报道: 前OpenAI研究人员Jan Leike,在离开OpenAI超级对齐团队后,宣布加入Anthropic,继续致力于AI安全研究。Leike的加入为Anthropic带来了宝贵的经验,他将专注于可扩展监督、泛化能力和自动对齐技术。Anthropic,由前OpenAI员工创立,强调对AI安全的重视,并得到了包括亚马逊在内的多家公司的投资。随着Claude 3的发布,Anthropic已成为OpenAI的有力竞争对手。在国内,类似的人才流动也在发生,如字节跳动前员工杨红霞离职创业,以及微软资深首席研究员段楠加入大模型创业公司阶跃星辰。这些变动预示着大模型领域的竞争将更加激烈。
网址: Ilya左膀右臂被Claude团队挖走!奥特曼砍掉的超级对齐算力,Anthropic给了 | 量子位
 
标题: 蚂蚁技术日首次对外开放,各种大模型应用看花了
 


摘要: 蚂蚁集团首次对外开放技术日,展示了一系列基于大模型的创新应用,包括智能生活、金融、医疗健康管家,以及AI智绘、AI智乐、AIGC数字人等。这些应用通过支付宝小程序即可体验。蚂蚁集团CTO何征宇强调了AI规模化落地的三个关键因素:可靠性、经济性和易用性。蚂蚁正致力于将这些技术融入日常生活中,让AI像扫码支付一样便利每个人的生活。
网址: 蚂蚁技术日首次对外开放,各种大模型应用看花了 | 量子位
 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1715369.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

原神抽卡点名程序教程(直接下载用)

今天我要给大家分享一个在抖音上特别火的视频——原神抽卡点名程序教程。 (要源码的私信扣31) 废话不多说,直接上效果图 : 步骤1: 步骤2:(写名单,前面加数字代表星级,用…

【OrangePi AIpro】开箱初体验以及OAK深度相机测试

1. 简介 Orangepi AIPRO 是一款采用昇腾AI技术路线,集成4核64位处理器AI处理器的单板计算机,集成图形处理器,支持8TOPS AI算力,拥有8GB/16GB LPDDR4X,可以外接eMMC模块,支持双4K高清输出。 Orange Pi AIpr…

网上打印资料A4纸一般多少钱一张

我们知道,在打印需求上A4纸(210mmx297mm)是较为常见的打印用纸,同时因为纸张的不同在价格上也存在一定的差异。当然,因在网上打印平台打印资料,能够降低一定的租金个人工成本。 因此,在网上打印…

有限元之抛物型方程初边值问题解法

目录 一、原方程的变分形式 二、有限元法进行空间半离散 三、差分法进行时间全离散 四、相关量的数值计算 五、编程时的说明 六、算例实现 6.1 C代码 6.2 计算结果 本节我们将采用有限元法联合差分法来数值求解抛物型方程的初边值问题: 其中常数。 一、原方…

cf练习5.29

A ac代码 #include<bits/stdc.h> #define IOS ios::sync_with_stdio(false),cin.tie(0),cout.tie(0);using namespace std;int main() {IOSint t;cin>>t;while(t--){int ans0;int a,b;cin>>a>>b;if(b0){if(a%150) ansa/15;else ansa/151;}else if(b!0…

软件架构设计属性之三:结构性属性浅析

文章目录 引言一、结构性属性的定义二、结构性属性的关键要素1. 组件化2. 模块化3. 层次化4. 接口定义5. 数据流6. 依赖管理 三、结构性属性的设计原则1. 高内聚低耦合2. 松耦合3. 清晰的接口4. 可维护性5. 可扩展性 四、结构性属性的实现策略1. 组件划分2. 模块化设计3. 接口设…

Photoshop粘贴 lorem-ipsum 占位符文本

Photoshop在使用文字工具的时候&#xff0c;点击画布会自动出现一段英文“Lorem Ipsum”&#xff0c;这是占位文本&#xff0c;除了响应速度慢外&#xff0c;目前我也没发现它有什么太大意义。 那么要如何操作才能取消占位文本的填写呢&#xff1f;在菜单栏点 编辑-首选项-文字…

【Linux】如何优雅的检查Linux上的用户登录、关机和重启日志

在诸如Ubuntu、Debian、Linux Mint、Fedora和Red Hat等广受欢迎的Linux发行版中&#xff0c;系统会忠实记录用户的登录、关机、重启以及运行时长信息。这些信息对管理员调查事件、排查故障或汇总用户活动报告极为宝贵。 Linux系统及应用程序日志通常保存在/var/log/目录下&…

100个投资者99个选择使用这款EA,WeTrade发现1个事实

为什么100个投资者会有99个选择使用这款EA&#xff0c;是因为这款EA能提供两个版本吗?是因为能控制风险吗?都不是&#xff0c;WeTrade发现1个事实才是这么多投资者选择的原因&#xff0c;那就是能实现100%的盈利率。 我们都知道外汇狙击手EA提供两种版本&#xff0c;分别是标…

debian11安装留档@VirtualBox

因为debian12无法安装tpot&#xff0c;所以又把11重新安装一遍&#xff0c;以前的安装文档&#xff1a;安装Debian 11 留档-CSDN博客 下载光盘 华为云地址&#xff1a;https://repo.huaweicloud.com/debian-cd/11.0.0/amd64/iso-cd/ 使用了debian11 教育版&#xff0c;比较有…

NSSCTF-Web题目4

[SWPUCTF 2021 新生赛]hardrce 1、题目 2、知识点 rce&#xff1a;远程代码执行、url取反编码 3、解题思路 打开题目 出现一段代码&#xff0c;审计源代码 题目需要我们通过get方式输入变量wllm的值 但是变量的值被过滤了&#xff0c;不能输入字母和\t、\n等值 所以我们需…

操作系统真象还原:一些你可能正感到迷惑的问题

第0章-一些你可能正感到迷惑的问题 这是我看操作系统真象还原这本书的一些记录&#xff1a; 4 软件是如何访问硬件的 硬件在输入输出上大体分为串行和并行&#xff0c;相应的接口也就是串行接口和并行接口。串行硬件通过串行接口与 CPU 通信&#xff0c;反过来也是&#xff…

antd table列选中效果实现

前言 开发中有一个需要呈现不同时间点各个气象要素的值需求&#xff0c;我觉得一个table可以实现这类数据的展示&#xff0c;只是因为时间点时关注的重点&#xff0c;所以需要列选中效果&#xff0c;清晰的展示时间点下的要素数据。我选择的是antd的table组件&#xff0c;这个…

每日复盘-20240529

20240529 六日涨幅最大: ------1--------300956--------- 英力股份 五日涨幅最大: ------1--------301361--------- 众智科技 四日涨幅最大: ------1--------301361--------- 众智科技 三日涨幅最大: ------1--------300637--------- 扬帆新材 二日涨幅最大: ------1--------30…

【busybox记录】【shell指令】rmdir

目录 内容来源&#xff1a; 【GUN】【rmdir】指令介绍 【busybox】【rmdir】指令介绍 【linux】【rmdir】指令介绍 使用示例&#xff1a; 删除空目录 - 默认 删除dirname下的所有空目录&#xff0c;包括因删除其他目录而变为空的目录 常用组合指令&#xff1a; 指令不…

数据结构(七)查找

2024年5月26日一稿&#xff08;王道P291&#xff09; 7.1 查找的基本概念 7.2 顺序查找和折半查找 7.2.1 顺序查找 7.2.2 折半查找 7.2.3 分块查找 7.3 树形查找 7.3.1 二叉排序树(BST) 7.3.2 平衡二叉树 7.4 B树和B树 7.4.1 B树及其基本操作 7.4.2 B树的基本概念 7.5 散列&…

UVa11604 General Sultan

UVa11604 General Sultan 题目链接题意分析AC 代码 题目链接 UVA - 11604 General Sultan 题意 给出一些0和1组成的模式串&#xff0c;问是否存在一个串使得有多种方案将这个串分解成模式串。    给一个包含n&#xff08;n≤100&#xff09;个符号的二进制编码方式&#xff…

HTTP Digest Access Authentication Schema

HTTP Digest Access Authentication Schema 背景介绍ChallengeResponse摘要计算流程总结参考 背景 本文内容大多基于网上其他参考文章及资料整理后所得&#xff0c;并非原创&#xff0c;目的是为了需要时方便查看。 介绍 HTTP Digest Access Authentication Schema&#xff…

Spring创建对象的多种方式

一、对象分类 简单对象&#xff1a;使用new Obj()方式创建的对象 复杂对象&#xff1a;无法使用new Obj()方式创建的对象。例如&#xff1a; 1. AOP创建代理对象。ProxyFactoryBean; 2. Mybatis中的SqlSessionFactoryBean; 3. Hibernate中的SessionFactoryBean。二、创建对象方…

MFC工控项目实例一主菜单制作

1、本项目用在WIN10下安装的vc6.0兼容版实现。创建项目名为SEAL_PRESSURE的MFC对话框。在项目res文件下添加相关256色ico格式图片。 2、项目名称&#xff1a;密封压力试验机 主菜单名称&#xff1a; 系统参数 SYS_DATA 系统测试 SYS_TEST 选择型号 TYP_CHOICE 开始试验 TES_STA…