「ScienceAI Weekly」是 HyperAI 超神经新创建的半月更栏目,主要从科研成果、企业动态、工具资源、近期活动 4 个维度,收集呈现 ScienceAI 领域近期值得关注的最新动态,以期为长期关注该领域的从业者、爱好者,提供更有价值的圈内资讯和行业启示。
一起来看看本期值得关注的 ScienceAI 进展吧!
科研成果
GaUDI:用于逆向分子设计的引导扩散模型
添加图片注释,不超过 140 字(可选)
* 标题:Guided diffusion for inverse molecular design
* 来源:Nature Computational Science
* 领域:分子设计,材料化学
* 作者:以色列理工学院团队与威尼斯卡福斯卡里大学科研团队
* 原文:
Guided diffusion for inverse molecular design | Nature Computational Science
方法简介:
GaUDI 是一个用于逆向分子设计 (inverse molecular design) 的引导扩散模型 (guided diffusion model),它结合了用于属性预测的等变图神经网络,以及生成扩散模型,通过用针对 47.5 万个多环芳香系统生成数据集的单目标和多目标任务检测,科研人员发现 GaUDI 在有机电子学应用的分子设计中,具有极高的有效性。
GaUDI 改善了条件设计,可以生成具有最优属性、甚至超越原始分布的分子,可以识别出比数据集中更优的分子。除 point-wise target 外,GaUDI 还可以用于 open-ended targets(如最小值或最大值),并在所有情况下,生成的分子有效性都接近 100%。
SurfGen:计算机辅助药物发现新模型
添加图片注释,不超过 140 字(可选)
* 标题:Learning on topological surface and geometric structure for 3D molecular generation
* 来源:Nature Computational Science
* 领域:分子设计,药物发现
* 作者:浙江大学和碳硅智慧的研究团队
* 原文:
Learning on topological surface and geometric structure for 3D molecular generation | Nature Computational Science
方法简介:
SurfGen 模型以类似于「钥匙和锁」原理的方式设计分子,其包含了两个等变神经网络——Geodesic-GNN 和 Geoatom-GNN,分别捕获口袋表面上的拓扑相互作用,以及配体原子和表面节点之间的空间相互作用。
SurfGen 在许多基准测试中都优于其他方法,其对口袋结构有高敏感性,这使得基于生成模型的方案能够解决突变诱导的耐药性这一棘手问题。
清华大学研究团队发布人工智能辅助框架——DeepSEED
添加图片注释,不超过 140 字(可选)
* 标题:
Deep flanking sequence engineering for efficient promoter design using DeepSEED
* 来源:Nature Communications
* 领域:合成生物学
* 作者:清华大学研究团队
* 原文:
Deep flanking sequence engineering for efficient promoter design using DeepSEED | Nature Communications
方法简介:
DeepSEED 由两个深度学习模块组成,一个条件式生成对抗网络 (cGAN) 用于捕获显式和隐式模式之间的依赖关系,一个基于 DenseNet-LSTM 的预测模型用来评估启动子性能,并利用遗传算法对这两个模型进行偶联,通过模型迭代实现功能启动子的优化设计。
FIREANN:用于原子系统对外部场响应的通用机器学习模型
添加图片注释,不超过 140 字(可选)
* 标题:
Universal machine learning for the response of atomistic systems to external fields
* 来源:Nature Communications
* 领域:原子系统,机器学习
* 作者:中国科学技术大学和安徽科技大学团队
* 原文:
https://www.nature.com/articles/s41467-023-42148-y
方法简介:
研究团队提出了一种通用场诱导递归嵌入原子神经网络 (FIREANN) 模型,可以将伪场矢量依赖特征整合到原子描述符中,以表示具有严格旋转等变性的系统-场相互作用。
这种「一体式」方法将偶极矩和极化率等各种响应特性与单个模型中的场相关势能相关联,非常适合在存在电场的情况下,对分子和周期系统进行光谱和动力学模拟。对于周期系统,FIREANN 可以通过仅训练原子力来克服极化的内在多值问题。
企业动态
DeepMind 发布 GNoME,利用深度学习预测 220 万种新晶体
添加图片注释,不超过 140 字(可选)
GNoME 流程示意图
Google DeepMind 近日在 Nature 上发表的一篇论文显示,借助其发布的深度学习工具 GNoME,科研人员在短时间内就发现了 220 万种新晶体(相当于人类科学家近 800 年的知识积累),其中 38 万种新晶体具备稳定的结构,成为最有可能通过实验合成并投入使用的潜在新材料。
GNoME 全称 Graph Networks for Materials Exploration,是一个用于新材料研发的 SOTA GNN 模型,它利用深度学习,可以在极短时间内预测新材料的稳定性,极大提高了材料研发的速度和效率,展现了利用 AI 大规模开发新材料的潜力。
DeepMind 发布气象预测 AI 模型 GraphCast
添加图片注释,不超过 140 字(可选)
GraphCast 依据 6h 前及当前天气状况,即可预测未来 6h 天气
日前,Google DeepMind 在官方博客中宣布推出的一款基于机器学习的天气预测模型——GraphCast,在全球 0.25° 的分辨率下,在一分钟内预测未来 10 天的数百个天气变量,显著优于传统气象预报方法。
此外,该模型在预测极端事件方面同样表现良好。与行业黄金标准天气模拟系统——高分辨率预报 (HRES) 相比,GraphCast 在 1,380 个测试变量中准确预测超过 90%。
百图生科与赛诺菲达成大型战略合作
百图生科 (BioMap) 宣布与全球 Top10 的医药跨国公司赛诺菲达成战略合作。根据协议,双方将基于百图生科的生命科学大模型 (Life Science AI Foundation Model),共同开发用于生物治疗药物发现的前沿模型。此次合作,是生命科学领域首次基于大模型的商业合作,同时也进一步推动了「模型开发」与「AI 药物管线研发」两种商业模式并行发展。
IBM 推出新款 AI 芯片 NorthPole,能效提高 25 倍
添加图片注释,不超过 140 字(可选)
前段时间,美国 IBM 公司推出了一款类脑 AI 芯片 NorthPole,可大幅提高能源、空间和时间效率,相关论文已刊发于国际顶刊 Nature。据介绍,NorthPole 基于 12 纳米节点处理技术构建,以 ResNet-50 模型为基准,NorthPole 的效率明显高于常见的 12 纳米 GPU 和 14 纳米 CPU,能效提高了 25 倍。
论文地址:
‘Mind-blowing’ IBM chip speeds up AI
玄言生物完成数千万天使轮融资
上海玄言生物科技有限公司此前宣布完成数千万元天使轮融资,由海南仟港汇投资合伙企业独家领投,融资获得资金计划用于世界全新癌症靶点抗体药 INTX-001 的临床前研究,开发下游 IVD 管线,AI 预测重大疾病进程(早筛、转移等)相关的 IVD 产品与软件。
工具资源
AI for Science 开源新项目 Polymathic AI 主要团队曝光
添加图片注释,不超过 140 字(可选)
Polymathic AI 计划的目标是加速开发针对数值数据集和科学机器学习任务定制的多功能基础模型。
为此, Polymathic AI 汇集了一支由纯机器学习研究人员,以及领域科学家组成的团队,接受世界领先专家组成的科学咨询小组的指导,并由图灵奖得主、Meta 首席科学家 Yann LeCun 担任顾问,受到包括剑桥大学 AI+天文/物理助理教授 Miles Cranmer 在内的多位学术大咖的支持,以期集中精力开发科学数据的基础模型,利用跨学科的共享概念解决 AI for Science 行业难题。
项目开源地址:
https://github.com/PolymathicAI/
阿里达摩院发布遥感 AI 大模型
添加图片注释,不超过 140 字(可选)
不久前,阿里达摩院发布了业内首个遥感 AI 大模型 (AIE-SEG),率先在遥感领域实现了图像分割的任务统一,可实现「万物零样本」的快速提取,可识别农田、水域、建筑物等近百种遥感地物分类,还能根据用户的交互式反馈自动调优识别结果,大幅提升灾害防治、自然资源管理、农业估产等遥感应用的分析效率。
该模型已在 AI Earth 地球科学云平台开放使用。在一些特定场景下,对比传统的遥感模型,其实例提取的准确率可提升 25%,变化检测的准确率可提升 30%。
模型地址:
AI Earth
上海AI实验室开源首个城市级 NeRF 实景 3D 大模型
添加图片注释,不超过 140 字(可选)
目前,上海 AI 实验室已经正式开源了全球首个城市级 NeRF 实景三维大模型「书生·天际」 (LandMark),支持在不同应用场景下的落地部署,并提供免费商用。这也是上海 AI 实验室首次公开多分支 GridNeRF 模型核心算法及与之匹配的训练策略。
书生·天际官网:
书生·天际
开源地址:
https://github.com/InternLandMark/LandMark
论文地址:
Grid-guided Neural Radiance Fields for Large Urban Scenes
智源研究院开源 10 亿参数的三维视觉通用模型 Uni3D
添加图片注释,不超过 140 字(可选)
日前,智源研究院开源发布了 10 亿参数的三维视觉通用模型 Uni3D,其对于衡量视觉通用能力至关重要的分类任务,以及零样本识别、理解、分割任务等,都有超预期表现。据介绍,出品 Uni3D 的智源视觉团队此前曾发布 10 亿通用视觉模型 EVA。而本次三维视觉模型的突破关键是利用了 ViT 技术,将 2D 预训练基础经验升维至 3D。
论文链接:
https://arxiv.org/abs/2310.06773
代码/模型链接:
https://github.com/baaivision/Uni3D
https://huggingface.co/BAAI/Uni3D/tree/main/modelzoo
近期活动
中国药科大学生物医药数据科学行业与专业发展大会
添加图片注释,不超过 140 字(可选)
2023 年 12 月 8 日至 9 日,中国药科大学 2023 生物医药数据科学行业与专业发展大会 BDSC (The Biomedical Data Science Convention For Industry & Discipline Development) 将于南京举办。
大会以「数据求真 · 智慧医药」为主题,重点关注生物医药与数据科学的多学科交叉发展,深度剖析行业发展趋势,探索以人工智能为代表的数据科学在药物发现、药品生产、质量安全、政策监管、生物医药企业数字化转型升级等业界关注的诸多领域的前沿动态、学术成果以及应用实践。
报名地址:
2023BDSC生物医药数据科学行业与专业发展大会 预约报名-活动-活动行
「未来之后」AI4S 第二届国际高峰论坛
添加图片注释,不超过 140 字(可选)
2023 年 12 月 14 日,由北京大学深圳研究生院发起的「未来之后」AI4S 第二届国际高峰论坛,将于北京大学深圳研究生院会议中心正式开幕。
活动邀请到了美国科学院院士 David Baker 教授、微软杰出首席科学家刘铁岩博士、中国科学技术大学杰出讲席教授罗毅、美国康奈尔大学化学工程与生物分子工程系终身讲席教授尤峰崎、厦门大学化学化工学院教授程俊,围绕 AI for Science 的发展带来深度分享。
报名地址:
https://mp.weixin.qq.com/s/WObN0eh-t0a8ZRuOQzkxsg