李飞飞团队 AI4S 最新洞察:16 项创新技术汇总,覆盖生物/材料/医疗/问诊……

news2024/11/17 3:43:35

不久前,斯坦福大学 Human-Center Artificial Intelligence (HAI) 研究中心重磅发布了《2024年人工智能指数报告》。 作为斯坦福 HAI 的第七部力作,这份报告长达 502 页,全面追踪了 2023 年全球人工智能的发展趋势。相比往年,扩大了研究范围,涵盖了 AI 技术、公众对 AI 技术的看法以及围绕其发展的政治动态等基本趋势,并对未来的 AI 发展趋势进行了预测。

图片

HAI 由华人人工智能学者李飞飞教授(右)与哲学家 John Etchemend(左)共同领导

在这份报告中,最引人注目的莫过于新增篇章——探讨人工智能在科学和医学领域的深远影响。 报告中展示了 2023 年 AI 在科学领域的辉煌成就,以及 AI 在医疗领域取得的重要创新成果,包括 SynthSR 和 ImmunoSEIRA 等突破性技术。此外,报告还细致分析了 FDA 对 AI 医疗设备审批的趋势,为行业提供了宝贵的参考。

AI:科研加速引擎

《2024年人工智能指数报告》指出,2023 年,产业界产生了 51 个著名的机器学习模型,而学术界只贡献了 15 个。此外,108 个新发布的基础模型来自产业界,28 个来自学术界。

尽管相较于产业界,学术界的发展速度明显偏慢,但需要注意的是,直到 2022 年 AI 才被正式用于科学发现领域。从优化算法排序效率的 AlphaDev 到革新材料发现流程的 GNoME,我们见证了更为重要的、相关性更高的人工智能应用的问世。

如今,AI 已经在材料科学、气候变化、计算机科学等领域多点开花。幸运的是,在这一轮变革中,中国正处于领先地位。根据中国科学技术信息研究所、科技部新一代人工智能发展研究中心编写的《中国 AI for Science 创新地图研究报告》,我国在 AI 驱动科学研究方面的论文发表数量位居榜首,国产化 AI 科研基础软件也日益成熟,为科研人员提供了丰富的数据集、基础模型及专用化工具。

总的来说,AI 在科学领域的应用是多元化的,正在以一种前所未有的速度,推动科学的发展和进步。但需要注意的是,在 AI for Science 当前的发展阶段中,综合型人才短缺、技术方案难复用、垂类学科研究数据质量欠佳等问题也逐渐暴露出来。

例如,在围绕「AI 人才搞科研还是科研人才学 AI」的讨论中,拥有交叉学科知识背景的研究人员脱颖而出,不仅对所在科研领域有着深刻洞察,更加能够快速上手各类 AI 工具与技术,但其稀缺程度可想而知,而综合型人才的培养亦非朝夕而成。所以,如何快速搭建起 AI 与科研之间的沟通桥梁是关乎 AI for Science 规模化推广的重要议题。

同时,科研所覆盖领域之丰富无需赘述,不同课题组的研究方向稍有差异便可能对 AI 工具的需求不同,在难以实现每个团队都拥有交叉学科背景的研究人员时,降低 AI 工具的使用门槛,简化模型微调过程,或许也能够在一定程度上加速 AI 在科研领域的推广。

加速更新,技术的自我迭代与进步

AI 技术进步推动其应用的广度和深度提升,同时也对算法提出越来越高的要求。目前,大多数算法已经达到了难以依靠人类专家来进一步优化的阶段,导致了计算瓶颈的不断加剧。然而,科学家针对算法领域的开拓从未止步。

AlphaDev 重现 AlphaGo 的神来之笔

排序算法是计算机系统对数据项进行有序排列的基础性工具。为了在这一领域实现创新突破,谷歌 DeepMind** 采取了一种创新的方法,探索了人类研究相对较少的计算机汇编指令领域。通过 AlphaDev 系统,DeepMind 能够直接从 CPU 汇编指令层面出发,寻找更高效的排序算法。

AlphaDev 系统由两个核心组成部分构成:学习算法和表示函数。

学习算法是在先进的 AlphaZero 算法基础上进行扩展,结合了深度强化学习 (DRL) 和随机搜索优化算法,以执行大规模的指令搜索任务;而表示函数则基于 Transformer 架构,能够捕捉汇编语言的底层结构,并将其转换成特殊的序列表示。

利用 AlphaDev 系统,DeepMind 成功发现了优于当前手工调优算法的定长短序列排序算法,即 Sort 3、Sort 4 和 Sort 5,并将相关代码集成到了 LLVM 标准 C++ 库中。 特别值得一提的是,在发现 Sort 3 算法的过程中,AlphaDev 采用了一种看似违反直觉却实际上是一条捷径的方法,这让人联想到 AlphaGo 在对战传奇围棋选手李世石时所采用的「第 37 步」——一种出人意料的策略,最终取得了胜利。

图片

在优化算法长度时,AlphaDev与人类基准的比较

AlphaDev 的应用范围不仅限于排序算法。DeepMind 通过将其方法泛化,还将其应用于 9 到 16 字节范围内的哈希算法,并实现了速度提升 30% 的显著成果。这表明 AlphaDev 在优化底层计算任务方面具有广泛的潜力和应用价值。

论文链接:

https://www.nature.com/articles/s41586-023-06004-9

FlexiCubes 用 AI 生成高质量 3D 模型

从场景重构到生成式 AI 赛道,新一代的 AI 模型在生成逼真而详细的 3D 模型方面取得了显著的成功。由于这些模型通常被创建为标准的三角网格,网格的质量也就显得至关重要。为此,Nvidia 的研究人员开发了一种全新的网格生成方法 FlexiCubes,显著提高了 3D 网络生成管道中的网格质量,并且可以与物理引擎集成,轻松创建 3D 模型中的灵活物体。

图片

FlexiCubes 表面重建示例

FlexiCubes 的关键思想是引入「灵活」参数,允许在生成网格的过程中进行精确调整。 通过在优化过程中更新这些参数,网格的质量得到了极大的增强。这种方法使 FlexiCubes 与传统基于网格的管道(如广泛使用的 Marching Cubes算法)形成鲜明对比,使其可以无缝地取代优化为基础的人工智能流水线。

FlexiCubes 生成的高质量网格在表示复杂细节方面表现出色,增强了人工智能生成的 3D 模型的整体逼真度和保真度。这些网格尤其适用于物理模拟,在摄影测量和生成式 AI 等场中,使得 AI 管道准确呈现复杂形状中的细节成为可能。

论文链接:

https://research.nvidia.com/labs/toronto-ai/flexicubes/

加速创造,超越人力的效能提升

Synbot AI 驱动的机器人化学家

在化学实验室的深处,一场革命正在悄然进行——有机化合物的合成不再是缓慢而繁琐的过程,而是通过自动化的魔法,加速转化为现实。这一变革的核心,是三星电子的科学家们所创造自主合成机器人 Synbot。

图片

Synbot 的设计图注

具体来看,Synbot 由三层结构组成:

人工智能软件层 (AI S/W layer): 引领综合规划过程,配备逆合成模块、实验设计和优化模块,并使用决策模块引导实验方向;

机器人软件层 (Robot S/W layer): 负责通过配方生成模块和翻译模块,将其转换为机器人的可操作命令;

机器人层 (Robot layer): 在在线调度模块的监督下,将合成实验室的各种功能模块化,并系统地执行计划的配方 (recipe),不断更新数据库,直到达到预定义的目标。

研究显示,Synbot 可在 24 小时内平均进行 12 个反应。假设人类研究人员每天可进行两次此类实验,那么与人类同行相比,Synbot 的效率至少提高了 6 倍。 随着 Synbot 的加入,科学家们得以从繁琐的操作中解放出来,将更多的精力投入到创新和探索之中。

论文链接:

https://www.science.org/doi/full/10.1126/sciadv.adj0461

GNoME 重塑材料发现过程

谷歌 DeepMind 在 Nature 刊文称,基于材料探索的 AI 工具 GNoME (Graph Networks for Materials Exploration) 发现了 220 万种新晶体预测(相当于人类科学家近 800 年的知识积累),其中有 38 万个稳定的晶体结构, 有望通过实验合成,部分材料或许会引发技术变革,如下一代电池、超导体等。

图片

GNoME(蓝)与Materials Project(紫)的比较

GNoME 是一种先进的图神经网络 (GNN) 模型,输入数据主要采用图表的形式,形成类似原子之间的连接,这也让 GNoME 更容易发现新的晶体材料。据介绍,GNoME 能够预测新型稳定晶体的结构,然后通过 DFT(密度泛函理论)进行测试,并将所得的高质量训练数据反馈到模型训练中。

现阶段,新模型将预测材料稳定性的准确率从 50% 左右提高到 80%,新材料的发现率从 10% 以下提高到 80% 以上。 (点击查看完整报道:领先人类 800 年?DeepMind 发布 GNoME,利用深度学习预测 220 万种新晶体)

加速改变,从容应对生态环境「灰犀牛」

GraphCast 生成最准确的全球天气预报

谷歌 DeepMind 发布的 GraphCast,是一种基于机器学习和图神经网络 (GNN) 的天气预报系统,采用「编码-处理-解码」配置,共有 3,670 万个参数,能够以 0.25 度经度/纬度(赤道处 28 公里 x 28 公里)的高分辨率进行预测, 范围覆盖了整个地球表面。在每个网格点,该模型预测 5 个地球表面变量(包括温度、风速、风向、平均海平面压力等),以及 37 个不同海拔高度上的 6 个大气变量,包括比湿、风速、风向和温度。

图片

GraphCast 天气预测

在综合基础测试中,对比 HRES (High Resolution Forecast) GraphCast 对 1,380 个测试变量中的近 90% 提供了更准确的预测。 根据对比分析,GraphCast 还可以比传统预测模型更早地识别恶劣天气事件。(点击查看完整报道:雹暴中心收集数据、大模型加持极端天气预测,「追风者也」正在上演)

Flood Forecasting 人工智能改变洪水预报

2018 年,谷歌启动了 Google Flood Forecasting Initiative,利用 AI 和强大算力打造更好的洪水预测模型,并与多国政府部门展开合作。2023 年,谷歌的研究团队开发了一个基于机器学习的河流预报模型,该模型能够提前 5 天实现对洪水的可靠预测,在对 5 年一遇的洪水事件进行预测时,性能优于或相当于目前预测 1 年一遇的洪水事件,系统可覆盖 80 多个国家。

该研究通过采用两个长短期记忆网络 (LSTM) 的应用,构建了一种先进的河流预测模型。模型的核心架构基于编码器-解码器机制 (encoder-decoder framework)。 具体而言,Hindcast LSTM 模块负责处理历史气象数据,而Forecast LSTM 模块则处理预测气象数据。模型的输出为每个预测时间点的概率分布参数,这些参数能够提供对特定河流在特定时间点的流量概率预测。

图片

AI 模型与 GloFAS 在不同回报期的预测对比

研究结果表明,该模型在性能上超越了当前全球领先的建模系统——哥白尼应急管理服务全球洪水感知系统 (GloFAS)。 这一发现证实了所提出模型在河流预测领域的潜力和可靠性,为洪水预警和水资源管理提供了一种新的技术手段。(点击查看完整报道:击败全球 No.1 系统、覆盖 80+ 国家,谷歌洪水预测模型再登 Nature)

AI:引领医学新纪元

《2024 年人工智能指数报告》表明,AI 技术在医疗影像、医疗问答、医学诊断、等多领域取得成效。事实上,AI 在医疗健康领域的应用是早已为人们所熟知。通过机器学习算法,AI 能够分析大量的医疗数据,帮助医生更准确地诊断疾病。例如,在癌症检测中,AI 可以识别出医学影像中的微小异常,从而提高早期诊断的成功率。

此外,AI 也在药物研发中发挥着重要作用。一方面, AI 深化了对药物靶点和化合物合成的理解,优化药物发现的步骤,大大提升了新药面世的成功机会。另一方面, AI 技术被用于缩短新药研发周期、节省成本,并显著提升药物研发效率和企业竞争力。

值得注意的是,《2024 年人工智能指数报告》还对人工智能相关医疗设备进行了总结,美国食品药品监督管理局 (FDA) 对 AI 相关医疗设备的批准数量持续增加。2022 年,FDA 批准了 139 个 AI 相关医疗设备,比前一年增加了 12.1%,从 2012 年开始这一数字已经增长了超过 45 倍,显示了 AI 在现实世界医疗应用中的广泛使用。

尽管 AI 技术在实际医疗中的应用带来了许多机遇,但也面临着一系列亟待解决的挑战,例如 AI 伦理问题、数据隐私保护、技术瓶颈、监管和问责制、跨学科合作、临床适用性等方面的困境。尤其是,A I 模型的「黑箱」特性使得其决策过程难以解释,这对于需要高度透明度和可追溯性的医疗诊断来说是一个重大挑战。 缺乏可解释性可能会影响医生对 AI 辅助诊断结果的信任度。

因此,除了技术迭代外,如何在政策、标准、监管、安全等方面补齐短板,如何破除自身「黑盒」特性等问题,仍然需要政府与相关企业共同推动解决。

医学影像:提供更全面、更深入的解决方案

AI 技术在医学影像领域的应用正变得越来越多样化和深入,从辅助诊断到改善工作流程,再到推动个性化医疗,AI 正成为医学影像不可或缺的工具。

SynthSR 转换高分辨率图像并修复病灶

SynthSR 由麻省理工学院计算机与人工智能实验室开发,通过训练一个超分辨率卷积神经网络 (CNN),利用了开放存取系列影像研究数据集中,1 毫米各向同性高场强 MRI 扫描数据集,以及对大脑内 39 个感兴趣区域 (ROI) 的精确分割。 该技术主要针对低场强 (0.064-T) 的 T1 和 T2 加权脑 MRI 序列,同时采用磁化制备的快速梯度回波 (MPRAGE) 采集技术,旨在生成具有 1 毫米各向同性空间分辨率的高质量图像。

图片

SynthSR 生成图像

SynthSR 的先进之处在于,其能够将临床上不同方向、不同分辨率和不同对比度的 MRI 扫描数据,转换为 1mm 各向同性的 MPRAGE 图像,并在此过程中对病灶进行修复。

转换后的合成 MPRAGE 图像能够直接应用于现有的脑部 MRI 3D 图像分析工具,如图像配准或分割,无需进行额外的训练。 此外,通过对比合成图像与实际高场强图像的大脑形态测量数据,研究进一步验证了 LF-SynthSR 在定量神经放射学领域的应用潜力。

论文链接:

http://arxiv.org/pdf/2012.13340v1.pdf

CT Panda 早期胰腺癌筛查

针对胰腺癌变位置隐匿、在平扫 CT 图像中无明显表征等特点,阿里达摩院联合全球十多家医疗机构的研究团队将 AI 用于无症状人群的胰腺癌筛查研究,构建了一个独特的深度学习框架,最终训练出胰腺癌早期检测模型 PANDA。

PANDA 模型是一种先进的医学图像分析工具,综合运用了多种深度学习技术来提高胰腺病变的检测效率和准确性。该模型首先利用一个分割网络 (U-Net) 精确定位胰腺区域,然后通过一个多任务卷积神经网络 (CNN) 来识别图像中的异常情况。最后,采用双通道 Transformer 模型对检测到的异常进行分类,并识别出具体的胰腺病变类型。

该技术的核心优势在于,能够借助 AI 算法放大并识别平扫 CT 图像中那些难以用肉眼辨识的微小病变特征。 这不仅实现了对早期胰腺癌的高效和安全检测,而且有效解决了以往筛查方法中假阳性率较高的问题。

图片

PANDA 在实际多场景验证中的性能

在验证试验中,PANDA 的灵敏度 (sensitivity) 比普通放射科医生高 34.1%,特异性 (specificity) 比普通放射科医生高 6.3%。在一项涉及约 2 万名患者的大规模真实测试中,PANDA 的灵敏度为 92.9%,特异性为 99.9%。 (点击查看完整报道:在 2 万病例中识别出 31 例漏诊,阿里达摩院牵头发布「平扫 CT +大模型」筛查胰腺癌)

医疗诊断:制定个性化、精准的诊断和治疗方案

从提高诊断效率和准确性到提供个性化治疗方案,AI 技术在医疗诊断领域的潜力巨大,有助于改善医疗服务质量和患者体验。

Coupled Plasmonic Infrared Sensors 赋能神经退行性疾病诊断

在神经退行性疾病的诊断领域,由于缺乏检测临床前期生物标志物的有效工具,使得帕金森综合征、阿尔茨海默症等疾病的早期诊断面临重大挑战。虽然传统的检测方法如质谱法和酶联免疫吸附试验 (ELISA),在一定程度上有所帮助,但它们在识别生物标志物结构状态变化方面存在局限。

针对这一难题,瑞士洛桑联邦理工学院的研究团队开发了一种创新的诊断方法,结合神经网络技术、表面增强红外吸收 (SEIRA) 光谱的等离子体红外传感器,以及免疫测定技术 (ImmunoSEIRA),实现了对神经退行性疾病阶段和进展的量化分析。

图片

ImmunoSEIRA 检测原理及设置

ImmunoSEIRA 传感器采用了金纳米棒阵列,该阵列表面修饰有针对特定蛋白质的抗体,能够从极小量的样本中实时捕获目标生物标志物,并对其进行结构分析。随后,利用神经网络对错误折叠的蛋白质、低聚物和原纤维聚集体进行识别,从而实现了前所未有的高准确性检测水平。这一方法的提出,为神经退行性疾病的早期诊断和精确评估提供了一种新的技术手段。

CoDoC AI 与医生诊断之间的逻辑整合

谷歌 DeepMind 开发了一款名为 CoDoC 的医疗辅助人工智能系统,旨在对医学图像进行深入的解释和分析,通过学习,该系统能够决定何时依赖自身的判断,何时采纳医生的意见。

具体来说,DeepMind 团队探究了临床医生使用 AI 工具辅助解读医学图像的各种应用场景。对于任何临床环境的理论案例,CoDoC 系统只需要训练数据集中每个病例的三个输入:

首先,预测 AI 输出的置信度分数,该分数介于 0(确定无疾病)到 1(确定有疾病)之间;

其次,临床医生对医学图像的解读;

最后, 疾病的客观存在性。

值得注意的是,CoDoC 系统无需直接访问医学图像本身。

图片

CoDoC 与其他工具的性能比较

此外,DeepMind 利用多个真实世界的去识别化历史数据集对 CoDoC 系统进行了全面的测试。测试结果表明,将人类的医学专业知识与 AI 模型的预测相结合,能够提供最为精确的诊断方案,其准确性超越了单独使用任一方法所能达到的水平。 这一发现强调了 AI 与人类专家协同工作的重要性,为提高医学成像诊断的准确性和可靠性提供了新的视角。

医疗问答:提高诊断准确性、优化治疗方案、提升患者服务体验

2020 年,研究者提出了基于知识图谱的医疗问答系统 MedQA,利用知识图谱来表示和存储医疗领域的结构化和半结构化数据,然后通过图搜索、推理或匹配等技术,从知识图谱中检索或生成答案。自 MedQA 发布以来,AI 在医疗知识问答方面的能力也得到了更加广泛的关注。

GPT-4 Medprompt 准确率超过 90%

微软研究团队开发的 GPT-4 Medprompt,在 MedQA 数据集(美国医师执照考试题)上,让 GPT-4 的准确率首次超过 90%, 超越 BioGPT 和 Med-PaLM 等一众微调方法。研究人员还表示,Medprompt 方法是通用的,不仅适用于医学,还可以推广到电气工程、机器学习、法律等专业中。

Medprompt 是多种提示策略的组合体,其包含了:

动态少样本选择: 研究人员先利用 text-embedding-ada-002 模型为每个训练样本和测试样本生成向量表示。然后,对于每个测试样本,基于向量相似度,从训练样本中挑选出最相似的 k 个样本。

自生成思维链: 思维链 (CoT) 方法就是让模型一步一步思考,生成一系列中间推理步骤。与在 Med-PaLM 2 模型中专家手工制作的思维链示例相比,GPT-4 生成的思维链基本原理更长,而且分步推理逻辑更细粒度。

选项洗牌集成: GPT-4 在做选择题时,可能会存在一种偏见,就是不管选项内容是什么,它会偏向总是选择 A,或者总是选择 B,这就是位置偏差。为了减少这个问题,研究人员选择将原来的选项顺序打乱重排,然后让 GPT-4 做多轮预测,每轮使用选项的一个不同排列顺序。

图片

GPT-4 与 Med-PaLM 2 在回答医学问题上的比较

研究表明,Medprompt 在 PubMedQA、MedMCQA 和 MMLU 等多个知名医疗基准测试的多选题部分,分别比 2022 年排名第一的 Flan-PaLM 540B 高出 3.0、21.5 和 16.2 个百分点。它的性能也超过了当时最先进的 Med-PaLM 2。

MediTron-70B 最佳医疗开源大型语言模型

由于 GPT-4 Medprompt 是一个封闭源代码系统,限制了其在更广泛公众中的免费使用。为了解决这一问题,瑞士洛桑联邦理工学院的研究人员基于此系统开发出了 MediTron-70B,旨在提供一个开源的、面向医疗领域的高性能大型语言模型。

MediTron 是一种深度学习算法,基于 Llama 2 架构构建,并采用了 Nvidia 的 Megatron-LM 分布式训练器进行微调, 同时对一个综合性的医疗语料库进行了扩展预训练。该语料库精心挑选了 PubMed 上的文章、摘要以及国际公认的医学指南。

图片

MediTron-70B 在 MedQA 上的表现

MediTron 系列包括 MediTron-7B 和 MediTron-70B 两种模型。其中,MediTron-70B 的性能已经超越了包括 GPT-3.5 和 Med-PaLM,并且接近于 GPT-4 和 Med-PaLM-2 的水平。

为了推动开源医疗LLMs的发展,开发团队已经公开了其使用的医疗预训练语料库以及 MediTron 模型的权重代码。MediTron-70B 在 MedQA 上的得分是开源模型中最高的,这一成就标志着开源医疗LLMs 领域的一个重要进展。

论文链接:

https://arxiv.org/pdf/2311.16079.pdf

MedAlign 减轻医疗保健管理负担

目前,针对医疗保健领域的文本生成任务所使用的电子健康记录 (EHR) 问答数据集,尚未能充分捕捉到临床医生在信息需求分析和文档处理方面所面临的复杂性。

为了填补这一空白,一个由 15 名不同专业领域的临床医生组成的团队,推出了 MedAlign——一个基于 EHR 数据的基准数据集。该数据集囊括了 983 个真实世界的临床问题及其说明,以及 303 名临床医生提供的答案,通过分析 276 份纵向 EHR 数据,构建了指令-响应对。

这一工作不仅解决了复杂临床任务中 LLM 实用性的评估基准缺失,而且通过提供一个真实且全面的指令响应数据集,推动了医疗保健领域自然语言生成的研究进展。

图片

模型性能评估

在 MedAlign 数据集上,研究人员对 6 个来自不同通用领域的大型语言模型进行了测试,并通过临床医生评估了每个大模型生成的响应的准确性和质量。

结果显示,经过多步优化的 GPT-4 模型变种在正确率上达到了 65.0%,总体上比其他 LLM 更受青睐。 MedAlign 作为首个广泛覆盖 EHR 应用的基准数据集,标志着利用人工智能技术减轻医疗保健行政负担的重要进展。

论文链接:

https://arxiv.org/pdf/2308.14089.pdf

医学研究:用 AI 筑起人类健康的最坚实防线

随着技术的不断进步,AI 技术在医学研究领域的应用更加广泛和深入。如今,科学家们正在借助 AI 的力量,深度挖掘人类基因的密码,用 AI 帮助我们建立起一道坚实的医学防线。

AlphaMissence 有效识别基因致病性错义突变

谷歌 DeepMind 团队在 AlphaFold 的基础上,进一步开发了一款新的 AI 模型——AlphaMissense。该模型融合了 AlphaFold 提供的高精度蛋白质结构模型,以及从相关序列中提炼出的约束进化算法。 AlphaMissense 的训练过程分为两个阶段:

  • 第一阶段类似于 AlphaFold 的训练,重点在于增强蛋白质语言模型的权重;

  • 第二阶段则专注于微调模型,以便更精确地匹配致病性,根据突变在人群中的频率为其分配良性或致病性的标签。

图片

AlphaMissense 对错义变异的诊断

研究结果显示,AlphaMissense 成功预测了人类蛋白质编码基因中的 7,100 万个错义突变。 错义突变是一种遗传性变异,能够影响蛋白质的功能,进而可能导致包括癌症在内的多种疾病。在这些潜在的错义变异中,AlphaMissense 能够对 89% 的变异进行分类,其中大约 57% 被判定为可能的良性变异 (Likely benign),32% 被判定为可能的致病性变异 (Likely pathogenic),而剩余的变异则被归类为不确定性质 (Uncertain)。

这一分类能力远远超过了人类注释者,后者仅能确认所有错义突变中的 0.1%。AlphaMissense 的高效率和准确性,为遗传性疾病的研究和临床诊断提供了强有力的工具。

论文链接:

https://www.science.org/doi/10.1126/science.adg7492

EVEscape 病毒大流行的早期预警系统

哈佛医学院与牛津大学的研究团队联合开发了一个创新的通用模块化框架 EVEscape,能够在不依赖于大流行期间的测序数据或抗体结构信息的情况下,预测病毒的逃逸潜力。

EVEscape 在预测 SARS-CoV-2 大流行变异方面的准确性与高通量深度突变扫描 (DMS) 技术相当,并且其应用范围不仅限于 SARS-CoV-2,还可以扩展至其他病毒类型。这一早期预警系统为公共卫生决策和准备工作提供了指导,有助于最大限度地减少大流行对人类健康和社会经济的负面影响。

图片

EVEscape 设计图注

EVEscape 框架由两个主要部分组成:

一部分是用于生成演化序列的模型, 该模型能够洞察可能发生的病毒突变,与 EVE (Evolutionary Virus Escape) 项目中使用的模型相似;

另一部分则是包含了病毒详细生物学和结构信息的数据库。 通过整合这两个组件,EVEscape 能够预测病毒变种在实际出现之前的特征。

通过对 SARS-CoV-2 大流行的回顾性分析,研究团队证实了 EVEscape 在预测具有大流行逃逸潜力的突变方面的有效性,其预测时间比依赖于传统抗体和血清实验的方法提前了数月,同时保持了相当的准确性。利用 EVEscape 对潜在逃逸突变进行早期识别,可以为疫苗和治疗方法的设计提供关键信息,从而更有效地控制病毒的传播。

论文链接:

https://doi.org/10.1038/s41586-023-06617-0

Human Pangenome Reference 绘制首个人类泛基因组草图

在 21 世纪初期,人类基因组计划 (Human Genome Project) 成功发布了人类参考基因组的初步草图,这标志着人类在解读自身生命蓝图方面取得了突破性进展。然而,由于当时测序技术的限制,该草图存在若干未填充的空白区域。

2023 年,由美国华盛顿大学医学院和加利福尼亚大学牵头,一个由 60 个机构的 119 位科学家组成的国际联盟,运用人工智能技术,开发出了首个更新且更具代表性的人类泛基因组草图。

该草图对来自全球不同祖先背景的 47 名个体的 94 个基因组样本,采用了先进的「长读长测序」技术进行深入分析。 随后,通过定制的算法将测得的 DNA 长片段组装成更为完整的基因组序列。研究结果表明,该草图在预期序列的覆盖率上达到了 99%,同时在结构和碱基对的准确性上也超过了 99%。

图片

绘制基因组中 MHC 区域的基因组图

与基于 GRCh38 的旧工作流程相比,利用新草图分析短读长数据时,小遗传变异的发现误差降低了 34%,而在检测单倍型结构变异的检出率上则提高了 104%,新增了 1.19 亿个碱基对。 此外,新草图还揭示了两个重要的调控基因表达的新成分:HIRA 和 SATB2。这些发现对于深入理解人类基因组的结构和功能具有重要意义。

2024,AI 引领科研未来

人工智能正以其惊人的潜力,成为推动科学进展和医学领域进步的核心驱动力。在 2024 年,AI 的快速发展正在为科研和医学带来革命性的变化,其速度和影响力远超以往任何时期。AI 不仅加速了知识的积累和创新的周期,而且正在重新定义我们对复杂问题的理解和解决方式。

在科研领域, AI 的算法和模型正帮助科学家们处理和分析庞大的数据集,揭示隐藏在数据背后的深刻见解。它们在模拟和预测复杂系统的行为方面展现出了巨大的优势,从而在物理学、化学、生物学等多个基础科学领域取得了突破性的发现。

在医学领域, AI 辅助的诊断工具正变得更加精准,能够及早发现疾病迹象,为患者提供更及时的治疗。同时,AI 在个性化医疗中的应用,通过分析个体的遗传信息和生物标志物,能够为患者定制更为精准的治疗方案,极大地提高了治疗效果和患者生活质量。

此外,AI 在药物研发中的作用同样不容小觑。 它通过预测分子的活性和药物的副作用,大大缩短了新药从实验室到市场的周期,降低了研发成本,加速了新药的上市进程。

可以说,AI 的每一步进步,都像是在人类智慧的长河中投下的一颗石子,激起层层涟漪,推动着科研和医学的边界不断向前延伸,善于利用工具的人类,终将借着这一次次激荡的力量,走向更加智能、健康的新纪元。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1658306.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

[Linux]如何在Ubuntu 22.04系統安裝Node-red?

Node-red是一個建立在Node.js上的視覺化程式設計工具,其常見的應用情境為建置或轉換各項硬體之間的通信協定的物聯網或工聯網場域,其可藉由設置來安裝第三方應用模組來建置多樣的通信協定節點,包含modbus in/out, mqtt in/out, websocket in/…

Java数组创建与使用

一.创建和初始化 1.数组是怎么创建的? 直接举例子: int[] arr new int[10]; 这里只简单的举一个int开辟数组的例子。 可见java数组的创建于C语言是不同的。前面是一个int[ ]就是一个数组的数据类型,后面的arr是数组名,最后[…

【代码随想录——栈与队列】

1.栈和队列理论基础 栈和队列的原理大家应该很熟悉了,队列是先进先出,栈是先进后出。 2.用栈实现队列 type MyQueue struct {head []intheadSize intstore []intstoreSize int }func Constructor() MyQueue {return MyQueue{head : make([]int,100),h…

《ESP8266通信指南》11-Lua开发环境配置

往期 《ESP8266通信指南》10-MQTT通信(Arduino开发)-CSDN博客 《ESP8266通信指南》9-TCP通信(Arudino开发)-CSDN博客 《ESP8266通信指南》8-连接WIFI(Arduino开发)(非常简单)-CSD…

qt for android 无法进入调试c++代码解决方法

1.上一篇文章介绍了qt 5.15.13配合NDK25 的解决方法,但是还存在一个问题是可以调试qml代码但是无法进入c代码中。 在网上进行搜索,得到的答案是确实存在这个问题,包括这个qt6版本。 2.看来这个问题没有办法了,静下来思考下。这个…

AI助力临沂商贸的世界语言

“你好”“Bonjour”“Hola”……“中国老板娘”能够流利运用 17 种语言,近日在海外爆火。借由 AI 技术的助力,商家在镜头前自如切换各国语言,与来自全球各地的外商实现无障碍的沟通交流。这种现象背后,是 AI 技术对传统商贸模式的…

Python 控制 Keysight (原Agilent) 直流电源

前言 直流电源是如图型号,是keysight 6631系列;由于本身直流电源的功能也不复杂,所以控制起来相对比较简单,本来不想写这篇文章的,但是想想还是做一个简单的记录吧! 硬件环境结构图: 通信方式:由于该直流电源只GPIB接口,所以是通过GPIB线与设备进行通信 实现原理: …

中国网安上市公司2023财报摘要及启示

随着国内网络安全市场越来越来越来越卷,出海,从原来的陌生遥远不看好,已经成为许多厂商不得不思考的一个新方向。 阻力不变。 地缘政治问题依然存在,沟通成本高,对产品成熟度要求高,对团队背景和公司整体能…

如何通过OMS加快大表迁移至OceanBase

OMS,是OceanBase官方推出的数据迁移工具,能够满足众多数据迁移场景的需求,现已成为众多用户进行数据迁移同步的重要工具。OMS不仅支持多种数据源,还具备全量迁移、增量同步、数据校验等功能,并能够对分表进行聚合操作&…

文件操作

前言: 文件内容属性 要向访问文件就要打开文件——>用进程来打开——>要把文件先加载到内存中——> 一个进程可以打开多个文件,OS中也有可能多个进程打开了多个文件 文件以多,就需要进行管理,——先描述再组织 没有被打开…

基于Spring Boot框架实现大学生选课管理系统

文章目录 源代码下载地址项目介绍项目功能界面预览 项目备注源代码下载地址 源代码下载地址 点击这里下载源码 项目介绍 项目功能 教务处管理 开课、开班审批,排课处理,班级操作,选课时间段管理** 使用了sql解决了开课开班的时间段的冲突…

基于PHP后台微信图书馆借书还书小程序系统设计与实现

博主介绍:黄菊华老师《Vue.js入门与商城开发实战》《微信小程序商城开发》图书作者,CSDN博客专家,在线教育专家,CSDN钻石讲师;专注大学生毕业设计教育和辅导。 所有项目都配有从入门到精通的基础知识视频课程&#xff…

IDM下载器激活

文章目录 1、Internet Download Manager简介2、Internet Download Managery应用3、Internet Download Managery下载 1、Internet Download Manager简介 Internet Download Manager (IDM) 是一款功能强大的下载管理软件,旨在帮助用户更高效地管理和加速其下载任务。它…

【硬件开发】原型设计对于成功产品开发重要性及常见阶段

电子产品的设计与开发始于原型制作阶段。这些原型虽可能与最终产品极为相似,但总带有实验性质,因为电子原型的制作过程包括对新概念、新思想及新解决方案的测试。虽然存在出错的风险,跳过这一阶段可能会导致不必要的开支。不擅长电子硬件设计…

CSS和JavaScript

CSS 在html中引入CSS 我们需要先在该项目先建立css文件 html引入CSS,在<head></head>中添加<link>标签 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" co…

QT--4

QT 使用定时器完成闹钟 #include "widget.h" #include "ui_widget.h"void Widget::timestart() {timer.start(1000); }void Widget::timeend() {timer.stop(); }Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(t…

电商核心技术揭秘52:数字化内容营销创新

相关系列文章 电商技术揭秘相关系列文章合集&#xff08;1&#xff09; 电商技术揭秘相关系列文章合集&#xff08;2&#xff09; 电商技术揭秘相关系列文章合集&#xff08;3&#xff09; 电商技术揭秘四十一&#xff1a;电商平台的营销系统浅析 电商技术揭秘四十二&#…

火爆开展齐力控股集团带您了解2024年第13届生物发酵展

参展企业介绍 齐力控股集团专业生产高精度卫生级不锈钢设备配件及管道所有连接件、锻造、精加工一站式服务。产品广泛适用于制药、饮料、乳制品、啤酒、生物化工等领域。所有产品均按3A、SMS、DIN、RJT、IDF、DS等标准制造&#xff0c;所有产品均达到GMP药典要求。我们是一家有…

【LeetCode刷题记录】简单篇-110-平衡二叉树

【题目描述】 给定一个二叉树&#xff0c;判断它是否是 平衡二叉树 。 【测试用例】 示例1&#xff1a; 输入&#xff1a;root [3,9,20,null,null,15,7] 输出&#xff1a;true 示例2&#xff1a; 输入&#xff1a;root [1,2,2,3,3,null,null,4,4] 输出&#xff1a;false …

基于Vue3与ElementUI Plus酷企秀可视化设计器中的创新应用

一、引言 随着科技的快速发展&#xff0c;前端技术已经从简单的网页呈现进化到了复杂的数据可视化、互动体验和跨平台应用的构建。酷企秀可视化设计器作为一个集成了多种前端技术的创新平台&#xff0c;不仅为企业提供了全方位的数字化展示解决方案&#xff0c;还在多个行业领…