李飞飞团队 AI4S 最新洞察：16 项创新技术汇总，覆盖生物/材料/医疗/问诊……

不久前，斯坦福大学 Human-Center Artificial Intelligence (HAI) 研究中心重磅发布了《2024年人工智能指数报告》。 作为斯坦福 HAI 的第七部力作，这份报告长达 502 页，全面追踪了 2023 年全球人工智能的发展趋势。相比往年，扩大了研究范围，涵盖了 AI 技术、公众对 AI 技术的看法以及围绕其发展的政治动态等基本趋势，并对未来的 AI 发展趋势进行了预测。

HAI 由华人人工智能学者李飞飞教授（右）与哲学家 John Etchemend（左）共同领导

在这份报告中，最引人注目的莫过于新增篇章——探讨人工智能在科学和医学领域的深远影响。 报告中展示了 2023 年 AI 在科学领域的辉煌成就，以及 AI 在医疗领域取得的重要创新成果，包括 SynthSR 和 ImmunoSEIRA 等突破性技术。此外，报告还细致分析了 FDA 对 AI 医疗设备审批的趋势，为行业提供了宝贵的参考。

AI：科研加速引擎

《2024年人工智能指数报告》指出，2023 年，产业界产生了 51 个著名的机器学习模型，而学术界只贡献了 15 个。此外，108 个新发布的基础模型来自产业界，28 个来自学术界。

尽管相较于产业界，学术界的发展速度明显偏慢，但需要注意的是，直到 2022 年 AI 才被正式用于科学发现领域。从优化算法排序效率的 AlphaDev 到革新材料发现流程的 GNoME，我们见证了更为重要的、相关性更高的人工智能应用的问世。

如今，AI 已经在材料科学、气候变化、计算机科学等领域多点开花。幸运的是，在这一轮变革中，中国正处于领先地位。根据中国科学技术信息研究所、科技部新一代人工智能发展研究中心编写的《中国 AI for Science 创新地图研究报告》，我国在 AI 驱动科学研究方面的论文发表数量位居榜首，国产化 AI 科研基础软件也日益成熟，为科研人员提供了丰富的数据集、基础模型及专用化工具。

总的来说，AI 在科学领域的应用是多元化的，正在以一种前所未有的速度，推动科学的发展和进步。但需要注意的是，在 AI for Science 当前的发展阶段中，综合型人才短缺、技术方案难复用、垂类学科研究数据质量欠佳等问题也逐渐暴露出来。

例如，在围绕「AI 人才搞科研还是科研人才学 AI」的讨论中，拥有交叉学科知识背景的研究人员脱颖而出，不仅对所在科研领域有着深刻洞察，更加能够快速上手各类 AI 工具与技术，但其稀缺程度可想而知，而综合型人才的培养亦非朝夕而成。所以，如何快速搭建起 AI 与科研之间的沟通桥梁是关乎 AI for Science 规模化推广的重要议题。

同时，科研所覆盖领域之丰富无需赘述，不同课题组的研究方向稍有差异便可能对 AI 工具的需求不同，在难以实现每个团队都拥有交叉学科背景的研究人员时，降低 AI 工具的使用门槛，简化模型微调过程，或许也能够在一定程度上加速 AI 在科研领域的推广。

加速更新，技术的自我迭代与进步

AI 技术进步推动其应用的广度和深度提升，同时也对算法提出越来越高的要求。目前，大多数算法已经达到了难以依靠人类专家来进一步优化的阶段，导致了计算瓶颈的不断加剧。然而，科学家针对算法领域的开拓从未止步。

AlphaDev 重现 AlphaGo 的神来之笔

排序算法是计算机系统对数据项进行有序排列的基础性工具。为了在这一领域实现创新突破，谷歌 DeepMind** 采取了一种创新的方法，探索了人类研究相对较少的计算机汇编指令领域。通过 AlphaDev 系统，DeepMind 能够直接从 CPU 汇编指令层面出发，寻找更高效的排序算法。

AlphaDev 系统由两个核心组成部分构成：学习算法和表示函数。

学习算法是在先进的 AlphaZero 算法基础上进行扩展，结合了深度强化学习 (DRL) 和随机搜索优化算法，以执行大规模的指令搜索任务；而表示函数则基于 Transformer 架构，能够捕捉汇编语言的底层结构，并将其转换成特殊的序列表示。

利用 AlphaDev 系统，DeepMind 成功发现了优于当前手工调优算法的定长短序列排序算法，即 Sort 3、Sort 4 和 Sort 5，并将相关代码集成到了 LLVM 标准 C++ 库中。 特别值得一提的是，在发现 Sort 3 算法的过程中，AlphaDev 采用了一种看似违反直觉却实际上是一条捷径的方法，这让人联想到 AlphaGo 在对战传奇围棋选手李世石时所采用的「第 37 步」——一种出人意料的策略，最终取得了胜利。

在优化算法长度时，AlphaDev与人类基准的比较

AlphaDev 的应用范围不仅限于排序算法。DeepMind 通过将其方法泛化，还将其应用于 9 到 16 字节范围内的哈希算法，并实现了速度提升 30% 的显著成果。这表明 AlphaDev 在优化底层计算任务方面具有广泛的潜力和应用价值。

论文链接：

https://www.nature.com/articles/s41586-023-06004-9

FlexiCubes 用 AI 生成高质量 3D 模型

从场景重构到生成式 AI 赛道，新一代的 AI 模型在生成逼真而详细的 3D 模型方面取得了显著的成功。由于这些模型通常被创建为标准的三角网格，网格的质量也就显得至关重要。为此，Nvidia 的研究人员开发了一种全新的网格生成方法 FlexiCubes，显著提高了 3D 网络生成管道中的网格质量，并且可以与物理引擎集成，轻松创建 3D 模型中的灵活物体。

FlexiCubes 表面重建示例

FlexiCubes 的关键思想是引入「灵活」参数，允许在生成网格的过程中进行精确调整。 通过在优化过程中更新这些参数，网格的质量得到了极大的增强。这种方法使 FlexiCubes 与传统基于网格的管道（如广泛使用的 Marching Cubes算法）形成鲜明对比，使其可以无缝地取代优化为基础的人工智能流水线。

FlexiCubes 生成的高质量网格在表示复杂细节方面表现出色，增强了人工智能生成的 3D 模型的整体逼真度和保真度。这些网格尤其适用于物理模拟，在摄影测量和生成式 AI 等场中，使得 AI 管道准确呈现复杂形状中的细节成为可能。

论文链接：

https://research.nvidia.com/labs/toronto-ai/flexicubes/

加速创造，超越人力的效能提升

Synbot AI 驱动的机器人化学家

在化学实验室的深处，一场革命正在悄然进行——有机化合物的合成不再是缓慢而繁琐的过程，而是通过自动化的魔法，加速转化为现实。这一变革的核心，是三星电子的科学家们所创造自主合成机器人 Synbot。

Synbot 的设计图注

具体来看，Synbot 由三层结构组成：

人工智能软件层 (AI S/W layer)： 引领综合规划过程，配备逆合成模块、实验设计和优化模块，并使用决策模块引导实验方向；

机器人软件层 (Robot S/W layer)： 负责通过配方生成模块和翻译模块，将其转换为机器人的可操作命令；

机器人层 (Robot layer)： 在在线调度模块的监督下，将合成实验室的各种功能模块化，并系统地执行计划的配方 (recipe)，不断更新数据库，直到达到预定义的目标。

研究显示，Synbot 可在 24 小时内平均进行 12 个反应。假设人类研究人员每天可进行两次此类实验，那么与人类同行相比，Synbot 的效率至少提高了 6 倍。 随着 Synbot 的加入，科学家们得以从繁琐的操作中解放出来，将更多的精力投入到创新和探索之中。

论文链接：

https://www.science.org/doi/full/10.1126/sciadv.adj0461

GNoME 重塑材料发现过程

谷歌 DeepMind 在 Nature 刊文称，基于材料探索的 AI 工具 GNoME (Graph Networks for Materials Exploration) 发现了 220 万种新晶体预测（相当于人类科学家近 800 年的知识积累），其中有 38 万个稳定的晶体结构，有望通过实验合成，部分材料或许会引发技术变革，如下一代电池、超导体等。

GNoME（蓝）与Materials Project（紫）的比较

GNoME 是一种先进的图神经网络 (GNN) 模型，输入数据主要采用图表的形式，形成类似原子之间的连接，这也让 GNoME 更容易发现新的晶体材料。据介绍，GNoME 能够预测新型稳定晶体的结构，然后通过 DFT（密度泛函理论）进行测试，并将所得的高质量训练数据反馈到模型训练中。

现阶段，新模型将预测材料稳定性的准确率从 50% 左右提高到 80%，新材料的发现率从 10% 以下提高到 80% 以上。 （点击查看完整报道：领先人类 800 年？DeepMind 发布 GNoME，利用深度学习预测 220 万种新晶体）

加速改变，从容应对生态环境「灰犀牛」

GraphCast 生成最准确的全球天气预报

谷歌 DeepMind 发布的 GraphCast，是一种基于机器学习和图神经网络 (GNN) 的天气预报系统，采用「编码-处理-解码」配置，共有 3,670 万个参数，能够以 0.25 度经度/纬度（赤道处 28 公里 x 28 公里）的高分辨率进行预测，范围覆盖了整个地球表面。在每个网格点，该模型预测 5 个地球表面变量（包括温度、风速、风向、平均海平面压力等），以及 37 个不同海拔高度上的 6 个大气变量，包括比湿、风速、风向和温度。

GraphCast 天气预测

在综合基础测试中，对比 HRES (High Resolution Forecast) GraphCast 对 1,380 个测试变量中的近 90% 提供了更准确的预测。 根据对比分析，GraphCast 还可以比传统预测模型更早地识别恶劣天气事件。（点击查看完整报道：雹暴中心收集数据、大模型加持极端天气预测，「追风者也」正在上演）

Flood Forecasting 人工智能改变洪水预报

2018 年，谷歌启动了 Google Flood Forecasting Initiative，利用 AI 和强大算力打造更好的洪水预测模型，并与多国政府部门展开合作。2023 年，谷歌的研究团队开发了一个基于机器学习的河流预报模型，该模型能够提前 5 天实现对洪水的可靠预测，在对 5 年一遇的洪水事件进行预测时，性能优于或相当于目前预测 1 年一遇的洪水事件，系统可覆盖 80 多个国家。

该研究通过采用两个长短期记忆网络 (LSTM) 的应用，构建了一种先进的河流预测模型。模型的核心架构基于编码器-解码器机制 (encoder-decoder framework)。 具体而言，Hindcast LSTM 模块负责处理历史气象数据，而Forecast LSTM 模块则处理预测气象数据。模型的输出为每个预测时间点的概率分布参数，这些参数能够提供对特定河流在特定时间点的流量概率预测。

AI 模型与 GloFAS 在不同回报期的预测对比

研究结果表明，该模型在性能上超越了当前全球领先的建模系统——哥白尼应急管理服务全球洪水感知系统 (GloFAS)。 这一发现证实了所提出模型在河流预测领域的潜力和可靠性，为洪水预警和水资源管理提供了一种新的技术手段。（点击查看完整报道：击败全球 No.1 系统、覆盖 80+ 国家，谷歌洪水预测模型再登 Nature）

AI：引领医学新纪元

《2024 年人工智能指数报告》表明，AI 技术在医疗影像、医疗问答、医学诊断、等多领域取得成效。事实上，AI 在医疗健康领域的应用是早已为人们所熟知。通过机器学习算法，AI 能够分析大量的医疗数据，帮助医生更准确地诊断疾病。例如，在癌症检测中，AI 可以识别出医学影像中的微小异常，从而提高早期诊断的成功率。

此外，AI 也在药物研发中发挥着重要作用。一方面， AI 深化了对药物靶点和化合物合成的理解，优化药物发现的步骤，大大提升了新药面世的成功机会。另一方面， AI 技术被用于缩短新药研发周期、节省成本，并显著提升药物研发效率和企业竞争力。

值得注意的是，《2024 年人工智能指数报告》还对人工智能相关医疗设备进行了总结，美国食品药品监督管理局 (FDA) 对 AI 相关医疗设备的批准数量持续增加。2022 年，FDA 批准了 139 个 AI 相关医疗设备，比前一年增加了 12.1%，从 2012 年开始这一数字已经增长了超过 45 倍，显示了 AI 在现实世界医疗应用中的广泛使用。

尽管 AI 技术在实际医疗中的应用带来了许多机遇，但也面临着一系列亟待解决的挑战，例如 AI 伦理问题、数据隐私保护、技术瓶颈、监管和问责制、跨学科合作、临床适用性等方面的困境。尤其是，A I 模型的「黑箱」特性使得其决策过程难以解释，这对于需要高度透明度和可追溯性的医疗诊断来说是一个重大挑战。 缺乏可解释性可能会影响医生对 AI 辅助诊断结果的信任度。

因此，除了技术迭代外，如何在政策、标准、监管、安全等方面补齐短板，如何破除自身「黑盒」特性等问题，仍然需要政府与相关企业共同推动解决。

医学影像：提供更全面、更深入的解决方案

AI 技术在医学影像领域的应用正变得越来越多样化和深入，从辅助诊断到改善工作流程，再到推动个性化医疗，AI 正成为医学影像不可或缺的工具。

SynthSR 转换高分辨率图像并修复病灶

SynthSR 由麻省理工学院计算机与人工智能实验室开发，通过训练一个超分辨率卷积神经网络 (CNN)，利用了开放存取系列影像研究数据集中，1 毫米各向同性高场强 MRI 扫描数据集，以及对大脑内 39 个感兴趣区域 (ROI) 的精确分割。该技术主要针对低场强 (0.064-T) 的 T1 和 T2 加权脑 MRI 序列，同时采用磁化制备的快速梯度回波 (MPRAGE) 采集技术，旨在生成具有 1 毫米各向同性空间分辨率的高质量图像。

SynthSR 生成图像

SynthSR 的先进之处在于，其能够将临床上不同方向、不同分辨率和不同对比度的 MRI 扫描数据，转换为 1mm 各向同性的 MPRAGE 图像，并在此过程中对病灶进行修复。

转换后的合成 MPRAGE 图像能够直接应用于现有的脑部 MRI 3D 图像分析工具，如图像配准或分割，无需进行额外的训练。 此外，通过对比合成图像与实际高场强图像的大脑形态测量数据，研究进一步验证了 LF-SynthSR 在定量神经放射学领域的应用潜力。

论文链接：

http://arxiv.org/pdf/2012.13340v1.pdf

CT Panda 早期胰腺癌筛查

针对胰腺癌变位置隐匿、在平扫 CT 图像中无明显表征等特点，阿里达摩院联合全球十多家医疗机构的研究团队将 AI 用于无症状人群的胰腺癌筛查研究，构建了一个独特的深度学习框架，最终训练出胰腺癌早期检测模型 PANDA。

PANDA 模型是一种先进的医学图像分析工具，综合运用了多种深度学习技术来提高胰腺病变的检测效率和准确性。该模型首先利用一个分割网络 (U-Net) 精确定位胰腺区域，然后通过一个多任务卷积神经网络 (CNN) 来识别图像中的异常情况。最后，采用双通道 Transformer 模型对检测到的异常进行分类，并识别出具体的胰腺病变类型。

该技术的核心优势在于，能够借助 AI 算法放大并识别平扫 CT 图像中那些难以用肉眼辨识的微小病变特征。 这不仅实现了对早期胰腺癌的高效和安全检测，而且有效解决了以往筛查方法中假阳性率较高的问题。

PANDA 在实际多场景验证中的性能

在验证试验中，PANDA 的灵敏度 (sensitivity) 比普通放射科医生高 34.1%，特异性 (specificity) 比普通放射科医生高 6.3%。在一项涉及约 2 万名患者的大规模真实测试中，PANDA 的灵敏度为 92.9%，特异性为 99.9%。 （点击查看完整报道：在 2 万病例中识别出 31 例漏诊，阿里达摩院牵头发布「平扫 CT +大模型」筛查胰腺癌）

医疗诊断：制定个性化、精准的诊断和治疗方案

从提高诊断效率和准确性到提供个性化治疗方案，AI 技术在医疗诊断领域的潜力巨大，有助于改善医疗服务质量和患者体验。

Coupled Plasmonic Infrared Sensors 赋能神经退行性疾病诊断

在神经退行性疾病的诊断领域，由于缺乏检测临床前期生物标志物的有效工具，使得帕金森综合征、阿尔茨海默症等疾病的早期诊断面临重大挑战。虽然传统的检测方法如质谱法和酶联免疫吸附试验 (ELISA)，在一定程度上有所帮助，但它们在识别生物标志物结构状态变化方面存在局限。

针对这一难题，瑞士洛桑联邦理工学院的研究团队开发了一种创新的诊断方法，结合神经网络技术、表面增强红外吸收 (SEIRA) 光谱的等离子体红外传感器，以及免疫测定技术 (ImmunoSEIRA)，实现了对神经退行性疾病阶段和进展的量化分析。

ImmunoSEIRA 检测原理及设置

ImmunoSEIRA 传感器采用了金纳米棒阵列，该阵列表面修饰有针对特定蛋白质的抗体，能够从极小量的样本中实时捕获目标生物标志物，并对其进行结构分析。随后，利用神经网络对错误折叠的蛋白质、低聚物和原纤维聚集体进行识别，从而实现了前所未有的高准确性检测水平。这一方法的提出，为神经退行性疾病的早期诊断和精确评估提供了一种新的技术手段。

CoDoC AI 与医生诊断之间的逻辑整合

谷歌 DeepMind 开发了一款名为 CoDoC 的医疗辅助人工智能系统，旨在对医学图像进行深入的解释和分析，通过学习，该系统能够决定何时依赖自身的判断，何时采纳医生的意见。

具体来说，DeepMind 团队探究了临床医生使用 AI 工具辅助解读医学图像的各种应用场景。对于任何临床环境的理论案例，CoDoC 系统只需要训练数据集中每个病例的三个输入：

首先，预测 AI 输出的置信度分数，该分数介于 0（确定无疾病）到 1（确定有疾病）之间；

其次，临床医生对医学图像的解读；

最后，疾病的客观存在性。

值得注意的是，CoDoC 系统无需直接访问医学图像本身。

CoDoC 与其他工具的性能比较

此外，DeepMind 利用多个真实世界的去识别化历史数据集对 CoDoC 系统进行了全面的测试。测试结果表明，将人类的医学专业知识与 AI 模型的预测相结合，能够提供最为精确的诊断方案，其准确性超越了单独使用任一方法所能达到的水平。 这一发现强调了 AI 与人类专家协同工作的重要性，为提高医学成像诊断的准确性和可靠性提供了新的视角。

医疗问答：提高诊断准确性、优化治疗方案、提升患者服务体验

2020 年，研究者提出了基于知识图谱的医疗问答系统 MedQA，利用知识图谱来表示和存储医疗领域的结构化和半结构化数据，然后通过图搜索、推理或匹配等技术，从知识图谱中检索或生成答案。自 MedQA 发布以来，AI 在医疗知识问答方面的能力也得到了更加广泛的关注。

GPT-4 Medprompt 准确率超过 90%

微软研究团队开发的 GPT-4 Medprompt，在 MedQA 数据集（美国医师执照考试题）上，让 GPT-4 的准确率首次超过 90%， 超越 BioGPT 和 Med-PaLM 等一众微调方法。研究人员还表示，Medprompt 方法是通用的，不仅适用于医学，还可以推广到电气工程、机器学习、法律等专业中。

Medprompt 是多种提示策略的组合体，其包含了：

动态少样本选择： 研究人员先利用 text-embedding-ada-002 模型为每个训练样本和测试样本生成向量表示。然后，对于每个测试样本，基于向量相似度，从训练样本中挑选出最相似的 k 个样本。

自生成思维链： 思维链 (CoT) 方法就是让模型一步一步思考，生成一系列中间推理步骤。与在 Med-PaLM 2 模型中专家手工制作的思维链示例相比，GPT-4 生成的思维链基本原理更长，而且分步推理逻辑更细粒度。

选项洗牌集成： GPT-4 在做选择题时，可能会存在一种偏见，就是不管选项内容是什么，它会偏向总是选择 A，或者总是选择 B，这就是位置偏差。为了减少这个问题，研究人员选择将原来的选项顺序打乱重排，然后让 GPT-4 做多轮预测，每轮使用选项的一个不同排列顺序。

GPT-4 与 Med-PaLM 2 在回答医学问题上的比较

研究表明，Medprompt 在 PubMedQA、MedMCQA 和 MMLU 等多个知名医疗基准测试的多选题部分，分别比 2022 年排名第一的 Flan-PaLM 540B 高出 3.0、21.5 和 16.2 个百分点。它的性能也超过了当时最先进的 Med-PaLM 2。

MediTron-70B 最佳医疗开源大型语言模型

由于 GPT-4 Medprompt 是一个封闭源代码系统，限制了其在更广泛公众中的免费使用。为了解决这一问题，瑞士洛桑联邦理工学院的研究人员基于此系统开发出了 MediTron-70B，旨在提供一个开源的、面向医疗领域的高性能大型语言模型。

MediTron 是一种深度学习算法，基于 Llama 2 架构构建，并采用了 Nvidia 的 Megatron-LM 分布式训练器进行微调， 同时对一个综合性的医疗语料库进行了扩展预训练。该语料库精心挑选了 PubMed 上的文章、摘要以及国际公认的医学指南。

MediTron-70B 在 MedQA 上的表现

MediTron 系列包括 MediTron-7B 和 MediTron-70B 两种模型。其中，MediTron-70B 的性能已经超越了包括 GPT-3.5 和 Med-PaLM，并且接近于 GPT-4 和 Med-PaLM-2 的水平。

为了推动开源医疗LLMs的发展，开发团队已经公开了其使用的医疗预训练语料库以及 MediTron 模型的权重代码。MediTron-70B 在 MedQA 上的得分是开源模型中最高的，这一成就标志着开源医疗LLMs 领域的一个重要进展。

论文链接：

https://arxiv.org/pdf/2311.16079.pdf

MedAlign 减轻医疗保健管理负担

目前，针对医疗保健领域的文本生成任务所使用的电子健康记录 (EHR) 问答数据集，尚未能充分捕捉到临床医生在信息需求分析和文档处理方面所面临的复杂性。

为了填补这一空白，一个由 15 名不同专业领域的临床医生组成的团队，推出了 MedAlign——一个基于 EHR 数据的基准数据集。该数据集囊括了 983 个真实世界的临床问题及其说明，以及 303 名临床医生提供的答案，通过分析 276 份纵向 EHR 数据，构建了指令-响应对。

这一工作不仅解决了复杂临床任务中 LLM 实用性的评估基准缺失，而且通过提供一个真实且全面的指令响应数据集，推动了医疗保健领域自然语言生成的研究进展。

模型性能评估

在 MedAlign 数据集上，研究人员对 6 个来自不同通用领域的大型语言模型进行了测试，并通过临床医生评估了每个大模型生成的响应的准确性和质量。

结果显示，经过多步优化的 GPT-4 模型变种在正确率上达到了 65.0%，总体上比其他 LLM 更受青睐。 MedAlign 作为首个广泛覆盖 EHR 应用的基准数据集，标志着利用人工智能技术减轻医疗保健行政负担的重要进展。

论文链接：

https://arxiv.org/pdf/2308.14089.pdf

医学研究：用 AI 筑起人类健康的最坚实防线

随着技术的不断进步，AI 技术在医学研究领域的应用更加广泛和深入。如今，科学家们正在借助 AI 的力量，深度挖掘人类基因的密码，用 AI 帮助我们建立起一道坚实的医学防线。

AlphaMissence 有效识别基因致病性错义突变

谷歌 DeepMind 团队在 AlphaFold 的基础上，进一步开发了一款新的 AI 模型——AlphaMissense。该模型融合了 AlphaFold 提供的高精度蛋白质结构模型，以及从相关序列中提炼出的约束进化算法。 AlphaMissense 的训练过程分为两个阶段：

第一阶段类似于 AlphaFold 的训练，重点在于增强蛋白质语言模型的权重；
第二阶段则专注于微调模型，以便更精确地匹配致病性，根据突变在人群中的频率为其分配良性或致病性的标签。

AlphaMissense 对错义变异的诊断

研究结果显示，AlphaMissense 成功预测了人类蛋白质编码基因中的 7,100 万个错义突变。 错义突变是一种遗传性变异，能够影响蛋白质的功能，进而可能导致包括癌症在内的多种疾病。在这些潜在的错义变异中，AlphaMissense 能够对 89% 的变异进行分类，其中大约 57% 被判定为可能的良性变异 (Likely benign)，32% 被判定为可能的致病性变异 (Likely pathogenic)，而剩余的变异则被归类为不确定性质 (Uncertain)。

这一分类能力远远超过了人类注释者，后者仅能确认所有错义突变中的 0.1%。AlphaMissense 的高效率和准确性，为遗传性疾病的研究和临床诊断提供了强有力的工具。

论文链接：

https://www.science.org/doi/10.1126/science.adg7492

EVEscape 病毒大流行的早期预警系统

哈佛医学院与牛津大学的研究团队联合开发了一个创新的通用模块化框架 EVEscape，能够在不依赖于大流行期间的测序数据或抗体结构信息的情况下，预测病毒的逃逸潜力。

EVEscape 在预测 SARS-CoV-2 大流行变异方面的准确性与高通量深度突变扫描 (DMS) 技术相当，并且其应用范围不仅限于 SARS-CoV-2，还可以扩展至其他病毒类型。这一早期预警系统为公共卫生决策和准备工作提供了指导，有助于最大限度地减少大流行对人类健康和社会经济的负面影响。

EVEscape 设计图注

EVEscape 框架由两个主要部分组成：

一部分是用于生成演化序列的模型， 该模型能够洞察可能发生的病毒突变，与 EVE (Evolutionary Virus Escape) 项目中使用的模型相似；

另一部分则是包含了病毒详细生物学和结构信息的数据库。 通过整合这两个组件，EVEscape 能够预测病毒变种在实际出现之前的特征。

通过对 SARS-CoV-2 大流行的回顾性分析，研究团队证实了 EVEscape 在预测具有大流行逃逸潜力的突变方面的有效性，其预测时间比依赖于传统抗体和血清实验的方法提前了数月，同时保持了相当的准确性。利用 EVEscape 对潜在逃逸突变进行早期识别，可以为疫苗和治疗方法的设计提供关键信息，从而更有效地控制病毒的传播。

论文链接：

https://doi.org/10.1038/s41586-023-06617-0

Human Pangenome Reference 绘制首个人类泛基因组草图

在 21 世纪初期，人类基因组计划 (Human Genome Project) 成功发布了人类参考基因组的初步草图，这标志着人类在解读自身生命蓝图方面取得了突破性进展。然而，由于当时测序技术的限制，该草图存在若干未填充的空白区域。

2023 年，由美国华盛顿大学医学院和加利福尼亚大学牵头，一个由 60 个机构的 119 位科学家组成的国际联盟，运用人工智能技术，开发出了首个更新且更具代表性的人类泛基因组草图。

该草图对来自全球不同祖先背景的 47 名个体的 94 个基因组样本，采用了先进的「长读长测序」技术进行深入分析。 随后，通过定制的算法将测得的 DNA 长片段组装成更为完整的基因组序列。研究结果表明，该草图在预期序列的覆盖率上达到了 99%，同时在结构和碱基对的准确性上也超过了 99%。

绘制基因组中 MHC 区域的基因组图

与基于 GRCh38 的旧工作流程相比，利用新草图分析短读长数据时，小遗传变异的发现误差降低了 34%，而在检测单倍型结构变异的检出率上则提高了 104%，新增了 1.19 亿个碱基对。 此外，新草图还揭示了两个重要的调控基因表达的新成分：HIRA 和 SATB2。这些发现对于深入理解人类基因组的结构和功能具有重要意义。