生物制药中的AI困境:创新突破还是过度炒作?

news2024/9/23 7:27:10

  每周跟踪AI热点新闻动向和震撼发展 想要探索生成式人工智能的前沿进展吗?订阅我们的简报,深入解析最新的技术突破、实际应用案例和未来的趋势。与全球数同行一同,从行业内部的深度分析和实用指南中受益。不要错过这个机会,成为AI领域的领跑者。点击订阅,与未来同行! 订阅:https://rengongzhineng.io/

最近,两篇关于人工智能/机器学习(AI/ML)在生物学领域影响的文章引发了广泛讨论。第一篇由Andrew Dunn撰写,标题为“现实检查:AI在Leash Bio的结合预测竞赛中表现令人失望:‘没人表现得很好’”,直指Leash的最近比赛结果,并总结称“这对这个热门的AI生物领域来说是一个清醒的现实检查。” 第二篇文章标题更简洁明了,是Ron Boger和Dennis Gong撰写的“反科技生物学”,其中指出“生物学并不是一个适合系统化的领域。”

那么,到底是哪种情况?生物机器学习(BioML)真的因为没有在Kaggle竞赛中表现出色的公开模型而未能达到预期?还是因为生物学和药物发现的复杂性、数据获取的难度,使得这些普遍的功能近似器难以产生实际影响?

深入研究Leash Bio的比赛结果可以发现,1950支参赛队伍中并未包括任何AI领域的重量级选手,特别是那些专注于小分子研究的计算密集型生物技术公司。Leash的Quigley还公开邀请那些自认为在这项任务上占有优势的团队前来展示他们的解决方案,体现出一种谦逊的态度。然而,这种比赛更多是反映了“你甚至都没理解问题的本质”,而零次绑定物生成或许可以更准确地归类为命中发现,这是药物发现最初期(也可能是最商品化)的阶段之一。

公共和内部的注意力往往聚集在那些容易理解且有吸引力的问题上。零次绑定设计很容易向了解基本药物作用机制的人解释和推销。这似乎是个难题,如果通过机器学习“解决”了它,那就成了这些技术“增值”的无可辩驳的证据。

然而,真正的药物猎人们则会迅速指出,即使解决了零次绑定设计,他们也不会在意,因为这并不是瓶颈。理解这一点后,才能提出更好、更细致的问题,但这需要大量努力去了解你所面对的竞争,不仅仅是在Kaggle竞赛中与其他机器学习方法竞争。

在光谱的另一端,“反科技生物学”论点认为,尽管技术的进步和内部数据壁垒的网络效应可以串联成一个持续生产药物的平台,现实却粉碎了这一理论。生物学并非一个适合系统化的领域。

因此,机器学习和计算在药物发现中的真正影响究竟在哪里?与其设计一个我们认为人们会感兴趣的问题,或者放弃所有希望,不如尝试使现有的、已被验证的药物发现过程更便宜、更快、更成功。要做到这一点,需要解决哪些具体问题?

一个有前景的方向是任务特定的决策。事实证明,在生物技术领域做决策确实非常困难。决策者们必须不断做出高风险的决策,这些决策可能导致数百万甚至数十亿的资金和资源被分配到某一方向上。科学家们每天都在做出从小到大的决定,最终引导出特定分子的诞生。许多决定在药物发现的早期就可能注定其失败,比如适应症、靶点和模式的优先级排序。项目在如此多的关键决策点上可能失败,以至于任何药物的成功都堪称奇迹。数据永远不够,信息永远不足,但你仍然不得不继续做出决定。

或许当前机器学习系统最重要的贡献在于自动化低级和中级决策。因为当5个以上高技能、高学历的科学家聚在一起时,他们会在讨论的前5分钟内榨干数据中的洞察力,而接下来的50分钟则在反复讨论。这种在不确定性下做决策的挑战性令人不安,大家更喜欢讨论未知和可能出错的地方。但当大量讨论发生时,却没有实际决策被做出或更新,这就是数据已经被最大限度利用的强烈信号。

为此,机器学习在药物发现中日益重要的角色是生成更多数据,并更好地将这些数据综合到决策中。例如,高通量筛选中的命中优先级排序、快速少次蛋白设计、生物制品的命中扩展和命中成熟、有效的化学逆合成路径预测、自动化管理模式生物的机器人,以及mRNA序列设计。这些ML辅助的任务大多集中在机械化流程中——这些重要但较低级的任务,尽管执行到位并不足以保证药物发现的成功,但确是必不可少的。

今天的机器学习模型似乎更适合在任务如命中发现和某些方面的先导优化中提供帮助,而不是在项目优先级排序等复杂的重大决策上发挥作用。如果你知道去哪里看,这些机器学习系统的好处已经显现。

可解释的、模型驱动的决策允许我们通过在构建机器学习系统时进行深思熟虑的过程,然后在实际操作中很少再考虑它们,从而实现许多事情的可重复性。当这些系统正常工作且你知道原因时,它会释放出更多的精力去处理边缘案例和新的奇异问题,使得药物发现既有影响力又充满乐趣。

要实现模型驱动的决策,需要以数据为中心,具备工程文化来构建(或重建)组织。对科技生物学的幻灭来自于一种错误的期望,即只要建立一个以数据为中心、工程为先的组织,药物就会随之而来。但这种因果关系是错误的。那些知道如何制造药物的组织早已存在,它们建立在数百年的科学知识和几十年在生物学、生物化学和生物物理学方面的经验之上。作为计算科学家和工程师,我们的任务是重新构想这个过程,解决低层次问题,使高层次问题成为新的低层次问题,并使之前难以解决的问题变得可以解决。

总结来说,当前的机器学习在生物学和药物发现中,尽管面临挑战,但正在某些特定领域展现出其价值。通过聚焦于实际问题并改进已有流程,而非追求过度简化或完全否定的极端论调,我们才能真正推动这一领域的发展。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2090705.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

Your Diffusion Model is Secretly a Zero-Shot Classifier论文阅读笔记

Your Diffusion Model is Secretly a Zero-Shot Classifier论文阅读笔记 这篇文章我感觉在智源大会上听到无数个大佬讨论,包括OpenAI Sora团队负责人,谢赛宁,好像还有杨植麟。虽然这个文章好像似乎被引量不是特别高,但是和AI甚至…

使用 streamlink 把 m3u8 转为 mp4

问题描述, 背景, 来源: 下载 m3u8 ts —> 转为mp4, 按照以往的做法, 就是使用 python requests 一步一步地下载 m3u8, ts, 然后转换。 但是个人写的东西,毕竟问题比较多。 而且, 但是&…

坑——Redis集群key事件通知

redis集群的key事件通知不像普通的订阅发布消息,普通的订阅发布,在任何一个节点订阅通道,都可以收到消息,但是集群的key事件通知只在key所在的主从节点发出通知,只能通过订阅这个key所在的主从节点收到消息&#xff1b…

Leetcode3240. 最少翻转次数使二进制矩阵回文 II

Every day a Leetcode 题目来源:3240. 最少翻转次数使二进制矩阵回文 II 解法1:分类讨论 特殊情况: 讨论正中间一排(如果 m 是奇数)和正中间一列(如果 n 是奇数)中的格子要如何翻转。 综上所…

Qt Creator 配置pcl1.14.1

1.安装pcl1.14.1 地址:Releases PointCloudLibrary/pcl (github.com) 下载前两个 下载完成后双击exe文件,修改一下安装路径,然后一路下一步。 OpenNI2 默认安装到C:\Program Files 下了,想修改OpenNI2 的安装路径,可…

Unity 动态光照贴图,加载后显示变暗或者变白问题 ReflectionProbe的使用

动态加载光照贴图代码,可参考这个帖子 Unity 预制动态绑定光照贴图遇到变白问题_unity urp 动态加载光照信息 变黑-CSDN博客 这次遇到的问题是,在编辑器下光照贴图能正常显示,打出apk后光照贴图加载后变黑的问题 以下4张图代表4种状态&…

网页正文提取算法:行块分布算法 Readability

前提 爬取百度、搜狗、必应等搜索引擎时,详情页的正文因来源多样而无法简单通过通用的规则来匹配,这就需要相关的提取算法。 本文在此介绍两种网页正文提取算法:行块分布算法 & Readability。 行块分布算法 算法流程 算法依据 HTML 每…

Feign的原理及概念

1.什么是Feign Feign是Netflix开发的声明式、模板化的HTTP客户端,Feign可帮助我们更加便捷、优雅地调用HTTP API。Feign可以做到使用HTTP请求远程服务时就像调用本地方法一样的体验,开发者完全感知不到这是远程方法,更感知不到这是个HTTP请求…

迁移学习之领域偏移(domain shift)

实际应用中很多任务的数据的标注成本很高,无法获得充足的训练数据,这种情况可以 使用迁移学习(transfer learning)。假设 A、B 是两个相关的任务,A 任务有很多训练数 据,就可以把从A任务中学习到的某些可以…

监控域名到期发送钉钉消息通知

目的 想象一下,域名到期都不知道,忘了续费,就像忘了交房租,房东(互联网)会毫不留情地把你扫地出门!所以,及时续费,让顾客轻松找到你,生意红红火火&#xff0…

掌握测试的艺术:深入探索Python的pytest库

文章目录 **掌握测试的艺术:深入探索Python的pytest库**背景:为什么选择pytest?pytest是什么?如何安装pytest?5个简单的库函数使用方法1. pytest.main()2. pytest.skip()3. pytest.mark.parametrize()4. pytest.raises…

从跟跑到领跑:AIGC时代国产游戏的崛起与展望

文章目录 一、技术深度挖掘1.图形渲染与视觉盛宴2.物理引擎的精细化与真实性3.AI技术的深度融入与创新 二、行业影响深度剖析1.产业链的全面升级2.IT人才需求的多元化与高端化3.文化输出与国际影响力的增强 三、未来趋势与跨界合作1.技术创新引领未来2.跨界合作拓展市场 四、代…

VLM(视觉语言模型)综述

概述 大型语言模型的出现标志着人工智能领域转型的开始,它们在文本信息处理上的能力极大地推动了这一进程。尽管LLMs在文本处理上表现出色,但它们主要限于处理单一模态的数据,即文本。这限制了它们在理解和生成涉及图像和视频等多模态数据方…

最新华为OD机试-E卷-流浪地球(100分)-五语言题解(Python/C/JavaScript/Java/Cpp)

🍭 大家好这里是春秋招笔试突围 ,一枚热爱算法的程序员 ✨ 本系列打算持续跟新华为OD-E/D卷的三语言AC题解 💻 ACM金牌🏅️团队| 多次AK大厂笔试 | 编程一对一辅导 👏 感谢大家的订阅➕ 和 喜欢💗 🍿 最新华为OD机试D卷目录,全、新、准,题目覆盖率达 95% 以上,…

XSS LABS - Level 20 过关思路

关注这个靶场的其他相关笔记:XSS - LABS —— 靶场笔记合集-CSDN博客 0x01:环境配置 提示:Flash 逆向工具 JPEXS 配置请看 Level 19 的过关流程,这里就不重新教怎么安装配置了。 要想完成本关,需要下载 Flash,不然就会出现下面的情况: 我个人建议,是直接下载一个 Flash…

HUD杂散光环境模拟测试设备

概述 HUD(Head-Up Display)杂散光环境模拟测试设备是用于模拟飞行器在实际运行过程中可能遇到的多种光照环境的系统。它主要用于测试和验证HUD显示系统的性能,确保其能在各种光线条件下清晰、准确地显示信息,从而保障飞行员在复杂…

学习C语言(19)

整理今天的学习内容 1.memmove使用和模拟实现 void* memmove (void* destination,const void* source,size_t num); 和momcpy的差别是memmove函数处理的源内存块和目标内存块是可以重叠的 memmove的模拟实现: 2.mem…

程序批量卸载工具 | BCUninstaller v5.8.1 绿色版

大家好,今天电脑天空给大家推荐一款强大的Windows软件卸载工具——Bulk Crap Uninstaller(BCUninstaller)。如果你经常需要安装和卸载软件,那么这款工具绝对值得你一试。以下是我在使用BCUninstaller的一些心得分享,希…

具备自动灵敏度校准、支持单键和多点触控的触摸芯片-GTX315L

电容式触摸芯片 - GTX315L是具有多通道触发传感器的15位触摸传感器系列,它是通过持续模式提供中断功能和唤醒功能,具备自动灵敏度校准、超强抗干扰能力,可抗特斯拉(小黑盒)线圈干扰,支持单键/多点触控&…

CN05.1,NDVI,CMIP6及TIFF图像数据处理方法合集

笔记链接: 数据处理数据集:https://www.wolai.com/aKjMiRrEk6C3WG4Yg8rYiz需要登录wolai才能查看,用于个人学习记录。