ChatGPT in Drug Discovery

news2026/2/12 20:27:47

在这里插入图片描述

ChatGPT是OpenAI开发的一种语言模型。这是一个在大型人类语言数据集上训练的机器学习模型，能够生成类似人类语言文本。它可以用于各种自然语言处理任务，如语言翻译、文本摘要和问题回答。在目前的工作中，我们讨论了ChatGPT在药物发现中的应用。

1 药物发现是一个非常困难和复杂的过程，原因如下:

生物复杂性:人体是一个极其复杂的系统，在分子水平上理解它是如何工作的是困难的。疾病是由多种因素引起的，寻找一种能够有效治疗疾病的药物是具有挑战性的;
失败率高:大多数进入临床试验的药物都没有获得批准。这是因为它们在测试过程中被发现无效，或者有不可接受的副作用;
耗时昂贵:药物发现过程漫长且成本高昂。
严格的监管要求:药物开发过程受到严格监管，药物必须经过一系列临床前和临床试验，才能被批准使用;(5)药物开发的不可预测性:即使一种药物已经被确定并开发出来，也不能确定它在人体试验中是否会像预期的那样起作用，有时它可能会产生意想不到的副作用;
缺乏新的靶点:许多已知的药物靶点已经被利用，寻找新的靶点变得越来越困难。尽管面临这些挑战，研究人员仍在继续努力开发新的有效药物。

2 实验设计

设计了以下可应用于计算药物发现过程的计算问题：

计算复合多样性:当问Zn的多样性时，GPT给出了正确的答案。Chat GPT的答案如下:“锌是一种原子序数为30的过渡金属，它的电子构型中有30个电子。Zn的电子构型为[Ar] 3d^10 4s^2。由于所有的电子在轨道上都是成对的，所以Zn的多样性为1(单线态)。这意味着HOMO中的所有电子都是成对的，分子中没有未成对的电子。”因此，Chat GPT可以用于密度泛函理论(DFT)量子力学计算中确定各种化合物的多重性；
将smiles转换为文件： Chat GPT成功地确定了Tylenol （Acetaminophen）的smiles，因此它可以用来将一种文件格式转换为另一种。Chat GPT的答案是：“Tylenol 的化学名称是Acetaminophen，其分子式是C8H9NO2，Tylenol 的简化分子输入行系统（SMILES）符号是 “CC（=O）NC1=CC=C（C=C1）O”。这个符号代表了分子中的原子和它们的联系”；
生成gaussian和其他软件的输入文件:Chat GPT成功生成高斯软件的输入文件；
生成AutoDock对接的输入文件:ChatGPT成功地提供了AutoDock软件的输入文件，并解释了其中提到的参数；
查找pdb文件:可用于搜索pdb。例如，它可以提供金属蛋白、DNA结合蛋白、刺突蛋白等的PDB id；
在文献检索方面的帮助:ChatGPT的一个主要应用是在文献检索和列出与主题相关的具体发现；
对接代码:它可以帮助编写基本代码，这些代码可以在药物发现的许多方面广泛使用(稍加修改)；
检查剽窃:可以用来检测剽窃，使研究过程和发表的研究工作顺利进行；
机器学习和数据分析:它可以使用其API集成到程序或应用程序中，允许开发人员输入文本并接收由模型生成的响应。可以使用Python、JavaScript和c#等编程语言访问API。此外，OpenAI团队还发布了该模型的预训练版本，可以使用称为迁移学习的过程对特定任务进行微调；
写一首关于计算化学的诗: ChatGPT也可以写一首与计算化学相关的诗；
创新:创新是研究领域的重要组成部分，只有提出不同的问题才能做到这一点。在这方面，ChatGTP对于研究人员提出新颖的想法非常有用。

Chat GPT无法回答以下复杂的问题：

Zinc tranporters的PDB ID列表；
锌离子通道的PDB ID；
可以给出FASTA序列，但不能比较FASTA序列，fasta序列可以从UniProt数据库中获得；
ADMET性质:在这种情况下，它只能给出已知药物的性质，这些性质可以很容易地从各种药物数据库中获得。

ChatGPT在药物发现中的前景：

识别和验证新的药物靶点:ChatGPT可以在科学文献的数据集上进行微调，并用于生成针对特定疾病或生物靶点的最新研究摘要。这可以帮助研究人员快速确定新的潜在目标，或者更好地了解特定领域的研究现状；
设计新药:ChatGPT可以在已知类药物分子的数据集上进行微调，并用于产生具有类似性质的新化学结构。这可以帮助研究人员确定新的先导化合物，这些化合物在临床前和临床研究中有更高的成功机会；
优化药物性质:ChatGPT可用于预测新药的药代动力学和药效学，支持药物发现早期化学物库的虚拟筛选;
评估毒性:ChatGPT可以在毒性数据集上进行微调，并用于预测新药的潜在毒性作用;
生成与药物相关的报告和论文:ChatGPT可以在与药物相关的论文数据集上进行微调，并用于生成总结特定领域研究现状的报告和论文。ChatGPT可以在已知类药物分子的数据集上进行微调，并用于生成具有类似性质的新化学结构。这可以帮助研究人员确定新的先导化合物，这些化合物在临床前和临床研究中有更高的成功机会。

虽然它有各种优点，但它不能进行广泛的科学计算，如计算RMSD, RMSF, PCA，聚类等。对于这些复杂的工作，需要训练有素和经验丰富的人员参与。需要注意的是，ChatGPT只是用于药物发现的众多工具中的一种，它不能替代实验验证和临床试验。然而，它可以通过提供一种经济有效的方法来处理大量数据并产生新知识，从而显著加快和改善药物开发过程。
虽然ChatGPT可以成为药物发现的强大工具，但使用这项技术也存在一些潜在的缺点:

依赖于数据的质量和可用性:ChatGPT的质量取决于它所接受的训练数据。如果数据不完整、有偏差或不准确，模型的预测可能不可靠。
缺乏实验验证:ChatGPT可以产生预测和假设，但它不能进行实验或测量化合物的性质。因此，该模型的预测需要实验验证。
对潜在生物学的理解有限:虽然ChatGPT可以生成类似人类的文本，但它并不理解它所模拟的系统的潜在生物学。因此，由模型做出的预测可能并不总是反映系统的真实复杂性。
有限的可解释性:像其他机器学习模型一样，ChatGPT很难解释，而且模型如何得出特定的预测并不总是很清楚。
在处理不确定性方面的限制:ChatGPT是一个确定性模型，它不能解释数据和预测中的不确定性。
缺乏透明度:ChatGPT是一个黑箱模型，很难理解和解释模型的内部工作原理，这使得很难信任模型的预测.

在使用ChatGPT进行药物发现和实验验证模型所做的预测时，重要的是要记住这些限制，并将其与其他工具和技术结合使用以克服这些限制。

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/493222.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！