AI医药论文阅读-使用药物描述和分子结构从文献中提取药物-药物相互作用

news2024/9/22 19:28:06

202107Using drug descriptions and molecular structures for drug-drug interaction extraction from literature

使用药物描述和分子结构从文献中提取药物-药物相互作用

Bioinformatics. 2021.07

有代码 https://github.com/tticoin/DESC_MOL-DDIE

目录

202107Using drug descriptions and molecular structures for drug-drug interaction extraction from literature

概述

研究背景

实验

输入句子表示

药物描述表示

分子结构表示

Ensemble

实验


概述

我们获得了以下结果。首先,大规模原始文本信息与现有模型相结合时可以大大提高提取DDI的性能,并显示出最先进的性能。其次,每种药物描述和分子结构信息都有助于进一步提高某些特定DDI类型的DDI性能。最后,同时使用药物描述和分子结构信息可以显著提高所有DDI类型的性能。结果表明,纯文本、药物描述信息和分子结构信息是互补的,它们的有效组合对于改进至关重要。

研究背景

本文是我们在ACL 2018(Asada等人,2018)中工作的重要扩展,有以下扩展:

  • 将 word2vec 的标记表示替换为 SciBERT 获得的上下文化向量。因此,我们以最先进的性能显著提高了基线的性能。

  • 采用了神经分子GNN(Tsubaki等人,2019),它考虑了相对较大的原子片段并更好地代表分子结构。

  • 我们使用了在药物数据库中注册的药物描述,并且我们表明药物描述信息对于从某些DDI类型的语料库中提取DDI很有用。

  • 研究发现,大规模训练前信息、药物描述和药物分子信息是互补的,它们的有效组合可以在很大程度上提高DDI提取性能。

实验

模型接收带有目标药物对的输入句子,并将该对分类为特定的DDI类型。使用SciBERT(Beltagy等人,2019)丰富了输入句子,这是一个在大规模生物医学和计算机科学文本上训练的BERT模型。

使用SciBERT获得靶药物的药物描述表示,并使用Tsubaki等人提出的分子图神经网络GNN)模型获得靶药物的分子结构表示

将这些药物描述和分子结构表示与丰富的输入句子表示相结合,并将目标药物对分类为特定的 DDI 类型。

(A)说明如何编码输入句子,药物描述和药物分子结构。(B)和(C)显示使用药物描述表示和药物分子结构表示时的预测层

输入句子表示

图1A的左侧:给定一个输入句子S=(w1,⋯,wn)以及药物m1和m2,首先通过WordPiece算法将句子拆分为单词。然后,通过BERT模型(图1A中的浅蓝色向量)将每个单词wi转换为实值预训练的上下文嵌入;我们还准备d(p)维位置嵌入wp1和wp2,对于每个词片,分别对应于第一个和第二个目标提及的相对位置(图 1A 中的绿色向量)。我们连接词片嵌入和位置嵌入:

药物描述表示

与输入句子类似,药物的描述句子由BERT和CNN转换为实值固定大小向量。我们直接使用 BERT 的词片嵌入,无需词位置嵌入来准备卷积层的输入.

卷积和最大池化与输入句子的处理方式相同

分子结构表示

在图中将原子表示为节点,将键表示为边缘。采用了GNN的方法。GNN使用相对较大的片段(称为r半径子图或分子指纹)来表示原子及其在图中的上下文。分子GNN采用指纹向量作为原子向量,随机初始化向量并考虑分子的图结构对其进行更新.

 药物分子载体是通过将所有原子载体相加而获得的,然后将所得载体送入线性层。

进行DDI提取 

Ensemble

采用集成技术来组合来自不同模型的预测。具体来说,我们只是在分别训练每个模型后,将不同模型的预测分数汇总为融合。例如,当我们将模型的预测与描述信息以及分子结构信息相结合时,预测分数汇总如下:

实验

数据集

数据集由两部分组成:MEDLINE和DrugBank。MEDLINE由MEDLINE/PubMed文章中的摘要组成,而DrugBank由DrugBank的FDA标签参考中的药物相互作用文本组成。

实验结果

 

 

 

 

 

 

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/137864.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2022亚太杯数学建模(补赛)DE题思路模型代码

占个位置吧,开始在本帖实时更新赛题思路代码,文章末尾名片获取!ABC题已更新 持续为更新参考思路 赛题思路 会持续进行思路模型分析,下自行获取。 D题思路: (比赛开始后第一时间更新) E题思…

面试官:海量请求下的接口并发解决方案,具体聊聊吧

设定一个场景,假如一个商品接口在某段时间突然上升,会怎么办? 生活中的例子来说,假设冰墩墩在当天晚上上热搜之后,迅速有十几万人去淘宝下单购买,此时并没有做好对该商品的缓存预热以及准备,如何…

【力扣刷题】day1-1、两数之和 2、两数相加

力扣刷题笔记day1 1,两数之和 题意 给定一个整数数组 nums 和一个整数目标值 target,请你在该数组中找出 和为目标值 target 的那 两个 整数,并返回它们的数组下标。 你可以假设每种输入只会对应一个答案。但是,数组中同一个元…

C++ · 入门 · 04 | 引用

啊我摔倒了..有没有人扶我起来学习.... 👱个人主页:《CGod的个人主页》\color{Darkorange}{《CGod的个人主页》}《CGod的个人主页》交个朋友叭~ 💒个人社区:《编程成神技术交流社区》\color{Darkorange}{《编程成神技术交流社区》…

STM32MP157驱动开发——Linux WIFI驱动

STM32MP157驱动开发——Linux WIFI驱动一、简介二、驱动开发1.wifi驱动添加与编译2.配置 USB 支持设备1)配置 USB 支持设备2)配置支持的 WIFI 设备3)配置支持 IEEE 802.114)使能 STAGING 配置3.设备树配置4.编译 wifi 驱动1&#…

05SpringCloudAlibaba负载均衡服务调用-Ribbon

目录 推荐与004SpringCloud-Ribbon_gh_xiaohe的博客-CSDN博客 对比观看 Ribbon概述 Ribbon官网https://github.com/Netflix/ribbon/wiki/Getting-Started Ribbon是什么 Ribbon也进入维护模式 Ribbon能干什么 LB(负载均衡) 一句话:…

冲击港交所:百果园书写水果连锁运营默示录

卖水果是一门古老的生意,但是长期以来并不受资本重视。一是因为产品口味难以标准化、鲜度要求高、流通环节易损耗、质量控制难度大。二是因为交易主体多,进出壁垒小,经济学中往往将其定义为完全竞争市场,难以出现龙头企业和超额利…

AI与艺术——图像生成模型是否能挑战人类艺术?

在2018年末的佳士得纽约拍卖场上,一件名为《爱德蒙贝拉米肖像》拍出了43.25万美元的价格,从绘画艺术风格来看,这是一幅有着很明显的印象派主义痕迹的作品。 印象派是19世纪中叶在法国兴起的一种艺术运动。印象派艺术家们拒绝了艺术(“美术”…

Webpack中的文件指纹

1. 什么是文件指纹? 文件指纹就是打包后输出的文件名的后缀,主要用来对修改后的文件做版本区分。 2. 文件指纹有哪几种? 1. Hash:和整个项目的构建相关,只要项目文件有修改,整个项目构建的 hash 值就会更…

CSRF与XSS攻防知识点总结

本章节将用于详细总结记录,跨站脚本攻击XSS(cross site script)与 跨站请求伪造CSRF(cross site request forgery)这两种常见的浏览器安全的攻防手段。本章节会介绍两种攻击的概念,以及相关手段有哪些&…

常见的电动两轮车 BMS 架构

1、摘要 近年来,随着新国标的施行,以及平衡车,滑板车,共享电单车等新应用场景的出现,促使电动两轮车市场迎来了新的发展热潮。 锂电池因为具有能量密度高,循环次数多等优点而逐渐替代铅酸电池&#xff0c…

Spire.XLS for Java 12.12.4 2022-12-30 Version

Spire.XLS for Java 12.12.4 Spire.XLS for Java是一个专业的 Java Excel API,Ω578867473使开发人员无需使用 Microsoft Office 或 Microsoft Excel即可创建、管理、操作、转换和打印 Excel工作表。 Spire.XLS for Java 支持旧的 Excel 97-2003 格式(.…

Java中main函数里的String[] args详解

1)概念 在开始学习 Java 时都会被要求记住主方法(main)的写法,就像以下: public static void main(String[] args) { };public static void main(String args[]) { }; 这里做如下说明&#xff…

什么是 A/B 实验,为什么要开 A/B 实验?

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群 1、什么是 A/B 实验 A/B 实验也被称为 A/B 测试,实验的基本思路是在线上流量中取出一小部分(较低风险),完全随机地分…

【机器学习】minHash最小哈希原理及其应用

目录1 前言2 哈希函数的定义3 miniHash函数4 miniHash的例子5 miniHash数学原理6 miniHash的应用7 参考文献1 前言 在数据结构中学过哈希概念以及哈希在内存中的应用,在实际的应用问题中哈希技术也应用十分广泛如在推荐系统以及图神经网络技术中,所以在此…

Java多线程之死锁问题,wait和notify

文章目录一. synchronnized 的特性1. 互斥性2. 可重入性二. 死锁问题1. 什么是死锁2. 死锁的四个必要条件3. 常见的死锁场景及解决3.1 不可重入造成的死锁3.2 循环等待的场景哲学家就餐问题(多个线程多把锁)两个线程两把锁三. Object类中提供线程等待的方法1. 常用方法2. wait和…

剑指offer----C语言版----第八天

目录 1. 矩阵中的路径 1.1 题目描述 1.2 基础知识 1.3 思路分析 1.4 小试牛刀 1. 矩阵中的路径 原题链接: 剑指 Offer 12. 矩阵中的路径 - 力扣(LeetCode)https://leetcode.cn/problems/ju-zhen-zhong-de-lu-jing-lcof/submissions/ 1.1 题…

c++11 标准模板(STL)(std::deque)(七)

定义于头文件 <deque> std::deque 修改器 清除内容 std::deque<T,Allocator>::clear void clear(); (C11 前) void clear() noexcept; (C11 起)从容器擦除所有元素。此调用后 size() 返回零。 非法化任何指代所含元素的引用、指针或迭代器。任何尾后迭代器亦被…

静态主机清单

自定义环境 1.操作环境 需要保准三台主机能够互相通信。设置同一种网络模式&#xff08;nat&#xff09;。 2.配置IP地址 server---192.168.90.134 node1---192.168.90.135 node2---192.168.90.133 3.修改主机名 hostnamectl set-hostname server.exmaple.com hostnamec…

【安全硬件】Chap.3 如何插入一个硬件木马到芯片的组合逻辑电路的漏洞里?不影响正常电路的功能的情况下进行硬件的逻辑加密

【安全硬件】Chap.3 如何插入一个硬件木马到芯片的组合逻辑电路的漏洞里&#xff1f;如何进行硬件的逻辑加密在不影响正常电路的功能的情况下1. 组合逻辑电路的漏洞组合逻辑电路中的硬件木马—举例Fault injection attacks士兵巡逻预案系统解决方法——硬件的逻辑加密&#xff…