PrimeKG:为精准医学分析设计的多模态知识图谱

news2024/11/26 17:27:52

PrimeKG:为精准医学分析设计的多模态知识图谱

    • PrimeKG简介
    • 数据资源和覆盖范围
    • 构建方法和技术细节
      • PrimeKG多模态知识图谱的概览
      • 构建PrimeKG的过程
      • PrimeKG 数据
    • 多模态特性和临床应用
    • PrimeKG 设计逻辑

 


论文:https://www.nature.com/articles/s41597-023-01960-3

 

PrimeKG简介

PrimeKG,一个面向精准医学的知识图谱,它提供了疾病的整体视图。

PrimeKG整合了20个高质量资源,以4050249种关系描述了17080种疾病,这些关系代表了10个主要的生物学尺度,包括疾病相关的蛋白质扰动、生物学过程和途径、解剖学和表型尺度,以及所有已批准和试验性药物及其治疗作用。

他们将PrimeKG的图形结构与药物和疾病临床指南的文本描述相结合,以实现多模式分析。

与其他知识图谱不同的是,PrimeKG特别强调了包括药物的适应症、禁忌症和非标签用途等通常缺失的药物-疾病关系。

数据资源和覆盖范围

PrimeKG的构建基于包括Bgee基因表达知识库、DisGeNET基因-疾病关联数据库、DrugBank药物数据库在内的20种主要数据资源。

这些资源提供了包括蛋白质、基因、药物、疾病、解剖学结构和生物过程等广泛的生物医学实体数据,确保了知识图谱的丰富性和多样性。

构建方法和技术细节

在构建PrimeKG过程中,我们采用了一系列技术步骤来标准化和整合各种数据资源。

这包括选择适合每种节点的本体、协调数据集到统一格式,并解决不同数据源之间的重叠问题。

此外,我们还对药物和疾病节点进行了临床特征的补充,包括药物的作用机理和疾病的临床描述,以增强图谱的实用性和信息的完整性。

PrimeKG多模态知识图谱的概览

在这里插入图片描述
在子图a中,显示了知识图谱中不同类型的节点及其相互之间的关系。

例如,药物、疾病、基因等节点之间是如何通过不同类型的边相连的。

子图b展示了所有疾病节点在PrimeKG中与其他节点类型的关系。

在子图c中,提供了一个具体案例,展示了自闭症(Autism)和利培酮(Risperidone)之间的路径,以及对应药物和疾病节点的文本描述,这显示了知识图谱的多模态特性。

 

构建PrimeKG的过程


子图a列出了为PrimeKG策划的20种主要数据资源,以及它们如何用于确定不同节点类型的唯一标识符。

子图b和c展示了如何确定节点类型,并从各个数据源中提取不同类型节点之间的关系。

最后,子图d描绘了整个PrimeKG,以及药物和疾病节点的临床特征是如何被集成的。

PrimeKG 数据


PrimeKG中不同类型节点的数量和所占的百分比,以及每种节点类型所对应的数据来源。

例如,疾病节点由来自多个数据源(如CTD、DisGeNET、Disease Ontology等)的信息组成。

多模态特性和临床应用

PrimeKG不仅是一个生物医学数据的集合,它还融合了临床意义深远的文本描述,使其成为一个真正多模态的知识图谱。

这一特性使PrimeKG能够在科研和临床应用中发挥重要作用,特别是通过自闭症谱系障碍的案例研究,我们验证了其在解释疾病临床表现方面的相关性和有效性。

PrimeKG 设计逻辑

问题1: 如何在单一平台上整合分散在不同数据源的生物医学信息?

解法: 数据集成和标准化

  • 子解法1: 选择适合每种节点类型的本体

    • 特征: 确保知识图谱中不同数据源的信息能够相互对应。
    • 例子: 使用MONDO本体统一疾病信息,因为它融合了多个疾病相关的本体,确保了数据的一致性。
  • 子解法2: 将数据格式化为标准化的格式并解决重叠问题

    • 特征: 使不同来源的数据能够兼容并减少重复。
    • 例子: 对药物-疾病关系中的数据进行重叠检查,确保每一种药物或疾病在图谱中只对应一个唯一的节点。
  • 子解法3: 构建一个包含所有关系的网络图

    • 特征: 显示不同生物医学实体之间的关联性。
    • 例子: 在知识图谱中,疾病节点被密集地连接到药物、基因、表型等其他节点类型,揭示了潜在的生物学机制。

 

问题2: 如何使知识图谱支持临床决策和科研?

解法: 加入多模态临床信息

  • 子解法1: 融合文本描述和数值数据

    • 特征: 提供对药物和疾病更全面的理解。
    • 例子: 药物节点不仅包含作用机理的描述,还有分子重量等量化信息,这有助于研究药物动力学和药效学。
  • 子解法2: 更新和维护知识图谱

    • 特征: 确保知识图谱反映最新的科研发现和临床指南。
    • 例子: 通过定期整合新的临床试验数据和治疗指南,PrimeKG能够支持最新的精准医疗研究。

这样的解法组合不仅解决了数据分散和标准化的问题,还确保了知识图谱的实用性和时效性,使其能够适应快速发展的医学领域的需求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1590914.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

盘点“整容”成功的国漫男主,唐三萧炎谁才是顶级颜值?

国漫男主千千万,可不是每一位都能做到颜值与实力并存!有些男性角色的建模起初受限于技术和审美等原因,呈现出的效果并不理想,好在越来越多的作品开始尝试给角色模型更新换代,本期为您盘点那些成功更换模型的国漫男主&a…

Acrobat Pro DC 2023 for mac直装激活版 pdf编辑处理工具

Acrobat Pro DC 2023 for Mac是一款功能强大的PDF编辑器,为用户提供了全面且高效的PDF处理体验。 软件下载:Acrobat Pro DC 2023 for mac直装激活版下载 首先,它支持用户从现有文档创建PDF,或者将其他文件格式如图片、网页等轻松转…

【fastapi】搭建第一个fastapi后端项目

本篇文章介绍一下fastapi后端项目的搭建。其实没有什么好说的,按照官方教程来即可:https://fastapi.tiangolo.com/zh/ 安装依赖 这也是我觉得python项目的槽点之一。所有依赖都安装在本地,一旦在别人电脑上编写项目就又要安装一遍。很扯淡。…

JavaSEhomework2

题目,上图!! 上代码 import java.util.Scanner; public class homework01 {public static void main(String[] args) {Scanner input new Scanner(System.in);System.out.print("Enter the number of values: ");int num input.…

MySQL 表管理

目录 建库 语法: 库名命名规则: 相关命令: 建表 语法: 相关命令: 修改表 语法: 常用操作命令 复制表 数据类型 MySQL的10种常用数据类型: 数据的导入和导出 导入: 格…

CSS特效---HTML+CSS实现3D旋转卡片

1、演示 2、一切尽在代码中 <!DOCTYPE html> <html lang"en"><head><meta charset"UTF-8" /><meta name"viewport" content"widthdevice-width, initial-scale1.0" /><title>Document</title&…

MongoDB爬虫:(某扑)实战

https://bbs.hupu.com/bxj网页地址: https://bbs.hupu.com/bxj 然后我们在网页上定义帖子名称、帖子链接、创建时间、回复数、最后回复用户...... 除此之外,我们发现虎扑步行街最多显示的页数(20): 、 当我们打开第3页的时候,网页的URL的地址变为了:https://bbs.hupu.…

迭代器模式:统一访问集合元素的优雅方式

在面向对象的软件开发中&#xff0c;迭代器模式是一种行为型设计模式&#xff0c;它提供了一种方法来顺序访问一个聚合对象中的各个元素&#xff0c;而又无需暴露该对象的内部表示。这种模式是集合处理特别是遍历集合的核心机制。本文将详细介绍迭代器模式的定义、实现、应用场…

RISC-V技术变革:一颗芯片,CPU与GPU合二为一

一颗万能的RISC-V芯片: 将CPU和GPU整合到一个核中 X-Silicon 推出创新的 RISC-V 芯片架构,将 CPU、矢量功能和 GPU 加速无缝集成。这种开源混合芯片专为多功能工作负载而设计,包括人工智能,旨在通过高效处理提升性能。 革命性的 CPU/GPU 混合处理器全新的 RISC-V CPU/GPU 混…

单片机之蓝牙通信

目录 蓝牙介绍 HC05蓝牙模块 HC05参数 HC05引脚 各个引脚功能 HC05模块的作用 工作模式 配置模式 引脚接线 用AT指令进行配置 常用的AT指令 正常模式 测试步骤 烧录的程序 前言&#xff1a; keil文件 蓝牙介绍 蓝牙&#xff1a;Bluetooth&#xff0c;其是低成…

Day:007(1) | Python爬虫:高效数据抓取的编程技术(scrapy框架使用)

Scrapy的介绍 Scrapy 是一个用于抓取网站和提取结构化数据的应用程序框架&#xff0c;可用于各种有用的应用程序&#xff0c;如数据挖掘、信息处理或历史存档。 尽管 Scrapy 最初是为网络抓取而设计的&#xff0c;但它也可用于使用API提取数据或用作通用网络爬虫。 Scrapy的优势…

20240409在全志H3平台的Nano Pi NEO CORE开发板上运行Ubuntu Core16.04时跑通4G模块EC200A-CN【PPP模式】

20240409在全志H3平台的Nano Pi NEO CORE开发板上运行Ubuntu Core16.04时跑通4G模块EC200A-CN【PPP模式】 2024/4/9 14:25 【不建议使用ppp模式&#xff0c;功耗大&#xff0c;貌似更过分的&#xff01;网速还低&#xff01;】 【唯一的优点&#xff1a;ppp模式下是通过脚本配置…

【深度学习实战(3)】打印自己模型的推理帧率

一、FPS(每秒传输帧数-Frames Per Second) FPS就是目标网络每秒可以处理&#xff08;检测&#xff09;多少帧(多少张图片),FPS简单来理解就是图像的刷新频率&#xff0c;也就是每秒多少帧,假设目标检测网络处理1帧要0.02s&#xff0c;此时FPS就是1/0.0250 其中Processing tim…

【示例】MySQL-MySQL中常见的锁

前言 本文主要讲述MySQL中常见的锁。 总结 | 各类别锁的名字 锁级别锁名字解释全局锁read lock全局锁只有可读锁表级锁 - 表锁read lock 表共享读锁write lock 表独占写锁表级锁 - 元数据锁&#xff08;meta data lock&#xff0c;MDL&#xff09;SHARED_READ_ONLYSHARED_NO…

突破像素限制,尽显照片细腻之美——Topaz Gigapixel AI for Mac/Win

在这个数字化的时代&#xff0c;我们都热爱用照片记录生活中的美好瞬间。然而&#xff0c;有时候我们会发现&#xff0c;由于各种原因&#xff0c;照片的像素可能无法满足我们的需求。这时候&#xff0c;Topaz Gigapixel AI for Mac/Win 这款强大的照片放大工具应运而生。 Top…

09-ARM开发板的HelloWorld

在ARM开发板上运行x86_64平台程序 前面在Ubuntu系统编译生成了X86_64平台的HelloWorld程序&#xff0c;通过NFS服务器&#xff0c;尝试在开发板上直接运行。 如图所示&#xff0c;程序无法正常运行&#xff0c;终端提示ARM开发板在执行x86架构&#xff08;Intel或AMD&#xff…

童年女神大盘点:谁是第一个让你心动的动漫女神?

每当提起我们的童年记忆&#xff0c;总有一抹亮丽的色彩来自于那些国产动漫中的女性角色&#xff0c;她们以其独特的魅力、鲜明的性格和卓越的才智&#xff0c;深深地烙印在了我们的心底&#xff0c;成为了一代人的集体回忆。今天&#xff0c;让我们一同回首&#xff0c;盘点那…

centos 7 sshd服务无法自动随机启动

centos 7 sshd 服务无法伴随主机启动而启动&#xff0c;而使用systemctl start sshd可以启动&#xff0c;很奇怪。 后来使用Kimi查询&#xff0c;有提示“检查系统启动服务的顺序和状态” systemctl list-dependencies <service>确保所有依赖服务都已正常启动。 查看本…

Flutter第九弹 构建列表元素间距

目标&#xff1a; 1&#xff09;Flutter Widget组件之间间距怎么表示&#xff1f; 2&#xff09;列表怎么定义子项之间间距&#xff1f; 一、间距的表示组件 列表组件的间距一般采用固定间距&#xff0c;间距占据可见的空间。 已经使用的表示间距的组件 Spacer&#xff1a…

2024年妈妈杯数学建模C题思路分析-物流网络分拣中心货量预测及人员排班

# 1 赛题 C 题 物流网络分拣中心货量预测及人员排班 电商物流网络在订单履约中由多个环节组成&#xff0c;图 ’ 是一个简化的物流 网络示意图。其中&#xff0c;分拣中心作为网络的中间环节&#xff0c;需要将包裹按照不同 流向进行分拣并发往下一个场地&#xff0c;最终使包裹…