生命科学领域 - FAIR原则和如果使数据FAIR化

news2025/1/16 8:07:45

2016年,《Scientific Data》发表了《科学数据管理和监督的FAIR指导原则》(FAIR Guiding Principles for scientific data management and stewardship)。文章旨在提供指导方针,以提高数字资产的可发现性、可访问性、互操作性和重用性。这些原则强调机器可操作性(即计算系统在没有或最少人工干预的情况下查找、访问、互操作和重用数据的能力),因为随着数据的数量、复杂性和创建速度的增加,人类越来越依赖计算支持来处理数据。

 

FAIR原则

可发现(Findable)

 F1 数据(元数据)被分配全球唯一且持久的标识符。

 F2 使用丰富的元数据描述数据。

 F3元数据清楚明确地包含所描述的数据的标识符。

 F4数据(元数据)在搜索应用服务中注册或索引。

可访问(Accessible)

 A1 数据(元数据)可以使用标准化通信协议,通过其标识符进行检索。

  •  A1.1 该协议是开放的、免费的,并且可普遍实施;

  •  A1.2 协议允许在必要时进行身份验证和授权过程;

 A2 即使数据不再可用,也可以访问其元数据。

可互操作性(Interoperable)

 I1 数据(元数据)使用正式的、可访问的、可共享和广泛适用的语言表示。

 I2 数据(元数据)使用遵循FAIR原则的词汇表。

 I3 数据(元数据)包括对其他数据(元数据)的合法引用。

可重用(Reusable)

 R1 数据(元数据)用多个准确且相关的属性进行充分描述。

  • R1.1 发布的数据(元数据)包含清晰且可访问的数据使用协议;

  • R1.2 数据(元数据)包含详细的出处信息;

  • R1.3 数据(元数据)符合领域相关标准;

如何使数据FAIR化

数据FAIR化流程可分7

1)确定目标

2)分析数据

3)分析元数据

4)定义语义数据和元数据模型

5)链接数据和元数据

6)托管FAIR数据

7)评估FAIR数据

7个步骤又可分为FAIR化过程前(步骤123),过程中(步骤456)和过程后(步骤7)三个阶段。

步骤确定目标(FAIR化过程前阶段)

FAIR化目标。首先,我们要能获取数据。如果要获取的数据涉及隐私和敏感问题,可使用匿名数据。数据FAIR化的目标可能是需要满足出版方、项目资助方或相关权益方的要求,或者是要增加多源数据的使用效率。我们建议先根据已有资源的条件(比如时间)确定部分数据元素的FAIR化目标。FAIR化目标是否实现依赖于:1)学科领域知识和数据建模知识;2) 可重用的FAIR解决方案;3)具有FAIR化特征、适合处理数据集的工具。


分析数据(FAIR化过程前阶段)

个步骤包括1)调查数据可获取的形式,检查数据表达形式和数据元素(数据的语义)的含义是否清楚且无歧义;2)检查数据是否包含FAIR特征,比如具有永久唯一标识符。

分析元数据(FAIR化过程前阶段)

数据是使数据可发现,可获取和可重用的关键。步骤3的工作包括1)调查是否具备元数据,如果没有元数据要明确需要采集什么元数据(每个学科领域的要求不同);2)检查元数据是否具有FAIR特征,比如元数据是否丰富,是否具有溯源描述信息,以及是否具有提高元数据质量所要考虑的细节,例如使用许可、版权、数据贡献声明以及使用条件和数据获取说明。

步骤定义语义数据和元数据模型(FAIR化过程中阶段)

义模型指的是下一个步骤中把数据和元数据转换成机器可读形式的模板。生成语义模型通常是数据FAIR化过程中最费时的一项工作。需要首先检查下数据是否已有语义模型,元数据是否可重用。新建一个语义模型需要三个步骤:1)创建概念模型;2)搜索本体词汇,3)创建语义模型。这个过程既需要研究领域的知识,也需要数据语义建模的知识。

步骤链接数据和元数据(FAIR化过程中阶段)

接数据和元数据的方法随着数据使用案例不同而不同。关键之处在于对数据和元数据的描述要求是机器可读的。数据的语义模型应该和数据以及元数据关联,这样语义模型将来才可能被重用,具有互操作使用的功能。这个阶段可使用的工具包括the FAIRifier,它可帮助将数据转为机器可读的形式,并且通过追踪中间步骤而使这个转换过程可重用。其他类似的工具还有Karma , Rightfield OntoMaton。将元数据转换为机器可读的形式的工具有the FAIR Metadata Editor , CEDAR , 以及Bioschemas Generator。推荐两种方法利用元数据增加资源被发现的可能性。第一,推荐将数据资源在本领域相关的资源注册中心或索引机构登记和索引,最好是符合FAIR原则的注册中心或索引机构。第二,推荐使用Schema.org 的标记(或者本领域的标记体系例如Bioschemas)使得数据资源将来可以被通用目的的搜索引擎例如Google检索到。

步骤托管FAIR数据(FAIR化过程中阶段

在这个步骤,数据处于可被消费的状态。人或者机器通过不同的界面,例如API, RDF 三元组存储,或者网页应用程序调用数据。在线展示FAIR资源的工具有很多,例如FAIR Data Point (FDP) 软件。该软件针对人类用户的界面提供了包括元数据层链接的简单网页,供机器处理的界面上提供可机读的RDF文件。

步骤评估FAIR数据(FAIR化过程后阶段)

步骤包括的工作:1)检查是否在步骤1中描述的目标已经实现,如果没有实现,要重新检查工作流步骤;2)检查数据和元数据的FAIR状态和步骤23中的FAIR状态进行比较。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1225445.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

微信小程序会议OA首页-开发说明创建项目关于flex布局关于尺寸单位(rpx)关于WXS轮播图会议信息

目录 1. 创建项目 2. 关于flex布局 3. 关于尺寸单位(rpx) 4. 关于WXS 4. 轮播图 5. 会议信息 1. 创建项目 基于微信原生开发工具,稳定版 Stable Build (1.06.22010310) 创建项目前,请确定有小程序测试账号 使用向导创建一个…

ClickHouse建表优化

1. 数据类型 1.1 时间字段的类型 建表时能用数值型或日期时间型表示的字段就不要用字符串,全String类型在以Hive为中心的数仓建设中常见,但ClickHouse环境不应受此影响。 虽然ClickHouse底层将DateTime存储为时间戳Long类型,但不建议存储Long…

通过bat脚本控制Oracle服务启动停止

1、将Oracle服务全部设置为手动启动 初始安装Oracle之后服务启动状态: 2、服务功能介绍 3、构建服务启动/停止bat脚本 注意:编码选择ANSI(如果编码不是ANSI运行脚本会显示乱码) echo off :main cls echo 当前Oracle服务状态: for /f &quo…

Java中如何通过路径表达式找值:XPath和JsonPath以及SpEL详解及对比

大家好,我是G探险者。 我们编程时,在前后端数据交互和传输过程中,往往需要对报文中的某个字段或者某个标签的值进行解析读取,报文通常是以json或者xml作为数据交换格式,而json和xml这两种格式的报文结构都是具备一定的…

关于Android音效播放,【备忘】

主要还是希望开箱即用。所以才有了这篇&#xff0c;也是备忘。 以下代码适合Android5.0版本以后 private SoundPool soundPool;//特效播放private Map<String,Integer> soundPoolMap;// Builder buildernew SoundPool.Builder();builder.setMaxStreams(4);///最大…

springboot引入第三方jar包放到项目目录中,添加web.xml

参考博客&#xff1a;https://www.cnblogs.com/mask-xiexie/p/16086612.html https://zhuanlan.zhihu.com/p/587605618 1、在resources目录下新建lib文件夹&#xff0c;将jar包放到lib文件夹中 2、修改pom.xml文件 <dependency><groupId>com.lanren312</grou…

(Matalb回归预测)PSO-BP粒子群算法优化BP神经网络的多维回归预测

目录 一、程序及算法内容介绍&#xff1a; 基本内容&#xff1a; 亮点与优势&#xff1a; 二、实际运行效果&#xff1a; 三、部分程序&#xff1a; 四、完整程序数据说明文档下载&#xff1a; 一、程序及算法内容介绍&#xff1a; 基本内容&#xff1a; 本代码基于Matalb…

3D全景视角,足不出户感知真实场景的魅力

近年来&#xff0c;随着科技的快速发展&#xff0c;普通的平面静态视角已经无法满足我们了&#xff0c;不管是视角框架的限制还是片面的环境展示&#xff0c;都不足以让我们深入了解场景环境。随着VR全景技术的日益成熟&#xff0c;3D全景技术的出现为我们提供了全新的视觉体验…

Thrift协议详解

前言特点高效性的体现可拓展性的体现 应用场景示例拓展其他常用协议接口描述语言&#xff08;IDL&#xff09;TBinaryProtocolTCompactProtocolTDebugProtocolTDenseProtocolTJSONProtocol 前言 Thrift协议是一种接口描述语言和二进制通讯协议&#xff0c;它被用来定义和创建跨…

基于传统Session的登录

前言&#xff1a; 本人的一些简历上要回答的点。所以再此整理。 亮点&#xff1a; 使用Filter过滤器进行未登录状态自动跳转到登录页面的拦截&#xff0c;实现统一的权限管理。 1 登陆功能 1.1实体类和结果类 前端页面 约定 res.data.code为1时是登录成功。 数据库的empl…

wangEditor富文本编辑器使用

一、官网 开源 Web 富文本编辑器&#xff0c;开箱即用&#xff0c;配置简单 二、下载安装 npm install --save wangeditor/editor-for-vue 三、在vue中使用 3.1、抽离组件editor.vue 在工程的components目录下新建组件editor <template><div><Toolbar:edi…

若依框架数据源切换为pg库

一 切换数据源 在ruoyi-admin项目里引入pg数据库驱动 <dependency><groupId>org.postgresql</groupId><artifactId>postgresql</artifactId><version>42.2.18</version> </dependency>修改配置文件里的数据源为pg spring:d…

神经网络反向传播的数学原理

如果能二秒内在脑袋里解出下面的问题&#xff0c;本文便结束了。 已知&#xff1a;&#xff0c;其中。 求&#xff1a;。 到这里&#xff0c;请耐心看完下面的公式推导&#xff0c;无需长久心里建设。 首先&#xff0c;反向传播的数学原理是“求导的链式法则” : 设f和g为x…

多因素方差分析(Multi-way Analysis of Variance) R实现

1, data0507 flower 是某种植物在两个海拔和两个气温下的开花高度&#xff0c;采用合适 的统计方法&#xff0c;检验该种植物的开花高度在不同的海拔之间和不同的气温之间有无差异&#xff1f;如果有差异&#xff0c;具体如何差异的&#xff1f;&#xff08;说明依据、结论等关…

春秋云境靶场CVE-2022-28512漏洞复现(sql手工注入)

文章目录 前言一、CVE-2022-28512靶场简述二、找注入点三、CVE-2022-28512漏洞复现1、判断注入点2、爆显位个数3、爆显位位置4 、爆数据库名5、爆数据库表名6、爆数据库列名7、爆数据库数据 总结 前言 此文章只用于学习和反思巩固sql注入知识&#xff0c;禁止用于做非法攻击。…

Learning Perception Module

参考文章&#xff1a;自动驾驶开发者说|框架|如何单独运行apollo相机感知模块&#xff1f; - 知乎引言文章主要尝试了apollo框架下&#xff0c;视觉感知模块的单独运行&#xff0c;并利用离线的数据包进行检测实时展示结果。过程相对来说比较顺利。在加上已经用VScode搭建的单步…

springboot321基于java的校园服务平台设计与开发

交流学习&#xff1a; 更多项目&#xff1a; 全网最全的Java成品项目列表 https://docs.qq.com/doc/DUXdsVlhIdVlsemdX 演示 项目功能演示&#xff1a; ————————————————

解决:ERROR: No matching distribution found for PIL

解决&#xff1a;ERROR: No matching distribution found for PIL 背景 在搭建之前的代码环境时&#xff0c;报错&#xff1a; ERROR: Could not find a wersion that satisfies the requirement PIL&#xff08;from versions: none&#xff09; ERROR: No matching distribu…

机器视觉系统选型-定光照强度

同一个外形结构的光源&#xff0c;光照强度受如下影响&#xff1a; 单颗灯珠的亮度灯珠排列的数量和密度漫射板/防护板的材质&#xff08;透明、半透明、全漫射&#xff09; 在合理范围内提升光照强度&#xff0c;可降低对相机曝光时长的要求 外形结构尺寸相同的两款光源&am…

基于SSM的古董拍卖系统

基于SSM的古董拍卖系统的设计与实现~ 开发语言&#xff1a;Java数据库&#xff1a;MySQL技术&#xff1a;SpringMyBatisSpringMVC工具&#xff1a;IDEA/Ecilpse、Navicat、Maven 系统展示 主页 拍卖界面 管理员界面 摘要 古董拍卖系统是一个基于SSM框架&#xff08;Spring …