这个发表在 Nature Genetics的水稻全基因组关联数据库 RHRD,很赞!!!

news2025/2/24 15:44:34

历经半个世纪的发展,杂交水稻育种取得了巨大的成就,培育出了大量的高产、优质、适应环境变化的品系。本数据库是一个综合性的杂交水稻数据库(http://ricehybridresource.cemps.ac.cn/#/),涵盖了从1976年至2017年间发布的486个商业杂交水稻品种信息、基因组变异、表型与全基因组关联数据信息,共计3,325 个样品,5 百万+变异位点和 17 套表型数据,为现代杂交水稻育种提供了宝贵的资源。

30495b448375be41026836e242429d68.png

Figure 2.1: 首页设计采用平面式布局,网站Logo + 题目 + 菜单导航、特色轮播图 + 数据库描述、色块统计信息(点击可跳转对应的数据浏览页面)

2.1 数据库的特色功能

2.1.1 品种关键信息及关键表型数据可视化 (点击导航的Samples)

样品浏览页面按照不同的生态型(Hybrid ecotypes)、家系(Pedigree of hybrids)和繁育期(Breeding periods of hybrid)对所有品系的3,325个样本进行统计展示。饼图、表格联动展示,且均具备数据筛选的功能。表格下面交互式箱线图默认展示当前选择的所有样本的表型(17种)数据。

d918e8d55f783c0d791edb8e1fa09d35.png

Figure 2.2: 普通表格太枯燥,这里对表格的关键信息用饼图展示,一目了然样品的关键属性信息;每个属性有多少类,每类样品相对多少,增加了页面的丰富性,且方便筛选某一类样品。表格可筛选显示多少列,适应小屏幕展示。为了方便用户理解数据,对于缩写部分的含义在表头增加了信息提示(问号符号)。表格采用分页表格,按需向后台访问数据,单次加载数据少,加快了加载速度,且可全局搜索,方便查看特定类型样品。

6846305e80402c37de57bdb275e088da.png

Figure 2.3: 交互式箱线图展示单个表型信息,可通过下拉选择切换表型。箱线图提供 padding 调整功能,以获得合适大小的可视化结果和防止文字重叠或溢出图片。

交互式筛选。例如,在饼图中点击Hybrid,则第二个和第三个饼图仅展示Hybrid类群的数据,数据表中仅列出属于Hybrid2839个样本,同时boxplot只展示Hybrid的表型(如抽穗期)数据,通过下拉框选择不同的表型,进一步查看选定的表型的统计数据分布。

972f0a66d49bda6034dc996f2cc10000.png

Figure 2.4: 交互式筛选后的相关数据结果展示。

2.1.2 变异信息查询 (点击导航的Variant search)

2.1.2.1 输入查询条件

查询条件包括数据集(dataset)、类群(population)、染色体(chromosome)起始位置 或 基因ID。

Dataset分为三类All、Indel和SNP,如下图所示,用户可根据需求选择,仅支持单选;

9c17ae6382845e5edb6710b0d0672631.png

Figure 2.5: 简单的用户自定义选项进行数据筛选。该工具的复杂版本在我们开发的另一个网站[https://www.cmnpd.org/]有展示,支持逻辑组合筛选。

Population分为7个,如下图所示,用户可以根据需求选择,支持多个population同时查询;

1cbae3ede0c4cb75c5a17c94a5648024.png

Figure 2.6: 下拉集成搜索功能,方便快速定位样品。且提供 Select All快速多选。对于下拉项很多(超过 1000 的情况),支持分页下拉。传统的下拉下拉项有限,而生物网站样品多、基因多,下拉项会很多,全部加载会直接卡死页面,这里选择优化后的集成搜索的分页下拉形式,返回部分数据。但集成的搜索功能可以全局搜索,便于获取一类下拉值供用户选择。

染色体及起始位置,如下图所示,用户可输入感兴趣的染色体编号及起始位置;染色体编号可通过下拉选择(单选);

c8f21bd88e597f73f72c15aa1be99e2c.png

Figure 2.7: 下拉集成搜索功能,方便快速定位染色体编号。

基因,用户可通过下拉选择目标基因,支持选择多个基因;

0e90235eb5163ef3b5bd45cfd7ef621d.png

Figure 2.8: 下拉集成搜索功能,方便快速定位基因。对于下拉项很多(超过 1000 的情况),支持分页下拉。传统的下拉下拉项有限,而生物网站样品多、基因多,下拉项会很多,全部加载会直接卡死页面,这里选择优化后的集成搜索的分页下拉形式,返回部分数据。但集成的搜索功能可以全局搜索,便于获取一类下拉值供用户选择。

各项查询条件填写完成后,点击Submit

2.1.2.2 查询结果

以查询条件:Dataset=ALL、Population=Hybrid_indica*indicaRoster、Position=chr05: 5450000-5459999,结果如下:

第一部分:饼图展示查询的基因组区域变异的注释信息统计即当前搜索出的变异对基因组功能的影响(分为High、Low、Moderate、Modifier等)。该搜索下的编译绝大多数(注意不是全部; 如果全部都是 Modifier 类型,后面只会跟着一个饼图)是 Modifier 类型,所以看上去都是绿色。后面是对 3 种功能影响类型的细分,鼠标悬浮可查看具体信息。

6b162b011b691faaf2669353c6ab30be.png

Figure 2.9: 交互式饼图展示筛选出的突变位点的功能影响。饼图为 1 拖 n 的联动模式,第一个饼图为总览,第 2-4 个饼图为第一个饼图各个分类的细节展示,其数目取决于第一个饼图有多少个分类。

第二部分:展示每个基因组位点的变异信息,每一行是一个样品,每一列是一个位点,绿色代表SNP/Indel。表格可以左右拖动展示所有位点。

4aba1b96df26f35526c6abe5d6e5447a.png

Figure 2.10: 变异展示表格采用特定的可变表格列宽(前 4 列)+ 固定表格列宽(后面所有列)的形式最大限度的利用网页空间呈现更多和更紧凑的突变信息。表格中未显示全的 indel 信息,鼠标悬浮可显示全部信息。

第三部分:展示不同population在相同基因组位点的基因频率。以堆积柱状图的形式展示,可以清楚的看到不同population的差异。例如在chr05:5454075位点,Roster种群中碱基C的比例为83%Hybrid_indica*indica种群中碱基C65%。注:堆积柱状图可通过下方的标尺拖动缩放或移动展示特定的区域。

cdb1b4347975c86908e7d150ef280bb5.png

Figure 2.11: 堆积柱状图展示基因型。该图存在 3 点特色,1. 显示位点很多时增加拖动定位功能,方便查看关键位点;2. 部分位点碱基组成复杂,导致图例很长,这里图例上移,展示清晰明了;3. 图例分组:同时展示多个群体的基因型。图的右上角依然存在我们的特色标记:结果下载和 padding 调整。我们开发擅长的是可视化效果。

第四部分:单倍型分析。用户可通过多选框,选择用于分析单倍型的基因组位点,指定缺失率(missing rate),提交后可以获得单倍型信息,如饼图与表格所展示的内容。饼图展示了不同单倍型的分布,表格中展示了每种单倍型的major allele(红色标记)。

6efb3837f87d487f248c3c4cb9c2f3d2.png

Figure 2.12: 多位点框选是这部分的一个特色功能,如何快速选择多个位点进行单体型分析。这里采用组合框选的形式,用户可以拖动矩形框选择关注的一个多个区域。单体型表格采用特定的可变表格列宽(第 1 列)+ 固定表格列宽(后面所有列)的形式最大限度的利用网页空间呈现更多和更紧凑的突变信息。表格中未显示全的 indel 信息,鼠标悬浮可显示全部信息。

2.1.3 表型与基因组关联分析(Phenotype & GWAS)

2.1.3.1 表型数据查询

所有17个表型被分成4个大类,如下图所示,用户根据需求选择表型组及特定的表型,进而查看相应的数据及GWAS结果。

29f1b2617e654c724779ba78e61e20fd.png

Figure 2.13: 下拉集成搜索功能,方便快速选择表型组及对应的表型,更精准的查询数据库中的表型数据。

2.1.3.2 查询结果

表格展示了所选表型的数据及GWAS分析结果,以Morphological characteristics中的Tiller Angle为例,共检索到3197个样本具备这个表型数据,GWAS分析显示,该表型与chr09的变异信息具有显著的相关性。

3ee753f020eeb1ec540c1fa7bfcd83e8.png

Figure 2.14: 交互式曼哈顿图展示 GWAS 结果。

2.1.4 数据库成果

该数据库为中国科学院分子植物科学卓越创新中心团队委托易汉博基因科技团队开发,于2023年9月7日发表在《Nature Genetics》,题为Structure and function of rice hybrid genomes reveal genetic basis and optimal performance of heterosis。

4a3705ac387561347efb533e4338ccbc.png

Figure 2.15: 在线发表论文。

4 篇 NAR | 生物大数据时代,如何做好数据管理和再利用,发IF10+的数据库文章?如果你也有数据库开发需求,欢迎联系!

往期精品(点击图片直达文字对应教程)

a26de43edb91ffc72c02e860652cd417.jpeg

b2a4b33dbc61408d6899ac4d780eb4f5.jpeg

93bb6cd73625aca1c4b3dae775c8423b.jpeg

b86499dbdbdbe23200789e301ffbb2bb.jpeg

3c387255a556049b4cedbc2385cf539c.jpeg

f9b340baadf18d3d2533d141bbe96736.jpeg

cd29c9d3983e614c92c31bf85461795c.jpeg

97fc16ff234268e9b88cceff0a972775.jpeg

3cb1ac1d73bf02490a1648b3deaab327.jpeg

6d1ee06a1494b76e9bbc3f8f39dcf94e.jpeg

e4e0bf5aa5153176e0102212ad31a94d.jpeg

aceb12621719fbbbb5b36822c80ca58d.jpeg

e457680dc913e8e7ae41831c66b5e692.png

29386d6c65950a1ac887a201999b656e.png

fd3e82e37ba905d16de36cc5b7818cd7.png

ea94a333f3c62e7ccf44c38b9a0c7ad6.png

ea8084b43596022d951d27b2f64f85fb.jpeg

ab39b40401244d28d26c412894bb0e06.jpeg

44214a85c8ba79234a3542adc995708a.jpeg

3dc372c5df2721067958b80bd10a0b02.jpeg

7813c2d79cfdb5c79da130b603a9315f.png

7e13ec783f915095a636c296dd6b4780.png

334049ba468f5c6b9daaa10f42f57dc4.jpeg

a456cd896bc0270bf8a3a91c11dc53e6.png

0c1da83bd4d4dcf1c48086448502541d.png

3448621eec1d1f29c6fadf735c53207e.jpeg

ff97b327b32983f4ea50e7bfe7afcbe5.png

2cc8b3abb21b7d290b9ad853e0114e1b.png

机器学习

e1748b00479ef9b84c86950bc641875d.png

c602c31eb8599844c42fa4ac22abbee4.jpeg

c40144ef5fc397990dc2a461dae2c718.jpeg

8b7770f4dea1423798394ff460f17b44.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/1027816.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【Unity】简单的深度虚化shader

【Unity】简单的深度虚化shader 实现效果 可以用于对地图场景边界的白模处理 实现方法 1.关键方法 UnityObjectToClipPos:将物体坐标转换为屏幕坐标 LinearEyeDepth:将屏幕坐标中的z值转换为实际的深度值 saturate:将值规范到0~1之间&am…

Java 消息策略的实现 - Kafak 是怎么设计的

这个也是开放讨论题,主要讨论下 Kafka 在消息中是如何进行实现的。 1_cCyPNzf95ygMFUgsrleHtw976506 21.4 KB 总结 这个题目的开发性太强了。 Kafka 可以用的地方非常多,我经历过的项目有 Kafka 用在消息处理策略上的。这个主要是 IoT 项目&#xff0c…

three.js中的3D模型分层显示(分类型显示);使用dat.gui控制three.js中的3D模型分层显示;dat.gui调用一次但是渲染了多个

效果如上,就是可以通过dat.gui控制3D模型中仅仅显示管线或者是仅仅显示除了管线之外的模型。 1.在模型导入的时候就按照类型(分层的类别标识) 区别开(我这里是按照是否是管线) 这里是new THREE.Object3D();必须的否则…

Python基础学习笔记3

深度学习实践 深度学习离不开编程 深度学习离不开数学分析(高等数学)、线性代数、概率论等知识,更离不开以编程为核心的动手实践。 Python编程语言 无论是在机器学习还是深度学习中,Python已经成为主导性的编程语言。而且&…

OJ练习第178题——收集树中金币

收集树中金币 力扣链接:2603. 收集树中金币 题目描述 给你一个 n 个节点的无向无根树,节点编号从 0 到 n - 1 。给你整数 n 和一个长度为 n - 1 的二维整数数组 edges ,其中 edges[i] [ai, bi] 表示树中节点 ai 和 bi 之间有一条边。再给…

计算机视觉与深度学习-全连接神经网络-训练过程-欠拟合、过拟合和Dropout- [北邮鲁鹏]

目录标题 机器学习的根本问题过拟合overfitting泛化能力差。应对过拟合最优方案次优方案调节模型大小约束模型权重,即权重正则化(常用的有L1、L2正则化)L1 正则化L2 正则化对异常值的敏感性随机失活(Dropout)随机失活的问题 欠拟合 机器学习的根本问题 机器学习的根…

【企业级SpringBoot单体项目模板】 —— 全局配置

😜作 者:是江迪呀✒️本文关键词:SpringBoot、模版、企业级☀️每日 一言:你坚持下来了,而别人坚持不下来,这就是你的资本。 文章目录 一、全局异常配置1.1 全局异常处理1.2 处理业务异常类1.3…

如何用ate自动测试设备对DC-DC电源模块负载调整率进行测试?

电源模块负载调整率测试是功能测试之一,是电源模块非常重要的一项指标,它的大小直接影响着电源模块的整体质量。因此使用ate自动测试设备对DC-DC电源模块负载调整率进行测试是制造生产过程中至关重要的一环。 电源模块负载调整率计算公式: 负…

1.测试 —— 答疑篇

什么是软件测试: 软件测试是不是就是找 bug ? 软件测试就是证明软件不存在错误的过程 软件测试就是为了证明程序能够正确运行 刚新买来一部手机,我们要干什么? 一场考试 , 做完一遍题目之后 , 进行一遍检查 , 就是在 "…

10个强大的 JavaScript 动画库、直接抄作业

动画,是吸引你客户注意的好方法之一。 在项目开发中,我们可以通过创造有趣的动画来为我们的项目增加视觉感与用户体验,同时,也为我们的网站增添了独特的美感,而且还提高了用户参与度并创造了令人难忘的第一印象。 因…

十几款IDEA开发必备的插件,新手必用

IDEA有很多优秀的插件,使用它们不仅大大增加了开发效率,也能给大家带来更好的coding体验。“工欲善其事必先利其器”,以下插件基本都可以通过 IDEA 自带的插件管理中心安装。 1、CodeGlance 拖动浏览代码更加方便,还有放大镜功能。…

C语言计算2的1024次方

C语言计算2的1024次方 迅雷有这么一道笔试题&#xff0c;编程计算2的1024次方。 所谓2的1024次方&#xff0c;就是有1024个2相乘&#xff0c;于是有些同学顺手就能写出代码&#xff1a; int main() {int reslut 1;for (int i 0; i < 1024; i){result * 2;}printf("…

Nmap(端口扫描工具)在Windows上的安装和使用,so easy

文章目录 一、下载安装图形化指引下载 二、安装使用非常简单参考文档 一、下载安装 Nmap官方下载平台 图形化指引下载 二、安装 什么都不要动&#xff0c;一直下一步 使用非常简单 参考文档 Nmap的安装与使用

搜索技术领域的“奥林匹克”,飞桨支持“第二届百度搜索创新大赛”正式启动!...

秋季&#xff0c;是丰收的季节&#xff0c;以“新搜索新奇点”为主题、由百度搜索携手英伟达联合发起&#xff0c;飞桨AI Studio星河社区支持的第二届百度搜索创新大赛&#xff0c;开赛啦&#xff01;超过60万丰厚奖金&#xff0c;十余套赛事优质课程&#xff0c;优质的竞赛交流…

屏幕分辨率dpi解析(adb 调试查看)

authordaisy.skye的博客_CSDN博客-嵌入式,Qt,Linux领域博主 ro.sf.lcd_density属性指定了这个机型使用的dpi是多少&#xff0c;dpi全称是dots per inch&#xff0c;对角线每英寸的像素点的个数。 密度 ldpi mdpi hdpi xhdpi xxhdpi 分辨率 240x320 320x480 480x800 7…

mysql Your password does not satisfy the current policy requirements

在修改密码时遇到 Your password does not satisfy the current policy requirements 原因&#xff1a;您的密码不符合当前策略要求&#xff0c;最好是把密码设置成复杂的&#xff0c;包括字母大小写、数字、特殊字符。 如果你还是先把数据库密码改简单&#xff0c;比如你本地…

解锁前端Vue3宝藏级资料 第五章 Vue 组件应用 5 (Vue 插件)

想了解Vue插件所以你看了官方文档却看不懂&#xff0c;或者你想知道Vue.use()方法和插件的关系。在本文档中&#xff0c;我们将参照文档讲解插件制作的基础知识&#xff0c;了解基础知识后&#xff0c;我们将制作与更实用的下拉菜单和脚本加载相关的插件。读完之后&#xff0c;…

白捡一个存储型XSS

本文由掌控安全学院 - 杳若 投稿 起因 利用fofa搜索时发现 org"China Education and Research Network Center" && body"/register" 任意用户注册 在找到该CMS的时候发现存在任意用户注册的情况 http://xxxx.edu.cn/student/Register.ashx …

ChatGPT技术原理

Task03 ChatGPT技术原理 目录 阶段一&#xff1a;有监督微调Supervised fine-tuning (SFT)阶段二&#xff1a;训练回报模型&#xff08;Reward Model, RM&#xff09;阶段三&#xff1a;使用强化学习微调 SFT 模型 ChatGPT 是由 GPT-3 迭代来的&#xff0c;原有的 GPT-3 可能…

HTML5+CSS3+JS小实例:鼠标控制飞机的飞行方向

实例:鼠标控制飞机的飞行方向 技术栈:HTML+CSS+JS 效果: 源码: 【html】 <!DOCTYPE html> <html><head><meta http-equiv="content-type" content="text/html; charset=utf-8"><meta name="viewport" conten…