葡萄风味有奥秘,农科院用机器学习揭示基因渐渗过程

news2024/11/19 20:25:28

内容一览:基因渐渗与葡萄的驯化、遗传改良密切相关。先前研究揭示了欧洲栽培葡萄中,野生葡萄基因渐渗的基因组信号,但尚未深入研究这些渐渗事件发生的时间、方式、基因组模式和生物学效应。本文中,中国农业科学院深圳农业基因组研究所的研究人员,使用机器学习的种群遗传分析方法,对栽培葡萄以及野生葡萄进行了重测序数据分析,这对于葡萄育种具有重要意义。

关键词:基因渐渗   葡萄驯化 机器学习

本文首发自 HyperAI 超神经微信公众平台~

基因渐渗是指基因从一种物种或种群,渗入到另一种物种或种群的过程。它通常发生在不同物种之间的杂交和回交过程中。在基因渐渗中,外源基因通过杂交进入目标物种的基因池,与目标物种的本地基因发生混合。这种渐渗可以导致目标物种的基因组发生改变,获得新的遗传变异和多样性。

葡萄的基因渐渗是指野生葡萄 (Vitis vinifera ssp. sylvestris) 与栽培葡萄 (V. vinifera ssp. vinifera) 之间基因交流和基因流动的过程。在自然界和人工选择的影响下,野生葡萄与栽培葡萄之间发生基因交换,导致栽培葡萄中出现野生葡萄的遗传特征。

近期,中国农业科学院深圳农业基因组的研究人员,研究了驯化葡萄与其欧洲野生近缘种之间的渐渗历史,他们使用基于机器学习的群体遗传方法,揭示了葡萄风味的形成机制,对其基因特征及其对葡萄育种的影响提供了深入的见解。目前,该研究成果已发表在《Proceedings of the National Academy of Sciences》期刊上,标题为《Adaptive and maladaptive introgression in grapevine domestication》。

该研究成果已发表在《Proceedings of the National Academy of Sciences》期刊上

论文地址:

https://www.pnas.org/doi/abs/10.1073/pnas.2222041120

数据集

研究人员对一组 345 个测序样本进行了分析,这些样本包括酿酒葡萄和食用葡萄,涵盖了野生葡萄的广泛地理分布范围,其中包括来自欧洲的 72 种野生葡萄 (V. vinifera ssp. sylvestris)、来自中东和高加索地区的 36 种野生葡萄和 231 种驯化葡萄 (V. vinifera ssp. vinifera),以及代表北美外群物种的 Vitis californica (n = 3) 和 Muscadinia rotundifolia (n = 3)。此外,研究人员还对欧洲野生葡萄进行了采样以覆盖欧洲和近东的预测分布区域。

数据 (基因组序列;script) 已存放在 GitHub 中:

GitHub - zhouyflab/Grapevine_Adaptive_Maladaptive_Introgression: Adaptive and maladaptive introgression in grapevine domestication

实验结果

基因渐渗历史 

首先,研究人员评估了欧洲野生葡萄、酿酒葡萄和食用葡萄之间的差异,以深入了解种群和驯化历史。值得注意的是,欧洲野生葡萄 (EU sylvestris) 形成了一个独特的群体,与酿酒葡萄共享少数混合成分。

图 1. 不同葡萄品种对比

A:混合分析的系统发生树。

在系统发生中,分支的颜色反映了不同的群体:ME 1,黄色;ME 2,紫色;野生葡萄,红棕色;酿酒葡萄,蓝色;食用葡萄, 绿色。Admixture 图, K = 6 。图右侧的红点和蓝色三角形分别显示来自食用或酿酒组的叶绿体或线粒体是否明显起源于欧洲野生葡萄。

B:五个组的 PCA。

C:五组的杂合性。

D:不同传播类型下的正向模拟结果。蓝线表示异交繁殖,而橙色线表示克隆繁殖。

图 1 显示,酿酒葡萄和食用葡萄在进化过程中发生了早期的分化,表明它们在用途上有明显的区别。野生葡萄样本也呈现出单系群,但分为三个不同的群体:欧洲野生葡萄(EU)、位于里海周围葡萄 (ME 1) 和位于地中海附近的肥沃新月地带的葡萄 (ME 2)。通过  主成分分析 (PCA) 和祖先成分比例的估计,也证实了这些种群之间的分化。酿酒葡萄和食用葡萄 (均为 0.24) 的杂合性比野生种群更高 (欧洲为 0.17,ME1 为 0.20,ME2 为 0.22),这可能是由于历史上的渐渗事件和长期的无性繁殖导致了杂合突变的积累。

基因渐渗方向 

研究人员在最初的模型基础上,估计了食用葡萄、酿酒葡萄和欧洲野生葡萄之间可能存在的 34 种基因流动模式。根据最佳模型,fastsimcoal 推断欧洲野生葡萄大约在 4 万年前发生了分化。

图 2:渐渗检测

水平分支中的时间 (T) 是每个组的分化时间 (年),T_i 表示推断的渐渗开始时间。

底部的数字是每组的估计有效种群规模 (Ne)。

图 2 显示,在最佳模型下,fastsimcoal 推断出 EU 类群在大约 4 × 104 年前分化;食用葡萄的驯化早在 1.5 × 104 年前就开始了;大约在 1.0 × 104 年前,酿酒葡萄从食用葡萄中分离出来。模型表明,欧洲野生种群和驯化种群之间的基因流动始于 1.8 × 103 年前。此外,最佳拟合模型还表明,基因从欧洲野生种群流动到驯化种群的概率很高,向酿酒葡萄 (1.7 × 10−4) 的迁移率是食用葡萄 (3.8 × 10−5) 的 5 倍。

基因渐渗区域 

研究人员使用机器学习方法来识别葡萄基因组的基因渐渗区域,以及这些区域的基因组特征。

图 3:渐渗区域的三种基因

Filet 预测的假定基因渐渗区域用黑线标记在 19 条染色体上。

三种颜色代表三种基因渐渗区域内的基因

红色:开花相关基因

绿色:芳香化合物相关基因

蓝色:应激反应基因。

研究人员对整个基因组中的渐渗选择基因进行了 GO 功能研究,并重点关注开花相关基因、风味相关基因和应激反应相关基因。图 3 显示,许多与开花相关的基因在渗入后选择,其次是芳香族化合物相关的基因。大多数 GO 分类的富集也与风味相关,包括木质素降解过程、L-苯丙氨酸降解过程和肉桂酸生物合成过程。因此,研究人员推断酿酒葡萄和欧洲野生葡萄之间的适应性渐渗主要影响了与风味相关的性状。

为了解等位基因的渐渗动态,研究人员对异交繁殖和克隆繁殖的渐渗进行了正向模拟。

图 4:非渐渗区域和渐渗区域中有益 SNPs 和有害 SNPs 的 SFS

E:整个渐渗群体中渐渗等位基因的总数

F:整个渐渗群体中不同类型的渐渗等位基因的数量

G:异交组第 500 代渐渗有益和有害等位基因的 SFS

H:克隆组第 500 代渐渗有益和有害等位基因的 SFS

研究发现,杂交后渐渗等位基因 (包括有益和有害等位基因) 的总数都有所增加,直至达到平衡。这些模拟表明,在克隆和异交系统中,渐渗等位基因的情况可能存在显著差异。渐渗对有益和有害变异的补充起到了重要作用,这些变异可能成为葡萄栽培基因组设计的主要目标,包括在有性繁殖过程中清除潜在的有害变异。

AGIS:专注农业科技创新

值得注意的是,该论文的多名作者均来自中国农业科学院深圳农业基因组研究所。基因组所成立于 2014 年,通过整合生物学和大数据科学,来认识与利用农业生物基因组,服务全球农业生产。基因组所的长期愿景是致力于通过颠覆性创新来促进全球农业可持续发展,服务于个性化食品供给体系,并提升人类健康水平和农民社会地位。

基因组所在包括 Science、Nature、Cell 等顶级期刊在内的杂志上发表 SCI 论文 620 多篇,农业基因组学等研究领域占据世界前沿。除了研究葡萄的基因渐渗问题,该所还发布了另外两篇与葡萄基因相关的研究成果,不仅联合国内外学者首次绘制了葡萄完整基因组图谱,还揭示了野生葡萄的抗皮尔斯病的全基因组效应和气候适应性机制。

所长表示,基因组所还是一个非常年轻的科研院所,建设国际一流的农业科研院所任重而道远,将立足新时代新征程新使命,以坚持「四个面向」助力高水平科技自立自强,为建设「农业强国」继续做出我们的贡献。目前,基因组所联合深圳市相关部门提出了建设「深圳国际食品谷」建议,规划已得到市政府批复,将在深圳构建农业食品产学研协作生态,做出科技推动农业食品产业转型升级的先行示范。

基因组所官网:

中国农业科学院农业基因组研究所

参考文献:

[1]https://www.163.com/dy/article/I6KVQLV205328VPM.html

[2]https://www.sohu.com/a/682674856_121124027

[3]https://www.caas.cn/xwzx/kyhd/60f2e9b4dff84bed9e315b7097aeb26b.htm

[4]https://www.agis.org.cn/bsgk/yjsjj/index.htm

[5]https://www.agis.org.cn/xwzx/kyjz/677aecae97c448c9bed7e89f95daae7f.htm

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/691566.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【杂谈理解】电源芯片设计选型

前言 看B站UP主达尔闻关于电源视频,做的笔记。下述内容中,如有芯片比较皆是性能层面的比较,暂未考虑成本。且老师在视频中,也多次建议说,可以多关注比较新兴的芯片,一般会是有更好的性能。讲的真的很好&…

【MySQL】MySQL数据库,RDBMS 术语,使用说明和报错解决的详细讲解

作者简介: 辭七七,目前大一,正在学习C/C,Java,Python等 作者主页: 七七的个人主页 文章收录专栏: 七七的闲谈 欢迎大家点赞 👍 收藏 ⭐ 加关注哦!💖&#x1f…

转型升级必备:智能客服外包服务的应用实践

随着信息技术的不断发展,人工智能技术在各个领域的应用越来越广泛,其中智能客服外包服务是一个备受关注的领域。智能客服外包服务是指将企业的客服业务交由专业的第三方服务商处理,并运用人工智能技术提供更高效、更优质的客服服务。本文将从…

FineReport学习2

当原始数据中存储的字段不适宜展现在报表上;或原始数据在数据查询时不易修改,但对显示在报表中的值有要求;或需要根据不同的原始数据在报表中显示不同的值时,就可以利用数据字典做巧妙的转化 设置数据字典 数据列的过滤&#xff…

解决程序错误‘找不到vcruntime140.dll,无法继续执行代码’的全面解决方案

在运行某些应用程序或代码时,你可能会遇到一个错误提示:“找不到vcruntime140.dll,无法继续执行代码”。其实遇到这种情况不需要担心,我们有多种方法可以进行解决,今天小编就来给大家详细的说说vcruntime140.dll文件的相关问题&am…

ABIDE Preprocessd 结构态MRI数据集介绍及下载(FreeSurfer流程)

引言 本博客书接上文:ABIDE Preprocessed 结构态MRI数据集介绍及下载,写前一篇的时候因为觉得FreeSurfer流程处理完成的数据过于庞杂,想要从中获得需要的ROI层面形态学特征过于复杂,所以只是简单说明了其下载方式,并未…

DAY34——贪心part3

1. class Solution {public int largestSumAfterKNegations(int[] nums, int K) {// 将数组按照绝对值大小从大到小排序,注意要按照绝对值的大小nums IntStream.of(nums).boxed().sorted((o1, o2) -> Math.abs(o2) - Math.abs(o1)).mapToInt(Integer::intValue)…

8.12 IP协议与ethernet协议

目录 IP协议作用和意义 计算机网络体系结构 网络互联使用路由器 IP网的意义 分组在互联网中的传送 分组传输路径 ​编辑 IP 数据报首部格式 IP数据报的格式 IP数据报首部的固定部分中的各字段 IP 数据报分片 IP数据报首部中的协议 以太网协议 IP协议作用和意义 数…

13年测试老鸟经验,性能测试-性能调优各个方法详细,一篇通透...

目录:导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜) 前言 WebServer服务优化…

数学建模算法(基于matlab和python)之 变步长求积公式与龙贝格算法(3/10)

实验目的及要求: 深刻认识数值积分法的意义;明确数值积分精度与步长的关系;根据定积分的计算方法,可以考虑二重积分的计算问题。 实验内容: 1、利用quad函数作变步长方法计算定积分的近似值,计算精度为。 …

Axure制作一个滑动验证组件

一、案例效果 1、默认显示滑块、背景及提示文案; 2、滑块仅允许向右水平拖动,且不能超过背景区域; 3、滑块移动过程中,左侧区域样式跟随变化,右侧区域保持不变; 4、滑块为未拖动到最右侧时释放&#xff…

射频功率放大器——如何选择合适的射频功率放大器

射频功率放大器是一种用于增强射频信号的电子设备。在选择合适的射频功率放大器时,需要考虑多个因素,包括应用场景、频率范围、增益、带宽、噪声等。下面是一些关于如何选择合适的射频功率放大器的基本步骤: 1、确定应用场景和需求&#xff1…

CANoe使用记录(五):CANoe 如何调用诊断功能/ZCANPRO的诊断功能

目录 1、概述 2、Canoe调用诊断服务 2.1、查看是否存在license 2.2、新建工程步骤分解 3、ZCANPRO的诊断功能 1、概述 有那么一部分时候,需要通过Canoe来实现简单的诊断服务,当然大部分时候通过Canoe进行测试需要通过CAPL脚本实现复杂的UDS诊断服务。…

Unity WebAR插件记录

1.Imagine WebAR - World Tracker(Unity商店) 使用此插件为Web浏览器创建增强现实体验。借助出色的6DOF跟踪功能,将游戏对象固定在地板或任何表面上。支持所有主流的手机浏览器。 2.Imagine WebAR - Image Tracker(Unity商店&…

JavaScript ES8新特性

文章目录 导文异步函数(Async/Await):Object.getOwnPropertyDescriptors()方法:字符串填充方法(String padding):共享内存与原子操作(Shared Memory and Atomics)&#x…

基于原生 js 实现今日新闻网站

完整资料进入【数字空间】查看——baidu搜索"writebug" 一、今日新闻网站设计报告 1.1 1 设计思路 该网站设计大部分都是基于原生 js 实现。基本思想为首先将基本的页面架构包括 header,导航条写好。之后根据后台 PHP 请求接口请求返回 JSON 格式数据后…

【Java核心技术】Java基本语法

Java基本语法 1、关键字与保留字关键字的定义和特点保留字的定义 2、标识符标识符的定义定义合法标识符规则Java中的名称命名规范 3、变量变量的概念变量的作用使用变量注意变量的分类整数变量:byte、short、int、long浮点类型:float、double字符类型&am…

Vue组件间通信的几种方式

Vue组件间通信的几种方式 0、前言1、props/$emit(父子)2、ref / $refs(父子)3、provide / inject(深度父子)4、EventBus 事件总线 (任意两个组件通讯)5、$attrs / $listener&#xf…

逻辑回归(Logistics Regression)的原理及实现

1.逻辑回归(Logistics Regression)的原理及实现 笔记来源于《白话机器学习的数学》 逻辑回归用于解决二分类问题 1.1 逻辑回归的原理 1.1.1 Sigmoid函数 sigmoid函数在神经网络中如何起作用?详见本人笔记:机器学习和AI底层逻辑 …

Spreadjs 16.1.3 + GcExcel 6.1.2 操作EXCEL好轻松-Crack

全球销量第一的 JavaScript 电子表格,包含 500 多个 Excel 函数 快速提供真正类似 Excel 的电子表格体验 - 对 Excel 零依赖。创建金融应用程序,仪表板,图表,数据透视表,性能基准,科学实验室笔记本,以及其他类似的 JavaScript 电子表格应用程…