HIFI测序揭示拟南芥MSH1参与介导的细胞器基因组重组与变异积累规律

news2024/11/15 7:22:25

近日,中国农业科学院农业基因组所武志强课题组在《The Plant Journal》在线发表了题为“Long-read sequencing characterizes mitochondrial and plastid genome variants in Arabidopsis msh1 mutants”的研究论文,该研究通过高精度的长读长测序(PacBio HiFi)解释了拟南芥MSH1参与介导的细胞器基因组重组与变异积累规律。

发表期刊:The Plant Journal

发表时间:2022. 09

DOI: 10.1111/tpj.15976

一、背景介绍

植物线粒体基因组中丰富的重复序列可导致基因组快速重排,也是短读长测序研究的主要障碍。众所周知,如MSH1等核编码蛋白可以抑制与重复序列相关的线粒体基因组变异的产生,但对这些机制的理解受到了短读长技术的限制。而长读测序技术的出现为分析植物线粒体基因组中的结构变异提供了机会。

二、实验设计

本研究选用拟南芥msh1突变个体为研究对象,通过使用高度精确的长读长测序(PacBio HiFi)来描述线粒体(mt)和质体(pt)基因组结构变异、单碱基变异(SNVs)以及插入缺失(indels)变异特征,绘制了线粒体基因组重复序列介导重组精细图谱,并分析了线粒体与叶绿体基因组变异积累模式的差异。

三、结果分析

1、HiFi的定位确定了拟南芥线粒体基因组中的结构变异

为了分析纯合子msh1突变体的细胞器基因组的结构重排,收集了来自3个不同F3家族的地上组织,构建文库用于PacBio HiFi测序,总共产生了34.36 Gb的HiFi reads。除去一个产量极低的异常值后,核基因组的覆盖率为8.5× ~ 46.4×,pt基因组的覆盖率为899.0× ~ 3093.8×,mt基因组的覆盖率为30.9× ~ 247.9×。

在野生型中,非串联重复介导的重排占总reads的7.5%,其中大部分与两个大重复序列区域相关(图1c)。在msh1突变体中,这一比例增加到总reads的31.63%,包含由中等大小重复介导的重排和多次重排的比例增加(图1b,c)。同时还检测到一些低频事件,包括MMEJ(AO长度在2~49bp之间)和NHEJ(AO长度为0或1 bp)、与串联重复序列相关的复制、滑动和插入相关(大多数情况下为poly-G/C tracts)。与野生型相比,msh1突变体中MMEJ事件的比例也增加了。

综上所述,msh1突变体的mt基因组结构变异主要(> 96.7%)与串联重复序列相关。与短读长测序相比,本研究中HiFi测序为研究单个序列和低频结构变异类别中的多重重排提供了机会。

图1 mt基因组中定位HiFireads识别的结构变异

2、msh1突变体中mt基因组结构变异的全局模式

通过可视化所有的连接和一次重排reads的read计数,发现野生型个体中的重排主要与Large1、Large2、Q和V重复,以及其他一些频率非常低的重复有关。在msh1突变体中,增加的mt基因组重排的活性不是随机分布的(图2a)。它们大多与在以前的研究中发现的重复子集相关,在三个包含大重复的区域和两个具有中等大小重复的额外区域观察到最极端的变异性。通过更详尽的blastn参数,发现许多之前没有命名的小重复也与mt基因组重排有关(图2a)。然而,由这些小的重复介导的重排得到很少的reads支持,在较少的样本中检测到(图2b,c)。

对于一个给定的重复组,使用跨越两个重复边界的长读长reads,可以更详细地估计非对称重组事件。两个msh1突变家族之间的不对称重组极性很大程度上保守,强度差异小,部分重复组的亲本形式丢失,这可能是由异质分选引起的。与野生型相比,观察到msh1突变体中Large1基因存在更明显的不对称重组和严重的一种亲本形式的丢失(图3)。

长读长reads可以识别涉及两组或更多组重复的重排。例如,与野生型相比,msh1突变体中涉及Large1和Large2的两次重排reads增加表明其mt基因组更加碎片化和异质性。总之,本研究数据提供了更详细和更准确的msh1突变体的mt基因组结构变异信息。

图2 在msh1突变体中检测到的单重排mtreads的模式

图3 不对称的重组事件和伴随的亲代形式的丧失

3、对msh1中交叉和非交叉重组事件的基本理解

研究了27组序列不完全相同的高度、中度活性重复序列的内部单核苷酸变异(SNVs)和indels。首先研究了单重排嵌合reads中交叉位点的分布。发现,重组断点最有可能出现在双拷贝重复序列中最长的相同片段(LIF)中,并且支持reads的比例与LIF长度占总重复序列长度的比例呈正相关(图4a)。这表明重组断点在重复序列中分布在相对均匀的长度上,而不是定位于单个热点。在分析中,还发现了一些reads中不完全重复长度的SNVs/indels的不连续模式。

mt基因组重组模式表明,用于DNA损伤双链断裂(DSB)修复的dsDNA模板可以是等位基因的,也可以是非等位基因的,重组产物可以是交叉的,也可以是非交叉的(图4b)。

HiFi技术能够实现不包含任何重排但仍然在重复中显示变量的明确的reads mapping。研究了零重排reads中非等位基因SNVs/indel的交换,这些reads跨越了所有27个不完全重复的高活性和中等活性组的整个长度。观察到msh1突变体中大量的镶嵌重复序列明显是通过非等位基因SNVs/indels交换产生的,这在野生型中很少发生。这表明在没有MSH1的情况下,非等位基因的dsDNA模板被用于非交叉重组。在msh1突变体中,重复组A、D、G、H、I、M、MMJS、N、R、T和W表现出高频率的非等位SNVs/indels(图4d),交叉重组的频率较高,其余15个重复组的非等位SNVs/indels频率较低。

总之,这些序列水平的研究表明,MSH1除了可以抑制结构变异外,还可以抑制mt基因组内不完全重复序列之间的非等位SNVs/indels的交换。

图4 MSH1抑制了不完全重复之间SNVs/indel的交换

4、拟南芥中Mt基因组进化涉及可重复的重复序列

本研究使用已发表的PacBio CLR数据集,使用metaFlye重组了其他7个拟南芥材料的mt基因组。结果显示,所有的metaFlye组装图都(接近)完全组装,这表明在所有的材料中都具有较低的异质性。相比之下,msh1突变体的图要复杂得多,其中包含碎片化的contigs和许多未解决的重复序列,反映出其mt基因组的高度重排和异质性。

当与野生型Col-0 mt基因组的多个连接的伪主环进行比较时,发现了与特定的非串联重复序列、MMEJ/NHEJ和串联重复序列相关的结构重排,以及一些两侧有重复或微同源的大型内链。例如,An-1和Ler的mt基因组结构惊人地相似。Col-0和an -1的mt基因组有5个重排由重复组B、I、H-1/2、L和H-1/3介导,而Ler的mt基因组有一个额外的重排由重复组LL介导(图5a)。

不同msh1个体的整体HiFi reads覆盖与野生型相比没有太大的差异。总之,分析表明,在msh1突变体中观察到的相对随机的MMEJ/NHEJ都参与了mt基因组进化,导致重排、大缺失和产生新的重复序列,通过选择防止了必要功能基因的丢失。

图5 提出了新的mt基因组构型和大重复序列的生成模型

5、msh1突变体中pt基因组变异的不同积累模式

野生型和msh1突变体的pt基因组中的结构变异频率都很低,与mt基因组相比,拟南芥的pt基因组包含一对非常大的重复序列(IRa/b),但很少有中间重复序列。在一个单个样本中只检测到一个reads,它支持先前确定的由一对123-bp的不完全重复序列介导的重排。因此,该变异似乎对pt基因组不稳定性的贡献非常小。在msh1突变体中,pt基因组中MMEJ事件的比例增加。

另一个重要的特征是msh1突变体的pt基因组中某些变异的样本特异性积累。观察到一个pt NHEJ产物只出现在一个样本中,导致了petA基因65个bp的缺失(图6b)。总的来说,在一个或几个msh1突变体样本中鉴定出了17个富集到高频率的pt SNVs(图6c)。此外,研究发现,与野生型相比,msh1突变体的pt基因组中简单序列重复表现出更大比例的长度变异。例如,对于67164位的13 bp均聚物(其支持长度从- 6 bp到+18 bp),所有msh1个体中参考长度(13 bp)的比例都小于野生型(图6d)。

总之,本研究序列数据表明,MSH1参与了pt基因组变异的去除。msh1突变体的pt变异少于mt变异,异质分选可能导致个体间的变异。

图6 通过HiFi读取检测到的pt基因组中的突变和结构变异

四、结论

综上所述,该研究使用HiFi测序来研究拟南芥msh1突变体线粒体和叶绿体基因组变异的模式。结果表明,HiFi测序在解析不完全相似重复序列重组产物内部的SNVs/indels分布具有明显优势,能够同时检测到交换(crossover)和非交换(non-crossover)的异位重组。与基于短读长的研究相比,该研究分析发现MSH1能够抑制重复序列之间非交换的异位重组。此外,该研究推测MSH1表达量变化可能造成线粒体和叶绿体基因组结构和序列变异增加,而变异积累模式的差异可能是两套基因组进化轨迹差异的原因之一。该研究结果增进了研究人员对细胞器遗传变异模式的认识,为改造细胞器遗传物质,优化作物育种提供了理论支持。

HiFi reads读长可达10-25kb,准确度可达Q30(99.9%),因此被越来越多地运用于各种基因组研究,成为基因组、泛基因组、宏基因组研究不可或缺的一部分,也成为细胞器基因组的研究利器!利用PacBio HiFi测序可以跨越重复序列,表征线粒体基因组的重组动态,详细量化重组及变异的发生,促进对植物线粒体基因组的理解。


凌恩生物拥有丰富的细胞器基因组研究经验,自主研发的细胞器基因组富集提取技术,可高效实现高质量细胞器基因组富集,具有一对一的生物信息分析,人工基因注释矫正,满足NCBI数据库上传要求,高质量结果交付,助力高水平研究。同时,结合PacBio HiFi测序手段,可对复杂的植物线粒体、叶绿体基因组进行测序、组装得到完成图,目前,已完成叶绿体、线粒体基因组项目逾千例,98%以上样本实现完成图水平交付,是您细胞器基因组研究的不二之选!

参考文献:

Long-read sequencing characterizes mitochondrial and plastid genome variants in Arabidopsis msh1 mutants. The Plant Journal, 2022.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/69558.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

安卓APP源码和设计报告——仿淘宝水果商城

项目名称 仿淘宝水果商城项目概述 随着互联网技术地高速发展,计算机进入到每一个人的生活里,从人们的生活方式到整个社会的运转都产生了巨大的变革,而在信息技术发达的今天,互联网的各种娱乐方式都在渗透到人们的生活方式之中&…

Procreate绘画教程

Procreate绘画教程 从 30 多年的设计师/插画家那里彻底有效地学习 Procreate!已更新至 Procreate 5.2! 课程英文名:Procreate Solid Foundations 此视频教程共10.0小时,中英双语字幕,画质清晰无水印,源码…

三条建议!让您在世界杯期间确保网络安全!

2022年11月,全球的目光都聚焦在依旧“夏日炎炎”的卡塔尔。随着人们观看、分享赛事的习惯从传统的电视转为网络,世界杯必将成为整个2022年的“流量王”。在我国,仅仅德国与日本的一场比赛在微博平台就带来了13.8亿次阅读。 据估计&#xff0…

细粒度图像分类论文研读-2020

文章目录Filtration and Distillation: Enhancing RegionAttention for Fine-Grained Visual Categorization(by localization- classification subnetwork)AbstractIntroductionApproachDiscriminative Regions ProposingFeature Learning and Recognition EnsembleFiltration…

Spring源码深度解析:十一、Spring的循环依赖

一、前言 文章目录:Spring源码深度解析:文章目录 这篇文章是接着 Spring源码深度解析:七、bean的加载① - doGetBean 的继续分析过程。 二、什么是循环依赖 循环依赖,其实就是循环引用,就是两个或者两个以上的 bea…

【MySQL】数据处理函数

只有当你开始相信自己时,你才拥有真正的人生。——《洛奇》 前言: 大家好,我是爱打拳的程序猿。今天给大家展示是数据处理函数的用法,分为单行处理函数和分组函数。数据处理函数主要是为了更方便解决数据的各种问题。文章以代码和…

2023年Unity UI教程

2023年Unity UI教程 Unity 新 UI 系统 UI 工具包的完整概述 课程英文名:Modern Unity UI with UI Toolkit 此视频教程共10.0小时,中英双语字幕,画质清晰无水印,源码附件全 下载地址 课程编号:336 百度网盘地址&am…

SSM框架-获取容器的方式

9 容器 9.1 获取容器 记载类路径下的容器所在的配置文件,也就是之前用的 public class App2 {public static void main(String[] args) {ApplicationContext ctx new ClassPathXmlApplicationContext("applicationContext.xml");BookDao bookDao (BookDao) ctx.…

liunx 部署 kkfileview文件预览 以及解决https访问

kkfileview gitee地址 https://gitee.com/kekingcn/file-online-preview 1.下载office组件 wget https://kkfileview.keking.cn/LibreOffice_7.1.4_Linux_x86-64_rpm.tar.gz tar -zxvf LibreOffice_7.1.4_Linux_x86-64_rpm.tar.gz cd LibreOffice_7.1.4.2_Linux_x86-64_rpm/R…

TensorRT推理手写数字分类(一)

系列文章目录 (一)使用pytorch搭建模型并训练 文章目录系列文章目录前言一、网络搭建1.LeNet网络结构2.pytorch代码二、网络训练1.pytorch代码2.结果展示三、保存和加载模型1.保存整个网络2.保存网络中的参数总结前言 为了学习一下使用TensorRT进行推理…

硬核!Github星标79.4K的阿里强推Java面试参考指南到底有多强?

谈到Java面试,相信大家第一时间脑子里想到的词肯定是金三银四,金九银十。好像大家的潜意识里做Java开发的都得在这个时候才能出去面试,跳槽成功率才高!但LZ不这么认为,LZ觉得我们做技术的一生中会遇到很多大大小小的面…

Java并发编程—如何写好代码?链式调用该怎么玩?

目录 一、案例说明 二、原生方式代码流程 三、链式调用代码流程 四、链式调用手搓的方式: 五、总结: 在上一篇博客https://blog.csdn.net/qq_52545155/article/details/128212148?spm1001.2014.3001.5501,博主在写商城统计商品价格的时…

mybatis中其他数据源也使用XML进行操作(SqlSessionFactory.openSession(Connection connection)方法)

文章目录1. 前言2. 先说结论3. 例子1. 准备数据2. 思考过程3. 结论1. 前言 当前在使用springbootmybatis的时候,通常会先在配置文件中配置好数据源,并在Mapper.xml文件编写好相关SQL,使用mybatis进行对数据库进行所谓的crud操作。 有时候会出…

nginx代理https妈妈级手册

目录 背景说明 相关地址 https证书生成 nginx安装及配置 结果展示​编辑 背景说明 为了保证传输加密、访问安全,我们采用nginx服务器将http服务代理为https。所需材料:openssl(用来生成证书)、http服务、nginx自身。 相关地址…

C/C++第三方库zeromq、log4cpp交叉编译、本地安装ubuntu180.04

一、zeromq的编译安装 1)ubuntu下命令 apt-get install libzmq3-dev不推荐这种方式,因为很可能安装的版本并不是最新的; 2)自己编译安装(推荐) 地址:https://github.com/zeromq/libzmq/relea…

设计模式--装饰者模式

文章目录前言一、未使用设计模式二、装饰者模式1.定义2.角色三、应用场景四、优缺点优缺前言 晓子(咖啡店员),来一杯美式,加点威士忌和砂糖。 抱歉啊,猫。收银系统还没有你说的组合,要不换一个&#x1f60…

React 的调度系统 Scheduler

大家好,我是前端西瓜哥。今天来学习 React 的调度系统 Scheduler。 React 版本为 18.2.0 React 使用了全新的 Fiber 架构,将原本需要一次性递归找出所有的改变,并一次性更新真实 DOM 的流程,改成通过时间分片,先分成一…

nnUnet测试

https://github.com/MIC-DKFZ/nnUNet nnUnet要在Windows上跑起来有点麻烦,主要是项目路径的问题,我目前测试了2分类遥感数据(其实只要是二分类都行,无所谓什么数据),我这里说难是因为我没有安装&#xff0…

【SQL】MVCC 多版本并发控制

MVCC多版本并发控制快照读与当前读隔离级别隐藏字段,undo log 版本链隐藏字段trx_id版本链read view举例说明read committed(读已提交)隔离级别下repeatable read(可重复读)隔离级别下innodb如何解决幻读总结并发问题的…

LaTex使用技巧9:argmin / argmax下标写法

记录两种写法 1.arg⁡max⁡θ\mathop{\arg\max}\limits_{\theta}θargmax​的写法 写法1: $\mathop{\arg\max}\limits_{\theta}$ 写法2: $\sideset{}{}{\arg\max}_{\theta}^{} $ 2.arg⁡min⁡θ\mathop{\arg\min}\limits_{\theta}θargmin​的写法 写法…