PacBio HiFi 测序动植物基因组项目真实案例测评

news2024/11/23 3:49:31

HiFi Reads全称High fidelity reads, 是PacBio公司基于Sequel II平台产出的兼具长读长和高准确度的测序序列,该测序模式(CCS测序模式)一经问世,备受广大组学科研用户关注——其超长读长完美规避了二代测序short reads的天生不足,高准确度也远超之前的Sequel I平台CLR模式的,非常有助于组学研究者进一步优化数据结果,更是在大型动植物基因组de novo研究中有亮眼表现。

今天,就为大家带来HiFi测序在实战中的数据测评,让我们一起看看HiFi测序的强大优势和凌恩生物真实动植物基因组研究项目中PacBio sequel II平台的HiFi Reads的最新表现测评。

HiFiReads的诞生

PacBio三代测序的问世,无疑是对测序领域的一大突破,但超长读长从诞生之日起,其同样“出众”的高单碱基错误率也一直备受诟病——高成本加高错误率——使得长期以来三代测序似乎都不能打破NGS在组学研究领域高精准低成本的垄断地位。准确度差的硬伤一直制约着三代测序的成果产出。

2019年,PacBio公司终于取得突破,推出了基于环化共有序列(Circular Consensus Sequencing,CCS)测序模式,一改既往CLR模式Passes少因而错误率高的局面,CCS模式下,酶读长远大于插入片段长度,聚合酶绕着模板进行滚环测序,插入片段会被多次测序。单次测序中产生的随机测序错误,通过环形测序生成的一系列Subreads来进行自我纠错校正,最终得到高准确度的HiFi Reads,这些Reads 兼具长读长(10-20kb的长度)又具有高精度(>99.9%准确率),更适合于包括大型动植物基因组,全长转录组及宏组学等在内的多种组学研究。

HiFi Reads在基因组研究领域的优势体现

基因组De novo组装

在动植物基因组研究领域,HiFi Reads的超长读长对基因组de novo组装研究大有裨益。

从近期发表的系列基因组组装研究报道中可见HiFi Reads的应用优势:在一项针对美洲山核桃的基因组研究报道中,研究者采用不同的基因组组装路线对4个不同品系的山核桃基因组进行的组装和比较(如下图),其中,采用了PacBio HiFi Reads进行组装的Pawnee品系,无论从scaffold数量还是Gap含量,亦或Contig N50长度上等均有出众表现[1]。

基因组大型结构变异研究

基因组结构性变异的检测是基因组研究的热门,SNP\InDel、SV的存在对基因组影响显著,尤其SV,能够更好的解释群体多样性特征,在农业育种、医学疾病研究中有深远的影响。准确探查SV对基因组的准确率有极高的要求——只有基因组序列的准确率高,相关研究才更有价值。在这种前提下,HiFi Reads对序列拼接准确性的保障就凸显出其价值。

从PacBio官网公布的测试结果看(如下表),相比于二代测序平台及三代ONT平台,PacBio HiFi Reads进行全基因组范围内的变异检测的准确性更高,对SNV精确度和检出率可达99.9%,对插入缺失的精确度和检出率可达99.4%。(详见In precisionFDA Challenge, PacBio HiFi Reads Outperform Both ShortReads and Noisy Long Reads - PacBio https://www.pacb.com/blog/precisionfda-challenge/

HiFi测序真实项目数据测评

HiFi Reads的官宣参数品质如此出众,那么在真实项目应用中,其表现又如何呢?本期速享,为大家带来凌恩真实项目案利的数据测评。在最近出炉的HiFi 数据中,凌恩生物单cell的平均产出达482.88Gb,甚至个别cell产出达512Gb。同时,单cell的HiFi Reads 数据量可达33.8Gb,占原始数据产出的比例可达7.16%,酶读长均在90Kb以上,HiFi Reads长度可达17Kb。

下表是近期凌恩生物基因组项目部分HiFi 文库下机数据产出统计:

小  结

在三代测序崛起的现在,HiFi Reads以其超长读长,高准确率及灵敏度、GC偏向性小、无PCR偏向性等特色优势在动植物基因组、微生态领域等研究中正崭露头角,成为组学研究技术的新热门。高品质的HiFi Reads成为攻克动植物基因组组装难点的有力助推,可辅助二代测序完成Gap补洞拼接、重复串联研究、大型结构变异(SV检测、染色体易位等)研究等。

上海凌恩生物现有PacBio Sequel II测序平台,可以为广大科研用户提供包括CLR模式、CCS模式在内的三代测序服务项目。目前已承接大型动植物基因组项目数十项,及大量微生态领域相关研究项目(微生态全长扩增子测序,长片段扩增子测序,三代HiFi宏基因组项目等)。凌恩生物依托具有数十年组学研究经验的实验及生信分析团队,可提供个性化定制版解决方案,更好的服务组学科研,为您的学术研究提供更具性价比的服务与选择。


参考文献:

Fourchromosome scale genomes and a pangenome annotation to accelerate pecan tree breeding.Nature Communications, 2021.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/66117.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

【密码加密原则三】

目录 1 密码加密原则(续) 1.1 盐值的优化 1.2 Mybatis中的占位符 1 密码加密原则(续) 1.1 盐值的优化 为了进一步保障密码安全,可以考虑使用随机的盐值,但是,需要注意,随机的盐…

Java高效率复习-MySQL下篇[MySQL]

前言 本文章的语言描述会比上篇多一些 数据库的创建修改与删除 标识符命名规则 数据库名、表名不得超过30个字符,变量限制为29个必须只能包含A-Z,a-z,0-9,_等63个字符数据库名、表名、字段名等对象名中间不要包含空格同一个My…

生产环境 Nginx后端服务大量TIME-WAIT的解决

netstat -n | awk /^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]} ss -s netstat -nat |awk {print $6}|sort|uniq -c|sort -rn 统计TIME_WAIT 连接的本地地址 netstat -an | grep TIME_WAIT | awk {print $4} | sort | uniq -c | sort -n -k1 尝试抓取 tcp 包 tcpd…

工业CT之三维重建技术

目前,国内现有的工业CT设备绝大多数是基于线阵探测器的断层扫描技术。 该技术主要是通过观察二维图像去发现单层断面上的损伤部位,至于能准确地确定损伤部位的空间位置、大小、几何形状等,仅通过观察二维切片图像是很难实现的。 这个时候就需…

Flink系列之Flink中Checkpoint容错机制

title: Flink系列 三、Flink Checkpoint 容错机制原理概述 ​ Flink 提供了 Exactly once 特性,是依赖于带有 barrier 的分布式快照 可部分重发的数据源功能实现的。而分布式快照中,就保存了 operator 的状态信息。 ​ Flink 的失败恢复依赖于 检查点…

Zabbix技术分享——如何使用zabbix监控华为云RDS

在数字化大背景下,数据是重要的生产资料,这些数据存放在哪里,如何保障数据安全是所有企业都要考虑的事情。华为云RDS凭借安全可靠,可根据业务规模动态扩容的特性,受到越来越多中小企业的青睐,对华为云RDS监…

NR PUSCH power control(一)

这篇看下NR PUSCH power control的相关内容,主要内容集中在38.213 7.1章节,功率计算无非就是一个长公式,根据RRC配置的参数及后续DCI field 的内容作出功率的调整;最初这部分看的就云里雾里的,最近再看,相比…

upload-labs通关

upload-labs通关 shell 🍉 目录upload-labs通关PASS-01、PASS-02PASS-03PASS-04PASS-05PASS-06PASS-07PASS-08PASS-09PASS-10PASS-11PASS-12PASS-13PASS-14PASS-15PASS-16PASS-17PASS-18PASS-19PASS-20PASS-21shell能上传并能解析就算成功 PASS-01、PASS-02 图片…

最近要考pmp,哪个培训机构比较好?

你说的几个都是我着重了解过的,作为过来人,把我做的各大机构的优缺点给你参考吧~ PMP 机构排名的话,没有官方数据,网上数据仅供参考。这篇机构对比的文章,主流机构都有,你可以看看 下面说下我收集的每个机…

【数据库数据恢复】无法启动MongoDB服务的数据恢复案例

关于MongoDB数据库: MongoDB数据库存储方式是将文档存储在集合之中,而不是像Oracle、MySQL一样的关系型数据库。 MongoDB数据库是开源数据库,也提供具有附加功能的商业版本。 MongoDB中的数据是以键值对(key-value pairs)的形式显示的&…

[附源码]Python计算机毕业设计Django校友社交系统

项目运行 环境配置: Pychram社区版 python3.7.7 Mysql5.7 HBuilderXlist pipNavicat11Djangonodejs。 项目技术: django python Vue 等等组成,B/S模式 pychram管理等等。 环境需要 1.运行环境:最好是python3.7.7,…

“云办公”如何用任务协同工具搞定项目和团队管理?

导语:远程参加会议、团队协同作业、项目负责人进行任务分配、团队成员多人协同编辑文件及同时推进项目、人力部门在线进行审批报销……,随着“云办公”的加速普及,人们只需一台电脑、一部手机、一根网线,就能随时进入办公状态&…

云服务器及域名到期后,公安联网注销指南

云服务器及域名到期后,公安联网注销指南 公安联网备案及注销的操作流程都写在了官方文档中,可以进入全国互联网安全管理服务平台,在下载中心找到并下载 《互联网站安全服务平台操作指南》,按照操作指南进行备案及撤销。 以下图…

JS实现关闭图片窗口

JS实现关闭图片窗口 有趣的小案例池子: JS实现定时器 JS实现关闭图片窗口 JS实现输入检验 获取焦点后隐藏提示内容的输入框 JS实现获取鼠标在画布中的位置 聊天信息框显示消息 JS点击切换背景图 自动切换背景的登录页面 JS制作跟随鼠标移动的图片 JS实现记住用…

K8S Pod控制器详细讲解

文章目录一、Pod控制器介绍二、ReplicaSet(RS)三、Deployment(Deploy)1.镜像更新:2.版本回退3.金丝雀发布/灰度发布四、Horizontal Pod Autoscaler(HPA)五、DaemonSet(DS)六、Job七、CronJob(CJ)结尾一、Pod控制器介绍 Pod是kubernetes的最小管理单元,在…

ArcGIS矢量化并进行拓扑检查

土地利用数据每年都在发生变化,故每年都要根据去年的数据进行修改。请根据以下要求,修改A区域的数据并对B区域已做好的数据进行拓扑检查。 01 数据说明 1. 地类图斑A.shp:A区域需要编辑修改的图斑数据。 2. 影像.tif:编辑A区域…

Docker数据卷自定义Docker镜像

目录 宿主机与容器之间的文件拷贝 引言:利用MySQL镜像安装MySQL服务 从容器中拷贝文件到宿主机 从宿主机拷贝文件到容器 数据卷 数据卷容器 Dockerfile自定义镜像 自定义tomcat8(熟悉几乎所有的Dockerfile命令) 宿主机与容器之间的文…

集群配置步骤_java培训

配置步骤 复制3个ZooKeeper zookeeper-3.4.9.tar.gz解压后拷贝到/myzookeeper目录下并重新名为zk01,再复制zk01形成zk02、zk03,共计3份 新增目录 进入zk01/02/03分别新建文件夹,mydata、mylog 新建配置文件 分别进入zk01-zk03各自的conf文件…

perflab 课程设计

初始状态 rotate 版本I 因为本题步步都在寻址而寻址的目标每一步又不同,并且在一个地址的值一次就赋值完毕,不会对同一个地址进行二次寻址,所以我首先想的改进方向就是使得寻址更加快速,于是我使得寻址的地址更加连续。 int i,…

【面试题】 javaScript 进阶之路 --- 《加深理解回调函数》

给大家推荐一个实用面试题库 1、前端面试题库 (面试必备) 推荐:★★★★★ 地址:前端面试题库 一. 函数 回调函数的基本概念我之前的文章虽然有些过,但是为了引入下文,在这里还是简单再提一嘴…