HiFi Reads全称High fidelity reads, 是PacBio公司基于Sequel II平台产出的兼具长读长和高准确度的测序序列,该测序模式(CCS测序模式)一经问世,备受广大组学科研用户关注——其超长读长完美规避了二代测序short reads的天生不足,高准确度也远超之前的Sequel I平台CLR模式的,非常有助于组学研究者进一步优化数据结果,更是在大型动植物基因组de novo研究中有亮眼表现。
今天,就为大家带来HiFi测序在实战中的数据测评,让我们一起看看HiFi测序的强大优势和凌恩生物真实动植物基因组研究项目中PacBio sequel II平台的HiFi Reads的最新表现测评。
HiFiReads的诞生
PacBio三代测序的问世,无疑是对测序领域的一大突破,但超长读长从诞生之日起,其同样“出众”的高单碱基错误率也一直备受诟病——高成本加高错误率——使得长期以来三代测序似乎都不能打破NGS在组学研究领域高精准低成本的垄断地位。准确度差的硬伤一直制约着三代测序的成果产出。
2019年,PacBio公司终于取得突破,推出了基于环化共有序列(Circular Consensus Sequencing,CCS)测序模式,一改既往CLR模式Passes少因而错误率高的局面,CCS模式下,酶读长远大于插入片段长度,聚合酶绕着模板进行滚环测序,插入片段会被多次测序。单次测序中产生的随机测序错误,通过环形测序生成的一系列Subreads来进行自我纠错校正,最终得到高准确度的HiFi Reads,这些Reads 兼具长读长(10-20kb的长度)又具有高精度(>99.9%准确率),更适合于包括大型动植物基因组,全长转录组及宏组学等在内的多种组学研究。
HiFi Reads在基因组研究领域的优势体现
基因组De novo组装
在动植物基因组研究领域,HiFi Reads的超长读长对基因组de novo组装研究大有裨益。
从近期发表的系列基因组组装研究报道中可见HiFi Reads的应用优势:在一项针对美洲山核桃的基因组研究报道中,研究者采用不同的基因组组装路线对4个不同品系的山核桃基因组进行的组装和比较(如下图),其中,采用了PacBio HiFi Reads进行组装的Pawnee品系,无论从scaffold数量还是Gap含量,亦或Contig N50长度上等均有出众表现[1]。
基因组大型结构变异研究
基因组结构性变异的检测是基因组研究的热门,SNP\InDel、SV的存在对基因组影响显著,尤其SV,能够更好的解释群体多样性特征,在农业育种、医学疾病研究中有深远的影响。准确探查SV对基因组的准确率有极高的要求——只有基因组序列的准确率高,相关研究才更有价值。在这种前提下,HiFi Reads对序列拼接准确性的保障就凸显出其价值。
从PacBio官网公布的测试结果看(如下表),相比于二代测序平台及三代ONT平台,PacBio HiFi Reads进行全基因组范围内的变异检测的准确性更高,对SNV精确度和检出率可达99.9%,对插入缺失的精确度和检出率可达99.4%。(详见In precisionFDA Challenge, PacBio HiFi Reads Outperform Both ShortReads and Noisy Long Reads - PacBio https://www.pacb.com/blog/precisionfda-challenge/)
HiFi测序真实项目数据测评
HiFi Reads的官宣参数品质如此出众,那么在真实项目应用中,其表现又如何呢?本期速享,为大家带来凌恩真实项目案利的数据测评。在最近出炉的HiFi 数据中,凌恩生物单cell的平均产出达482.88Gb,甚至个别cell产出达512Gb。同时,单cell的HiFi Reads 数据量可达33.8Gb,占原始数据产出的比例可达7.16%,酶读长均在90Kb以上,HiFi Reads长度可达17Kb。
下表是近期凌恩生物基因组项目部分HiFi 文库下机数据产出统计:
小 结
在三代测序崛起的现在,HiFi Reads以其超长读长,高准确率及灵敏度、GC偏向性小、无PCR偏向性等特色优势在动植物基因组、微生态领域等研究中正崭露头角,成为组学研究技术的新热门。高品质的HiFi Reads成为攻克动植物基因组组装难点的有力助推,可辅助二代测序完成Gap补洞拼接、重复串联研究、大型结构变异(SV检测、染色体易位等)研究等。
上海凌恩生物现有PacBio Sequel II测序平台,可以为广大科研用户提供包括CLR模式、CCS模式在内的三代测序服务项目。目前已承接大型动植物基因组项目数十项,及大量微生态领域相关研究项目(微生态全长扩增子测序,长片段扩增子测序,三代HiFi宏基因组项目等)。凌恩生物依托具有数十年组学研究经验的实验及生信分析团队,可提供个性化定制版解决方案,更好的服务组学科研,为您的学术研究提供更具性价比的服务与选择。
参考文献:
Fourchromosome scale genomes and a pangenome annotation to accelerate pecan tree breeding.Nature Communications, 2021.