关键词:基准与方法研究;基因测序;变异检测;
文献简介
- 标题(英文):Accuracy benchmark of the GeneMind GenoLab M sequencing platform for WGS and WES analysis
- 标题(中文):GeneMind 公司的 GenoLab M 测序平台 WGS 和 WES 数据基准测试
- 发表期刊:BMC Genomics
- 作者单位:深圳真迈生物科技有限公司
- 发表年份:2022
- 文章地址:https://doi.org/10.1186/s12864-022-08775-3
图1 文献介绍
GenoLab M是GeneMind Biosciences最近开发的下一代测序(NGS)平台。为了确定GenoLab M的性能,研究者提出了一份报告,以对GenoLab M测序仪的WGS和WES测序数据进行基准测试,并将GenoLab M测序仪与NovaSeq 6000和NextSeq 550平台在各种类型的分析中进行比较。对于WGS,来自Illumina NovaSeq平台并由GATK管道处理的30×测序目前被认为是黄金标准。该数据集是作为本研究的基准数据的。
2014年,瓶中基因组(GIAB)发布了金标准基因型数据集(包括参考样本NA12878),为比较变异检测流程的差异提供了资源。最近,一些研究使用GIAB变异数据集来比较不同变异检测工具或测序平台。一般来说,WGS和WES的数据深度分别在30倍和100倍以上。本研究获得了从多个测序平台生成的NA12878标准样品的WES和WGS数据集,包括NextSeq 550,NovaSeq 6000和GenoLab M。
在分析部分,选择了两个管道:
Sentieon DNAscope管道,基于机器学习(ML)的变体调用工作流(https://github.com/Sentieon/sentieon-dnascope-ml)和DNAseq工作流,这是一个加速的GATK重新实现。
测序流程
图2 三个平台、两个分析流程比较流程图
图3 GenoLab M 和 NovaSeq 6000 在 NA12878 样本 33X 和 22X 覆盖率下的变异调用性能比较。A SNP 和 B InDel 在全基因组上的表现,C SNP 和 D InDel F-score 在分层区域上的表现。精确度(阳性预测值)是检索到的实例中相关实例的比例,召回率(灵敏度)是检索到的相关实例的比例。F-score 是精确度和召回率的调和平均值,chr 20 表示 20 号染色体,NIADR 表示不在所有困难区域,SDR 表示片段重复区域。
在该研究中,GenoLab M的平均Q20比NovaSeq 6000略低,但在相同的测序深度下,GenoLab M重复率比Novaseq 6000低一半,并且22×的WGS的准确度高于22×NovaSeq准确度,并达到了33×NovaSeq相似的性能。
图4 Sentieon的作用
Sentieon软件团队拥有丰富的软件开发及算法优化工程经验,致力于解决生物数据分析中的速度与准确度瓶颈,为来自于分子诊断、药物研发、临床医疗、人群队列、动植物等多个领域的合作伙伴提供高效精准的软件解决方案,共同推动基因技术的发展。 截至2023年3月份,Sentieon已经在全球范围内为1300+用户提供服务,被世界一级影响因子刊物如NEJM、Cell、Nature等广泛引用,引用次数超过700篇。此外,Sentieon连续数年摘得了Precision FDA、Dream Challenges等多个权威评比的桂冠,在业内获得广泛认可。
文献讨论
图5 文献结论
总结
综上所述,对于WGS,GeneMind测序平台中的22X与Illumina NovaSeq 6000 33X深度相似,这提供了一种有效的替代方案。而GenoLab M的100X WES在相同深度下表现出与Illumina平台相似或优越的性能,在WES中也具有应用前景。