關鍵詞:基準與方法研究;基因測序;變異檢測;
文獻簡介
- 標題(英文):Accuracy benchmark of the GeneMind GenoLab M sequencing platform for WGS and WES analysis
- 標題(中文):GeneMind 公司的 GenoLab M 測序平臺 WGS 和 WES 數據基準測試
- 發表期刊:BMC Genomics
- 作者單位:深圳真邁生物科技有限公司
- 發表年份:2022
- 文章地址:https://doi.org/10.1186/s12864-022-08775-3
圖1 文獻介紹
GenoLab M是GeneMind Biosciences最近開發的下一代測序(NGS)平臺。為了確定GenoLab M的性能,研究者提出了一份報告,以對GenoLab M測序儀的WGS和WES測序數據進行基準測試,并將GenoLab M測序儀與NovaSeq 6000和NextSeq 550平臺在各種類型的分析中進行比較。對于WGS,來自Illumina NovaSeq平臺并由GATK管道處理的30×測序目前被認為是黃金標準。該數據集是作為本研究的基準數據的。
2014年,瓶中基因組(GIAB)發布了金標準基因型數據集(包括參考樣本NA12878),為比較變異檢測流程的差異提供了資源。最近,一些研究使用GIAB變異數據集來比較不同變異檢測工具或測序平臺。一般來說,WGS和WES的數據深度分別在30倍和100倍以上。本研究獲得了從多個測序平臺生成的NA12878標準樣品的WES和WGS數據集,包括NextSeq 550,NovaSeq 6000和GenoLab M。
在分析部分,選擇了兩個管道:
Sentieon DNAscope管道,基于機器學習(ML)的變體調用工作流(https://github.com/Sentieon/sentieon-dnascope-ml)和DNAseq工作流,這是一個加速的GATK重新實現。
測序流程
圖2 三個平臺、兩個分析流程比較流程圖
圖3 GenoLab M 和 NovaSeq 6000 在 NA12878 樣本 33X 和 22X 覆蓋率下的變異調用性能比較。A SNP 和 B InDel 在全基因組上的表現,C SNP 和 D InDel F-score 在分層區域上的表現。精確度(陽性預測值)是檢索到的實例中相關實例的比例,召回率(靈敏度)是檢索到的相關實例的比例。F-score 是精確度和召回率的調和平均值,chr 20 表示 20 號染色體,NIADR 表示不在所有困難區域,SDR 表示片段重復區域。
在該研究中,GenoLab M的平均Q20比NovaSeq 6000略低,但在相同的測序深度下,GenoLab M重復率比Novaseq 6000低一半,并且22×的WGS的準確度高于22×NovaSeq準確度,并達到了33×NovaSeq相似的性能。
圖4 Sentieon的作用
Sentieon軟件團隊擁有豐富的軟件開發及算法優化工程經驗,致力于解決生物數據分析中的速度與準確度瓶頸,為來自于分子診斷、藥物研發、臨床醫療、人群隊列、動植物等多個領域的合作伙伴提供高效精準的軟件解決方案,共同推動基因技術的發展。 截至2023年3月份,Sentieon已經在全球范圍內為1300+用戶提供服務,被世界一級影響因子刊物如NEJM、Cell、Nature等廣泛引用,引用次數超過700篇。此外,Sentieon連續數年摘得了Precision FDA、Dream Challenges等多個權威評比的桂冠,在業內獲得廣泛認可。
文獻討論
圖5 文獻結論
總結
綜上所述,對于WGS,GeneMind測序平臺中的22X與Illumina NovaSeq 6000 33X深度相似,這提供了一種有效的替代方案。而GenoLab M的100X WES在相同深度下表現出與Illumina平臺相似或優越的性能,在WES中也具有應用前景。