生信軟件47 - 超低測序深度的全基因組測序cfDNA腫瘤分數估計工具ichorCNA

1. ichorCNA簡介

ichorCNA是一種用于估計來自超低測序深度的全基因組測序(ULP-WGS,0.1x覆蓋率)的cfDNA中腫瘤分數的工具。ichorCNA使用概率模型,應用隱馬爾可夫模型(HMM),以同時分割基因組,預測大范圍的拷貝數變化,并估計超低深度全基因組測序樣本的腫瘤分數。ichorCNA針對樣品的超低深度(~0.1x)測序進行了優化,并且已經使用患者和健康供體cfDNA樣品進行了基準測試。

ichorCNA分析工作流包括2個任務:

(1)GC含量偏倚校正(使用HMM copy),從ULP-WGS計算reads覆蓋率,數據校正和標準化;

(2)CNA預測和cfDNA的腫瘤分數的估計。

2. 軟件安裝

########## 推薦安裝 #########
# R包安裝,軟件是否升級,選擇3: None
install.packages("devtools")
devtools::install_github("broadinstitute/ichorCNA")########## 手動安裝(R≥3.6.0) #########
git clone git@github.com:broadinstitute/ichorCNA.git  install.packages("plyr") # 安裝依賴包
BiocManager::install("HMMcopy")  
BiocManager::install("GenomeInfoDb")  
BiocManager::install("GenomicRanges")  # SHELL
R CMD INSTALL ichorCNA   

3. 軟件用法

ichorCNA可用于告知腫瘤來源的DNA的存在或不存在,并指導進行全外顯子組或更深的全基因組測序的決定。此外,腫瘤分數的定量估計可用于校準期望的測序深度,以達到用于鑒定游離DNA中的突變的統計。

教程: https://github.com/broadinstitute/ichorCNA/wiki

圖示

3.1 生成讀取計數文件

使用HMMcopy套件中的readCounter生成讀取計數覆蓋率信息;從ULP-WGS BAM創建WIG文件,使用HMMcopy的readCounter工具。 下面示例將創建跨所有染色體具有1 Mb箱的WIG文件,并且僅包括具有大于20的比對質量的reasd。

# BAM索引
samtools index tumor.bam# raeds計數
/HMMcopy/bin/readCounter --window 1000000 --quality 20 \
--chromosome "1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21,22,X,Y" \
tumor.bam > tumor.wig

3.2 CNV分析和腫瘤分數的預測

使用ichorCNA R軟件包的拷貝數分析和腫瘤分數的預測,runIchorCNA.R R腳本位于ichorCNA/scripts/目錄中。

Rscript /ichorCNA/scripts/runIchorCNA.R \
--id tumor_sample \
--WIG tumor.wig \
--ploidy "c(2,3)" \
--normal "c(0.5,0.6,0.7,0.8,0.9)" \
--maxCN 5 \
--gcWig /ichorCNA/inst/extdata/gc_hg19_1000kb.wig \  # GC含量wig文件
--mapWig /ichorCNA/inst/extdata/map_hg19_1000kb.wig \  # 比對分蘇的wig文件
-centromere /ichorCNA/inst/extdata/GRCh37.p13_centromere_UCSC-gapTable.txt \  # 包含著絲粒位置的文件
--normalPanel /ichorCNA/inst/extdata/HD_ULP_PoN_1Mb_median_normAutosome_mapScoreFiltered_median.rds \   # normal面板的中值矯正深度
--includeHOMD False \
--chrs "c(1:22, \"X\")" \ # 指定分析的染色體
--chrTrain "c(1:22)" \    # 指定用于估計參數的染色體
--estimateNormal True \
--estimatePloidy True \
--estimateScPrevalence True \
--scStates "c(1,3)" \
--txnE 0.9999 \
--txnStrength 10000 \
--outDir ./  # 輸出目錄

3.3 創建自定義的參考面板(可選)

https://github.com/broadinstitute/ichorCNA/wiki/Create-Panel-of-Normals

ichorCNA 可以在沒有任何參考面板的情況下運行。作者提供了一個帶有 ichorCNA 的正常組 (PoN),但使用與你的癌癥患者 cfDNA 樣本類似的處理和測序的樣本生成你自己的樣本可能會降低噪音并提高準確性。這些數據有助于進一步標準化癌癥患者的 cfDNA,以糾正由文庫構建、測序平臺和 cfDNA 特異性偽影引起的系統性偏差。

3.4 低腫瘤含量樣本(早期疾病)的參數優化

對于預期腫瘤分數低于 5% 的樣品,修改默認設置以改善參數估計可能會有所幫助。對于這些類型的樣品,建議對更高的覆蓋度 (> 1-5x) 進行測序。對于預期腫瘤分數低于 ~0.5% 的樣本,我們建議使用標準深度的全基因組測序(例如 > 20 倍)。

3.4.1 初始化腫瘤分數參數

將非腫瘤(1 減去腫瘤分數)初始化為預期值,例如 5%、1%、0.5%、0.1%。ichorCNA 仍將估計腫瘤分數,但擁有這些初始起始值可以幫助 EM 步驟找到更好的全局最優值。

--normal "c(0.95, 0.99, 0.995, 0.999)"

3.4.2 將初始倍性設置為二倍體

對于低腫瘤分數病例,很難預測倍性值。

--ploidy "c(2)"

3.4.3 減少拷貝數狀態的數量

減少狀態空間將有助于降低復雜性。如果您從先前的樣本(例如腫瘤活檢)中知道存在較大的高水平拷貝數事件,則可以將其設置為 4。

--maxCN 3

3.4.4 不考慮亞克隆拷貝數事件

對于低腫瘤分數,亞克隆事件很難檢測到,這些我們可以關閉。

--estimateScPrevalence FALSE --scStates "c()"

3.4.5 僅訓練和分析常染色體

在分析和訓練中排除 chrX 以降低復雜性。

--chrs "c(1:22)" --chrTrain "c(1:22)"

3.5 snakemake管道

https://github.com/broadinstitute/ichorCNA/wiki/SnakeMake-pipeline-for-ichorCNA

此工作流將從 BAM 文件開始運行 ichorCNA 管道并生成 ichorCNA 輸出。

4 主要輸出文件

<sampleID>.seg : 由 Viterbi 算法調用的 Segment。格式與 IGV 兼容。<sampleID>.seg.txt: 與 <sampleID>.seg 相同,但還包括節段的亞克隆狀態(0 = 克隆,1 = 亞克隆)。格式與 IGV 不兼容。<sampleID>.cna.seg: 每個 bin/窗口的估計拷貝數、日志比率和子克隆狀態。<sampleID>.correctedDepth.txt: 校正 GC 和可映射性偏差后每個 bin/window 的 Log2 比率。<sampleID>.RData: ichorCNA 完成后保存的 R 圖像。將包括所有解決方案的結果。<sampleID>/<sampleID>_CNA_chr#.pdf: 每條染色體的拷貝數圖。<sampleID>/<sampleID>_bias.pdf: 說明 GC 和可映射性偏差校正之前/之后的數據的圖表。<sampleID>/<sampleID>_correct.pdf:GC 和可映射性偏差校正之前/之后的全基因組數據圖。<sampleID>/<sampleID>_genomeWide_n##-p#.pdf:用 n 和 p 初始化的溶液的估計拷貝數、腫瘤分數和倍性注釋的數據全基因組圖。p=腫瘤倍性<sampleID>/<sampleID>_genomeWide.pdf:全基因組數據圖,注釋了估計的拷貝數、腫瘤分數和倍性,以獲得最佳解決方案。<sampleID>/<sampleID>_tpdf.pdf:使用來自最優解的收斂參數繪制每個拷貝數狀態的 students-t 分布圖。Tumor Fraction 腫瘤分數,腫瘤來源的DNA的估計分數。相當于大量腫瘤分析中的純度。Tumor Ploidy 腫瘤倍性,腫瘤來源基因組的平均拷貝數。總體樣本倍性為 2 * (1 - tumor.fraction) + tumor.fraction * tumor.ploidy。

參考文獻:
Adalsteinsson, Ha, Freeman, et al. Scalable whole-exome sequencing of cell-free DNA reveals high concordance with metastatic tumors. (2017) Nature Communications Nov 6;8(1):1324. doi: 10.1038/s41467-017-00965-y

生信軟件文章推薦

生信軟件1 - 測序下機文件比對結果可視化工具 visNano

生信軟件2 - 下游比對數據的統計工具 picard

生信軟件3 - mapping比對bam文件質量評估工具 qualimap

生信軟件4 - 拷貝數變異CNV分析軟件 WisecondorX

生信軟件5 - RIdeogram包繪制染色體密度圖

生信軟件6 - bcftools查找指定區域的變異位點信息

生信軟件7 - 多線程并行運行Linux效率工具Parallel

生信軟件8 - bedtools進行窗口劃分、窗口GC含量、窗口測序深度和窗口SNP統計

生信軟件9 - 多公共數據庫數據下載軟件Kingfisher

生信軟件10 - DNA/RNA/蛋白多序列比對圖R包ggmsa

生信軟件11 - 基于ACMG的CNV注釋工具ClassifyCNV

生信軟件12 - 基于Symbol和ENTREZID查詢基因注釋的R包(easyConvert )

生信軟件13 - 基于sambamba 窗口reads計數和平均覆蓋度統計

生信軟件14 - bcftools提取和注釋VCF文件關鍵信息

生信軟件15 - 生信NGS數據分析強大的工具集ngs-bits

生信軟件16 - 常規探針設計軟件mrbait

生信軟件17 - 基于fasta文件的捕獲探針設計工具catch

生信軟件18 - 基于docker部署Web版 Visual Studio Code

生信軟件19 - vcftools高級用法技巧合輯

生信軟件20 - seqkit+awk+sed+grep高級用法技巧合輯

生信軟件21 - 多線程拆分NCBI-SRA文件工具pfastq-dump

生信軟件22 - 測序數據5‘和3‘端reads修剪工具sickle

生信軟件23 - Samtools和GATK去除PCR重復方法匯總

生信軟件24 - 查詢物種分類學信息和下載基因組TaxonKit和ncbi-genome-download

生信軟件25 - 三代測序數據靈敏比對工具ngmlr

生信軟件26 - BWA-MEM比對算法性能更好的bwa-mem2

生信軟件27 - 基于python的基因注釋數據查詢/檢索庫mygene

生信軟件28 - fastq與bam的reads數量計算與雙端fastq配對檢測工具fastq-pair

生信軟件29 - 三代數據高效映射精確的長讀段比對工具mapquik

生信軟件30 - 快速單倍型分析工具merlin

生信軟件31 - Bcftools操作VCF/BCF文件高級用法合集

生信軟件32 - 變異位點危害性評估預測工具合集

生信軟件33 - Wgsim生成雙端(PE) fastq模擬數據

生信軟件34 - 大幅提升Python程序執行效率的工具Pypy

生信軟件35 - AI代碼編輯器Cursor

生信軟件36 - SAM/BAM/CRAM文件插入SNV/INDEL/SV工具Bamsurgeon

生信軟件37 - 基于測序reads變異進行單倍型分型工具WhatsHap

生信軟件38 - 基因型填充軟件IMPUTE2

生信軟件39 - GATK最佳實踐流程重構,提高17倍分析速度的LUSH流程

生信軟件40 - bedtools經典使用方法合集

生信軟件41 - GATK經典使用方法合集

生信軟件42 - 科研繪圖R包神器tidyplots

生信軟件43 - iGenomes批量下載Ensembl、NCBI、GATK和UCSC參考基因組和注釋文件資源

生信軟件44 - 比PyVCF更高效的VCF解析Python庫cyvcf2

生信軟件45 - 遺傳變異分析工具GEMINI

生信軟件46 - 三代測序低深度全基因組測序結構變異SV檢測工具NanoVar

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/86531.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/86531.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/86531.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Python 解壓縮(支持.zip/.rar/.7z格式)

&#x1f91f;致敬讀者 &#x1f7e9;感謝閱讀&#x1f7e6;笑口常開&#x1f7ea;生日快樂?早點睡覺 &#x1f4d8;博主相關 &#x1f7e7;博主信息&#x1f7e8;博客首頁&#x1f7eb;專欄推薦&#x1f7e5;活動信息 文章目錄 Python 解壓縮&#xff08;支持.zip/.rar/.7…

龍虎榜——20250627

上證指數放量收陰線&#xff0c;回踩5天均線&#xff0c;但個股總體漲多跌少。 深證指數縮量收十字星&#xff0c;在前期壓力位震蕩。 2025年6月27日龍虎榜行業方向分析 1. 金融科技&#xff08;跨境支付數字安全&#xff09; 代表標的&#xff1a;吉大正元&#xff08;跨境認…

三步實現B站緩存視頻轉MP4格式

本期我們來實現如何將B站緩存的視頻轉成MP4格式&#xff0c;直接在本地播放。 首先我們在Bilibili客戶端緩存一個視頻&#xff0c;保存的文件如下&#xff1a; 這里有兩個m4s文件&#xff0c;大的哪個是視頻文件&#xff0c;小的是音頻文件&#xff0c;這里我們用視頻播放軟件…

MySQL 與 Oracle 事務:深度解析與全面對比

在數據庫管理領域&#xff0c;事務是確保數據一致性和完整性的核心機制&#xff0c;它允許用戶將一系列操作視為一個不可分割的整體&#xff0c;要么全部成功執行&#xff0c;要么全部回滾。MySQL 和 Oracle 作為兩款廣泛使用的關系型數據庫管理系統&#xff0c;它們在事務處理…

麒麟系統如何輸出啟動日志到串口

1、臺式機系統啟動日志輸出到串口 &#xff08;1&#xff09;GRUB配置 編輯GRUB配置文件&#xff08;如/etc/default/grub&#xff09;&#xff0c;添加或修改以下參數&#xff1a; GRUB_CMDLINE_LINUX“consoletty0 consolettyS0,115200n8” tty0&#xff1a;表示將日志輸出…

JUC:2棧和棧幀的定義

這部分內容雖然是JVM中的定義&#xff0c;但是在juc中屬于底層知識&#xff0c;必須要學習 每個線程在創建時&#xff0c;就會將自身的資源存儲在棧中&#xff0c;將線程需要運行的方法存放在方法區。 棧中會存儲方法的局部變量、方法的參數以及方法返回的地址&#xff0c;這…

阿里云OSS上傳文件Utils (@PostConstruct注解配置+Environment )

首先在 application.yaml 配置bucketName, endpoint, accessKeyId, accessKeySecret這里利用的是 spring 的生命周期, 在 bean 實例化后,使用PostConstruct注解 Environment 屬性 進行spring上下文環境賦值 package com.shuai.utils;import com.aliyun.oss.*; import com.aliy…

Jetson家族橫向對比:如何選擇你的邊緣計算設備

Jetson家族橫向對比&#xff1a;如何選擇你的邊緣計算設備 一、邊緣計算設備選型核心維度 在選擇Jetson平臺前&#xff0c;需明確以下關鍵指標&#xff1a; 算力需求&#xff1a;TOPS(INT8) / FP16精度功耗限制&#xff1a;被動散熱/主動散熱接口擴展&#xff1a;CSI攝像頭數…

《聊一聊ZXDoc》之汽車服務導向SOME/IP

ZXDoc支持SOME/IP功能&#xff0c;通過服務導向架構實現跨域通信標準化&#xff0c;降低系統耦合&#xff0c;支持動態服務發現與調用&#xff0c;提升分布式系統擴展性和維護效率。 什么是SOME/IP&#xff1f; SOME/IP&#xff08;Scalable service-Oriented MiddlewarE ov…

Learning Semantic-Aware Knowledge Guidance for Low-Light Image Enhancement 論文閱讀

學習語義感知知識引導用于低光照圖像增強 摘要 低光圖像增強&#xff08;LLIE&#xff09;研究如何改善照明并生成正常光照的圖像。大多數現有方法通過全局和均勻的方式改進低光圖像&#xff0c;而沒有考慮不同區域的語義信息。如果沒有語義先驗&#xff0c;網絡可能會容易偏…

【(Topk問題及其二叉樹遍歷】

Topk問題及其二叉樹遍歷 1.Topk問題2.二叉樹的前序&#xff0c;中序&#xff0c;后序3.求二叉樹的個數&#xff08;TreeSize&#xff09;。4.求二叉樹的最大深度&#xff08;maxDepth&#xff09;。5.求二叉樹的第K層的節點個數&#xff08;TreeKLevel&#xff09;。6.查找二叉…

AI+實時計算如何賦能金融系統?DolphinDB 在國泰君安期貨年度中期策略會的演講

6月25日&#xff0c;國泰君安期貨2025年度中期策略會在上海順利開幕。本次策略會以“觀勢明變&#xff0c;本固枝榮”為主題&#xff0c;特邀15位重量級行業嘉賓和52位明星分析師發表精彩觀點&#xff0c;DolphinDB 受邀出席會議并作主題演講。 實時計算如何賦能量化投研交易 …

PHP Protobuf 手寫生成器,

? 以下是一個純 PHP 編寫的通用 Protobuf 二進制生成器&#xff0c;支持&#xff1a; varint fixed32 fixed64 length-delimited&#xff08;如字符串、嵌套 message&#xff09; 嵌套結構 (nested) 多字段 repeated ? 封裝器代碼&#xff08;可直接用&#xff09; &…

喜訊 | Mediatom斬獲2025第十三屆TopDigital創新營銷獎「年度程序化廣告平臺」殊榮

6月27日&#xff0c;2025第十三屆TopDigital創新營銷盛典在上海圓滿落幕&#xff0c;TopDigital創新營銷獎獲獎結果也已正式揭曉。本屆TopDigital創新營銷獎共有694家參展企業&#xff0c;3326件案例&#xff0c;AdMergeX旗下Mediatom媒體變現SaaS及服務平臺在眾多作品中脫穎而…

SQL 中 EXISTS 的原理與作用詳解

平常也一直在用EXISTS 來進行邏輯判斷&#xff0c;但是從來沒有正經理解它&#xff0c;只知道找到有就返回True&#xff0c;沒有就返回False。那么今天詳細的理解一下&#xff08;主要借鑒了CSDN 其他博客文章&#xff0c;以及自己做的一個小例子&#xff09; 一、EXISTS是什么…

【Docker】解決:構建(docker build)或重新運行容器時,丟失apt-get update問題

一、解決&#xff1a;構建&#xff08;docker build&#xff09;或重新運行容器時&#xff0c;丟失apt-get update問題 在 Docker 容器中&#xff0c;每次構建&#xff08;docker build&#xff09;或重新運行容器時&#xff0c;默認情況下所有更改都會丟失&#xff0c;因為容…

流程管理系統方案成本評估報告(第一稿,復盤明確數據不準確,僅供參考哦)

??一、成本評估框架?? 所在制造業流程數字化轉型的成本需從??一次性投入??與??持續運營成本??兩個維度分析,并量化??直接收益??與??間接收益??。詳細評估模型初稿: ??二、成本構成與數據支撐?? ??1. 一次性投入成本?? ??項目????費用范圍…

高并發分布式鎖解決方案對比與選型指南

高并發分布式鎖解決方案對比與選型指南 在大規模分布式系統中&#xff0c;分布式鎖是確保資源互斥訪問、保證數據一致性的關鍵組件。針對不同業務場景&#xff0c;分布式鎖的實現方案多種多樣&#xff0c;各有優缺點。本文將從問題背景出發&#xff0c;對Redis原生鎖/RedLock、…

全面掌握Vue 3響應式:ref自動解包、reactive對象替換及響應式丟失問題

Vue 3的響應式系統是其最核心的特性之一&#xff0c;主要通過ref和reactive這兩個API來實現。本文將詳細介紹這兩個API的使用方法、區別以及最佳實踐。 1. ref()的基本使用 ref()用于創建一個響應式的數據引用。它可以包裝任何類型的值&#xff0c;包括基本類型和對象類型。 …

【科普】 AI大模型應用架構圖大全

AI大模型應用架構圖大全 AI大模型技術全景視圖&#xff1a; AI大模型通用技術架構圖 AI大模型通用技術架構圖 AI大模型通用技術架構圖 RAG知識庫業務架構圖 AI農業大模型技術架構圖 AI導購大模型技術架構圖 AI導購大模型技術架構圖 AI大模型合規風控管理架構圖 AI大模型合規管…