【 10X summary report】怎么看?詳細解讀筆記

報告內容

在開始正式的分析之前,需要查看在對齊和計數過程中生成的任何總結統計信息。下圖是由Cell Ranger工具創建的10X總結報告,在從10X scRNA-seq實驗生成計數矩陣時會生成。

?The left half of the report describes sequencing and mapping statistics. One thing to note is the “sequencing saturation”, which estimates the proportion of mRNA transcripts that has been sequenced. This is calculated by downsampling the mean number of reads per cell and obtaining the corresponding number of UMIs (nUMI). The relationship between the number of UMIs obtained against the number of reads is then extrapolated to the asymptote, which corresponds to 100% saturation. A low sequencing saturation implies that deeper sequencing will likely recover more UMIs. That said, some preliminary analysis should first be performed to determine if the current number of UMIs recovered is able to answer the biological questions of interest. Also, check that a high percentage of reads are mapped to the genome, which indicates low amounts of contamination.

The top-right portion of the report plots the nUMI captured in each droplet / barcode, with the droplets ordered in decreasing nUMI from left to right. On the left side of the plot, droplets have very high nUMI and are likely to contain cells. As we scan through the droplets towards the right, we eventually encounter a “knee point” where there is a drastic drop in the nUMI. This likely signifies a transition from observing cell-containing droplets to droplets containing cell debris or no cells at all. Droplets that are deemed by Cell Ranger to contain cells are coloured blue here and the algorithm tends to include slightly more cells beyond the plot shoulder. These cells with smaller nUMIs will have to be removed in the quality control step.

From the summary report, there is another important observation: the nUMI does not correspond to the number of reads per cell. Recall that this is because reads with the same UMI originated from a single mRNA molecule and is thus treated as a single UMI count . Thus, the number of counts i.e.?nUMI is usually only a fraction (about 1/8 to 1/3) of the number of reads.

?下圖為本人使用CellRanger V5.2.0對語一個單細胞數據跑出的結果

報告解讀

細胞和基因數目的評估

  1. Estimated number of cells - 樣本測到的細胞數
  2. Mean reads per cell - 每個細胞測到的平均reads
  3. Median genes per cell - 每個細胞基因數的中位數

Sequencing中

Number of reads - 測到的總read數目

Valid barcodes - UMI校正后匹配的UMI數量

Sequencing saturation:測序飽和度。一般60-80%比較合適(閾值范圍可以適當調整,但是高于70%或80%左右絕對OK)。如果測到的細胞數多,但是每個細胞里面的平均reads數少,那么飽和度就不高,反之,飽和度高。但也不是越高越好,背后原理是抽樣的原理,到達80%左右就可以代表整個樣本了。

Q30 bases in barcode - 基于barcode的分數,大于30的比率

Q30 bases in RNA read - 基于RNA read的分數,大于30的比率

Q30 bases in UMI - 基于UMI的分數,大于30的比率

認為要一般要大于65%,少于這個比例的話,這個頁面會報錯,

Mapping結果

  1. Reads mapped to genome - 比對到選定基因組的reads
  2. Reands mapped confidently to genome - 僅僅比對到基因組的reads,如果一條reads既可以比對到外顯子區又可以比對到非外顯子區,那么算比對到了其中一個外顯子區
  3. Reads mapped confidently to intergenic regions - 比對到基因組的基因間區域
  4. Reads mapped confidently to intronic regions - 比對到內含子區域
  5. Reads mapped confidently to exonic regions - 比對到外顯子區域
  6. Reads mapped confidently to transcriptome - 比對到轉錄組的reads,這些讀數可以用來UMI的計數
  7. Reads mapped antisense to gene - 比對到基因的相反的reads

細胞數目評估Cells圖

橫軸是barcodes,縱軸是UMI數量。通過barcode上的UMI標簽分布來評估細胞數目,深藍色代表細胞,灰色代表背景。

在前期磁珠(bead)與細胞形成油包水的結構過程中,會存在沒有把細胞包進去的情況,這時候的油包水結構里面就只有磁珠和一些barcode的序列,而cDNA的堿基序列一般都是barcode堿基序列的10倍以上,就是由此來確定哪些是真實的細胞,哪些是background。

其他指標

  1. Estimated number of cells - 樣本測到的細胞數
  2. Fraction reads in cells - valid-UMI的質量分數,代表與細胞相關的UMI可靠地比對到基因組,一般要在70%及以上,否則數據質量就不好
  3. Mean reads per cell - 每個細胞測到的平均reads
  4. Median genes per cell - 每個細胞的基因數中位數
  5. Total genes detected - 測到的總基因數,至少有一條UMI
  6. Median UMI counts per cell - 細胞UMI數量的中間值

飽和度評估

  1. 對reads抽樣,觀察不同抽樣條件下檢測到的轉錄本數量占檢測到的所有轉錄本的比例。(如果曲線末端區域平滑,說明測序接近飽和,再增加測序量,覆蓋到的轉錄本數目也不會變化太多。)
  2. 對reads抽樣,觀察不同測序數據量情況下檢測到的基因數目的分布。(如果曲線末端區域平滑,說明測序接近飽和,再增加測序量,檢測到的基因數目也不會變化太多。)

Reference

[1] A Guide to Analyzing Single-cell Datasets,?John F. Ouyang, January 2023

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/716330.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/716330.shtml
英文地址,請注明出處:http://en.pswp.cn/news/716330.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

賣wordpress網站模板的網站

WP模板牛 http://www.wpniu.com 上面有很多免費wordpress模板資源的網站,除了免費模板,還有付費模板。 My模板(我的模板) http://www.mymoban.com 老牌網站模板資源站,上面有wordpress模板、帝國CMS模板、WooCommerce模板可以直接免費下載…

Linux whois命令教程:查詢域名所有者信息(附案例詳解和注意事項)

Linux whois命令介紹 whois命令是一個用于查詢域名所有者信息的工具。它可以直接從命令行進行查詢,這對于沒有圖形用戶界面的系統或者需要在shell腳本中進行查詢的情況非常有用。 Linux whois命令適用的Linux版本 whois命令在大多數Linux發行版中都可以使用&…

C++之stack

1、stack簡介 stack是實現的一個先進后出,后進先出的容器。它只有一個出口,只能操作最頂端元素。 2、stack庫函數 (1)push() //向棧壓入一個元素 (2)pop() //移除棧頂元素 (3…

基于springboot+vue的中國陜西民俗網

博主主頁:貓頭鷹源碼 博主簡介:Java領域優質創作者、CSDN博客專家、阿里云專家博主、公司架構師、全網粉絲5萬、專注Java技術領域和畢業設計項目實戰,歡迎高校老師\講師\同行交流合作 ?主要內容:畢業設計(Javaweb項目|小程序|Pyt…

在 Angular 中使用 Renderer2

Renderer2 類 Renderer2 類是 Angular 提供的一個抽象服務,允許在不直接操作 DOM 的情況下操縱應用程序的元素。這是推薦的方法,因為它使得更容易開發可以在沒有 DOM 訪問權限的環境中渲染的應用程序,比如在服務器上、在 Web Worker 中或在原…

Java如何剪切視頻

背景:如何使用Java批量切割視頻 FFmpeg 是一個強大的開源多媒體處理工具,被廣泛應用于音視頻的錄制、轉碼、編輯等方面。它支持幾乎所有主流的音視頻格式,能夠在各種操作系統平臺上運行,包括 Windows、macOS 和 Linux。FFmpeg 提…

nginx,php-fpm

一,Nginx是異步非阻塞多進程,io多路復用 1、master進程:管理進程 master進程主要用來管理worker進程,具體包括如下4個主要功能: (1)接收來自外界的信號。 (2)向各worker進…

SAP PP學習筆記04 - BOM2 -通過Serial來做簡單的BOM變式配置,副明細,BOM狀態,BOM明細狀態,項目種類,遞歸BOM

本章繼續講BOM。 本章講通過Serial來做簡單的BOM變式配置。還講了BOM的相關概念:副明細,BOM狀態,BOM明細狀態,項目種類,遞歸BOM 等。 1,通過Serial(序列號)來做簡單的 VC&#xff0…

spring自定義注解之-ElementType.METHOD方法級注解聲明

自定義注解類型和常用場景 可以參考之前的文章 : ElementType.FIELD字段級注解聲明 如果在項目中,多處地方都需調用到同一個方法進行邏輯處理,且與方法的業務邏輯無關,比如監控,日志等,則可用自定義的方法…

【JavaSE】面向對象——繼承性

繼承性 繼承性的概念 所謂繼承,就是程序猿在保持原有類特性的基礎上進行擴展,增加新功能,這樣的類被稱為派生類或者子類,原有類被稱為超類或者基類。 在對于繼承性概念進行書寫前,我曾查閱許多資料來保證對其表達的…

Some collections -- 2024.3

一、TensorFlow Android (dataset: Mnist) We used TensorFlow to define and train our machine learning model, which can recognize handwritten numbers, called a number classifier model in machine learning terminology. We transform the trained TensorFlow mod…

C++學習第五天(內存管理)

1、內存分布 int globalVar 1; static int staticGlobalVar 1; void Test() {static int staticVar 1;int localVar 1;int num1[10] { 1, 2, 3, 4 };char char2[] "abcd";const char* pChar3 "abcd";int* ptr1 (int*)malloc(sizeof(int) * 4);int…

2024.03.01作業

1. 基于UDP的TFTP文件傳輸 #include "test.h"#define SER_IP "192.168.1.104" #define SER_PORT 69 #define IP "192.168.191.128" #define PORT 9999enum mode {TFTP_READ 1,TFTP_WRITE 2,TFTP_DATA 3,TFTP_ACK 4,TFTP_ERR 5 };void get_…

高維中介數據:基于交替方向乘子法(ADMM)的高維度單模態中介模型的參數估計(入門+實操)

全文摘要 用于高維度單模態中介模型的參數估計,采用交替方向乘子法(ADMM)進行計算。該包提供了確切獨立篩選(SIS)功能來提高中介效應的敏感性和特異性,并支持Lasso、彈性網絡、路徑Lasso和網絡約束懲罰等不…

npm 鏡像源切換與設置

項目背景 依賴安裝中斷或響應特別慢。 可以看到當前所用的鏡像是 https://registry.npmjs.org 。 切換淘寶鏡像之后總算能夠安裝下來 命令行模式 查看當前鏡像源 # 查看當前鏡像源 npm config get registry 可以看到默認情況下是官方默認全局鏡像 https://registry.npmjs.o…

競爭加劇下,登頂后的瑞幸該做什么?

瑞幸咖啡僅用短短18個月時間從品牌創立到納斯達克上市,刷新全球最快上市記錄。2020年因交易造假事件被勒令退市股價暴跌80%,有人說這個創造了赴美IPO奇跡的“巨嬰”將是下一個倒下的ofo。2023年瑞幸咖啡以逆勢超速增長領跑咖啡賽道有力回應了市場的質疑&…

Vector中的begin和end函數是左閉右開的區間

vector::end() 函數的語法 vector::end(); 參數&#xff1a; none——它什么都不接受。 返回值&#xff1a; iterator– 它返回一個指向向量的 past-the-end 元素的迭代器。 實際上Vector中的begin和end函數是左閉右開的區間。 例&#xff1a; Input: vector<int>…

Java多線程實現發布和訂閱

目錄 簡介 步驟 1: 定義消息類 步驟 2: 創建發布者 步驟 3: 創建訂閱者 步驟 4: 實現發布-訂閱模型 前言-與正文無關 生活遠不止眼前的苦勞與奔波&#xff0c;它還充滿了無數值得我們去體驗和珍惜的美好事物。在這個快節奏的世界中&#xff0c;我們往往容易陷入工作的漩渦…

棋牌室計時計費管理系統的燈控器連接教程

棋牌室計時計費管理系統的燈控器連接教程 一、前言 以下教程以 佳易王棋牌室計時計費管理系統軟件V18.0為例說明 軟件文件下載可以點擊最下方官網卡片——軟件下載——試用版軟件下載 如上圖&#xff0c;計時計費軟件在開始計時的時候&#xff0c;點擊 開始計時 如果連接了…

YOLOv9獨家改進|動態蛇形卷積Dynamic Snake Convolution與空間和通道重建卷積SCConv與RepNCSPELAN4融合

專欄介紹&#xff1a;YOLOv9改進系列 | 包含深度學習最新創新&#xff0c;主力高效漲點&#xff01;&#xff01;&#xff01; 一、改進點介紹 Dynamic Snake Convolution是一種針對細長微弱的局部結構特征與復雜多變的全局形態特征設計的卷積模塊。 SCConv是一種即插即用的空間…