前言
轉錄組測序(RNA-seq)是當下最流行的二代測序(NGS)方法之一,使科研工作者實現在轉錄水平上定量、定性的研究,它的出現已經革命性地改變了人們研究基因表達調控的方式。然而,轉錄組測序(RNA-seq)其實是廣泛的概念,面對眾多的RNA-Seq技術,常常難以選擇最合適的方法。本文將概述幾種主要的 RNA-Seq 技術,并探討它們的應用和優勢。
轉錄組測序技術(RNA-seq Tech.)
下面的表格比較了幾種常見的 RNA-Seq 測序方法,并對每種方法進行了簡述。熟悉這些技術將有助于我在設計實驗時做出明智的決定。
RNA-Seq分析方法比較
類型 | 目標RNA | RNA選擇方法 | 起始材料 | 相對成本 |
---|---|---|---|---|
mRNA-Seq | mRNA | Poly(A)選擇:利用mRNA尾部的poly(A)尾巴進行分離 | 總RNA、細胞、組織 | 🙂 |
總RNA-Seq | mRNA + lncRNA | 去除核糖體RNA,留下其他類型的RNA | 總RNA、細胞、組織 | 🙂🙂 |
鏈特異性 RNA-Seq | mRNA和/或lncRNA | Poly(A)選擇或rRNA去除 | 總RNA、細胞、組織 | 🙂🙂 |
小RNA-Seq | 小非編碼 RNA(miRNA、siRNA、piRNA) | 尺寸分級分離(通過大小分離小RNA,并連接接頭到5’磷酸用于測序) | 總RNA、細胞、組織 | 🙂🙂 |
超低起始量RNA-Seq | mRNA | Poly(A)選擇 | 總RNA(<500 ng)或細胞(<10,000) | 🙂🙂🙂 |
單細胞RNA-Seq | mRNA | 分離單個細胞后的Poly(A)選擇 補充說明:用于研究單個細胞的基因表達差異。 | 細胞/細胞核 | 🙂🙂🙂🙂 |
Iso-Seq | 全長 mRNA | Poly(A)選擇 | 總RNA | 🙂🙂🙂🙂 |
mRNA = 信使RNA,編碼蛋白質的RNA
lncRNA = 長鏈非編碼RNA,不編碼蛋白質但具有調控功能的RNA
miRNA = 微小RNA,調控基因表達
siRNA = 小干擾RNA,參與RNA干擾
piRNA = Piwi相互作用RNA,與生殖細胞發育相關
rRNA = 核糖體RNA
信使RNA測序 (mRNA-Seq)
在真核生物中,成熟mRNA轉錄本具有5’端帽子結構和3’端多聚腺苷酸尾,可通過poly(A)選擇特異性富集。具體步驟包括:首先提取總RNA,隨后利用寡聚(dT)偶聯的磁珠/柱進行雜交,或使用寡聚(dT)引物進行逆轉錄。由于多聚腺苷酸化的RNA分子在大多數物種中僅占總RNA的1-5%,因此poly(A)選擇后的樣品濃度通常會降低20-100倍。純化的mRNA隨后被轉化為cDNA文庫,并通過PCR擴增以提高文庫濃度。值得注意的是,PCR擴增可能引入偏差,建議使用最少的擴增循環數(通常12-15個循環)。此外,poly(A)選擇可能導致3’端偏差,特別是在RNA部分降解的樣本中。盡管存在這些局限性,poly(A)選擇仍是真核mRNA文庫制備中最經濟且最廣泛使用的方法。
總RNA測序 (Total RNA-Seq)
總RNA-Seq適用于對蛋白質編碼RNA和各類非編碼RNA進行全面分析。這些非編碼RNA包括長鏈非編碼RNA (lncRNA)、環狀RNA (circRNA)和其他調控RNA。特別是lncRNA,它們在基因組中具有重要的表觀遺傳調控功能,但由于很多lncRNA缺乏poly(A)尾,在常規mRNA-Seq中往往被忽略。在總RNA-Seq中,需要先去除占比高達80-90%的核糖體RNA (rRNA)。主要的rRNA去除方法包括:
- Ribo-Zero技術:使用與rRNA互補的生物素化探針;
- RNase H方法:使用DNA寡核苷酸引導RNase H特異性降解rRNA;
- rRNA反義寡核苷酸捕獲法:使用互補序列直接捕獲并去除rRNA;
鏈特異性RNA測序 (Strand-Specific RNA-Seq)
轉錄本的極性信息對于基因功能注釋和轉錄組分析至關重要。由于真核基因組中存在大量重疊基因和反義轉錄本,識別轉錄本的來源鏈可以提供重要的調控信息。然而,在標準RNA-Seq文庫制備過程中,轉錄本的極性信息常常丟失。鏈特異性RNA-Seq通過特殊的文庫制備方法保留了這些關鍵信息。主要的鏈特異性文庫構建方法包括:
- dUTP第二鏈標記法:在第二鏈cDNA合成時加入dUTP,后續選擇性降解含U鏈(如下圖);
- 5’端接頭連接法:利用RNA分子5’端的帽子結構定向連接接頭;
- 3’端接頭連接法:在RNA片段化后進行定向接頭連接;
- 鏈特異性測序可以與mRNA-Seq或總RNA-Seq結合使用,能夠:準確鑒定反義轉錄本;分析重疊基因的表達;研究順式/反式調控元件;提高轉錄組拼接的準確性等;
鏈特異性RNA文庫制備。在第二鏈合成過程中摻入dUTP以及隨后的尿嘧啶特異性消化可以選擇性地保留第一鏈cDNA
小RNA測序 (Small RNA-Seq)
小 RNA,如 microRNA (miRNA) 和小干擾 RNA (siRNA),在基因調控中發揮著重要作用。Small RNA-Seq 通過尺寸分級分離從總 RNA 中選擇小 RNA 進行測序。文庫制備通常包括將測序接頭連接到 Dicer 修飾的小 RNA 5’ 磷酸末端。小 RNA 片段隨后被逆轉錄成 cDNA 并進行測序。由于小 RNA 分子長度較短 (可短至 21 個核苷酸),可以使用較少的測序循環數 (例如 1×50 bp)。
超低起始量RNA測序 (Ultra-Low Input RNA-Seq)
標準 RNA-Seq 方法通常需要大量的完整 RNA (>500 ng)。對于 RNA 產量低或降解的樣品,需要額外的擴增步驟和更高的測序深度以提高數據輸出,但這容易導致轉錄偏差。超低起始量 RNA-Seq 方法能夠選擇性擴增全長轉錄本,同時最大限度地減少偏差,使得研究人員能夠對少量細胞的樣品進行 RNA-Seq。
單細胞RNA測序 (scRNA-Seq)
與傳統的“批量”RNA-Seq 不同,scRNA-Seq 能夠捕獲單個細胞的轉錄組,揭示復雜細胞群體中基因表達的異質性。scRNA-Seq 通常使用微流體(華大、10X等)或微孔技術(華大、BD、新格元等)分離單個細胞,并在文庫制備過程中為每個轉錄本添加唯一的條形碼,以便通過生物信息學分析追溯到其來源細胞。
全長轉錄本測序 (Iso-Seq)
Iso-Seq 技術,例如 PacBio? 開發的平臺,使用長讀長測序技術對全長轉錄本進行測序,無需組裝。 這使得能夠直接識別轉錄本起始位點、多聚腺苷酸化位點和剪接位點。Iso-Seq 可用于表征轉錄組中的所有異構體,其應用包括基因組注釋、基因融合檢測和新異構體的發現。可變剪接導致單個基因編碼多種異構體,這可以通過Iso-Seq有效地進行分析。
選擇指南
選擇合適的 RNA-Seq 測定方法取決于幾個因素,包括:實驗目標、感興趣的 RNA 種類(編碼、非編碼或兩者)
、材料、是否有參考轉錄組等。準確定義生物學問題至關重要,有一個清晰而具體的目標將幫助確定需要哪種類型的 NGS 數據,進而確定哪種 RNA-Seq 方法最合適。 下面是一個簡化的樹,可以輔助決策