Sanger
測序原理 https://v.qq.com/x/page/d0124c0k44t.html
illumina
測序原理: https://v.qq.com/x/page/i0770fd7r9i.html
PacBio
第三代 SMRT 單分子測序 https://v.qq.com/x/page/r03534cry7u.html
Ion torrent
測序原理 https://v.qq.com/x/page/v01754s6r82.html
Oxford Nanopore
https://v.qq.com/x/page/v0746ixokzz.html
好的,以下是根據這份講義內容,對第一、二、三代測序技術相關知識的詳細講解:
一、第一代測序技術(Sanger 測序)
(一)背景與歷史
- 時間:1977 年,Frederick Sanger 和 Coulson 開創了雙脫氧鏈終止法(Sanger 測序法),并完成了第一個噬菌體全基因組的測序。
- 意義:開啟了現代基因測序的時代,為后續的基因組學研究奠定了基礎。
(二)測序原理
- 核心方法:基于 DNA 聚合酶的鏈終止反應。通過在 DNA 合成過程中隨機引入標記了不同熒光染料的雙脫氧核苷酸(ddNTP),使 DNA 鏈在不同位置終止。
- 具體步驟:
- 模板制備:將待測 DNA 片段克隆到合適的載體中,獲得單鏈 DNA 模板。
- 引物退火:加入短的引物,使其與模板 DNA 的互補序列結合。
- 鏈合成與終止:在反應體系中加入 DNA 聚合酶、dNTP(正常脫氧核苷酸)和少量標記了熒光的 ddNTP。DNA 聚合酶從引物開始延伸 DNA 鏈,當隨機遇到一個 ddNTP 時,鏈合成終止。
- 電泳分離與檢測:將反應產物在聚丙烯酰胺凝膠中進行電泳分離,根據熒光標記的 ddNTP 不同,產生不同顏色的熒光信號,通過檢測熒光信號的位置和顏色,確定 DNA 序列。
(三)特點
- 優點:
- 準確性高:單次測序的準確性可達 99.9% 以上,適合對準確性要求極高的應用,如基因組參考序列的構建。
- 讀長較長:單次測序讀長可達 500-1000 個堿基,能夠覆蓋較長的 DNA 片段,減少拼接錯誤。
- 缺點:
- 速度慢:每次測序只能處理一個 DNA 片段,通量低,難以滿足大規模基因組測序的需求。
- 成本高:設備和試劑成本較高,不適合大規模應用。
二、第二代測序技術(Next-Generation Sequencing, NGS)
(一)背景與歷史
- 時間:2005 年左右,隨著 Roche 454 測序儀和 Illumina Solexa 測序儀的推出,第二代測序技術逐漸成熟并廣泛應用。
- 意義:極大地提高了測序通量,降低了測序成本,推動了基因組學研究的快速發展,使大規模基因組測序成為可能。
(二)測序原理(以 Illumina 測序為例)
-
核心方法:基于可逆終止化學和邊合成邊測序(Sequencing by Synthesis, SBS)技術。
-
具體步驟:
-
- 建庫:
- DNA 片段化:將待測 DNA 隨機打斷成一定長度的小片段(如 300bp-800bp)。
- 末端修復與接頭連接:對 DNA 片段的末端進行修復,并連接上特定的接頭序列,使片段能夠固定在測序芯片上。
- 加 index 標簽:為不同樣本的 DNA 添加獨特的 index 標簽,便于后續數據拆分。
- Flowcell 芯片準備:
- 建庫:
Flowcell 的結構
- 通道(Lanes):Flowcell 包含多個通道,每個通道稱為一個 lane。圖中顯示的 flowcell 有八條 lane,意味著可以同時進行八個獨立的測序運行。
- 表面修飾:每個 lane 的表面都經過化學修飾,以便能夠固定 DNA 片段。這些修飾包括大量的引物,如 P7 和 P5 引物,它們與 DNA 文庫上的接頭序列互補,從而能夠固定 DNA 片段。
- Swath 和 Tile:每個 lane 有兩個面,每個面上有三個 swath(區域),每個 swath 包含 16 個 tile(小方格)。因此,每個 lane 總共有 98 個 tile(兩面各 48 個)。整個 flowcell 有 768 個 tile(96 lanes × 8 tiles/lane)。
Flowcell 的功能
-
DNA 固定:在測序過程中,DNA 片段需要固定在 flowcell 上,以防止在液體流動時被沖走。這是通過 DNA 片段上的接頭與 flowcell 表面的引物結合來實現的。
-
大規模并行測序:由于 flowcell 上有大量的 tile,每個 tile 可以獨立進行測序反應,因此可以實現大規模并行測序,大大提高測序效率和通量。
-
測序反應容器:所有的測序反應都在 flowcell 上進行,包括 DNA 的固定、擴增和測序。
- 芯片表面修飾:Flowcell 芯片表面含有大量固定化的引物,與 DNA 片段上的接頭序列互補。
- DNA 固定:將建庫后的 DNA 片段加入 Flowcell,使其與芯片上的引物結合。
- Cluster 擴增:
- 橋式 PCR:通過橋式 PCR 擴增,使每個 DNA 片段在芯片上形成一個簇(Cluster),每個簇包含多個相同的 DNA 拷貝,放大信號。
- 測序:
- 邊合成邊測序:在反應體系中加入帶有熒光標記的 dNTP 和 DNA 聚合酶。每次只添加一個 dNTP 到 DNA 鏈上,通過激發熒光信號并記錄,確定堿基類型。
- 信號處理與堿基識別:將熒光信號轉換為堿基序列,生成 fastq 格式的測序數據。
(三)特點
- 優點:
- 高通量:一次運行可以產生大量的測序數據,適合大規模基因組測序。
- 成本低:單位堿基的測序成本大幅降低,使基因組學研究更加普及。
- 應用廣泛:可用于基因組組裝、變異檢測、RNA 測序、單細胞測序等多種應用。
- 缺點:
- 讀長短:單次測序讀長較短(通常在 50-300bp),難以處理重復序列和復雜基因組區域。
- 測序時間長:從建庫到測序完成通常需要數天時間。
- 偏向性:由于 PCR 擴增等步驟,可能導致某些區域的測序偏向性。
三、第三代測序技術
(一)PacBio 測序
1. 背景與歷史
- 時間:2010 年左右,PacBio 公司推出了基于單分子實時測序(SMRT)技術的測序儀。
- 意義:提供了超長讀長的測序能力,解決了第二代測序技術在處理復雜基因組區域時的局限性。
2. 測序原理
- 核心方法:單分子實時測序(SMRT)。
- 具體步驟:
- SMRT Cell 準備:將待測 DNA 樣本轉移到 SMRT Cell 中,該芯片含有大量零模波導孔(ZMW)。
- 文庫構建:構建 SMRTbell 文庫,將 DNA 片段連接成環狀結構,便于多次測序。
- 測序過程:
- DNA 聚合酶固定:在 ZMW 孔底部固定 DNA 聚合酶。
- 單分子測序:DNA 模板與聚合酶結合,四種不同熒光標記的 dNTP 被逐個添加到 DNA 鏈上。每次添加一個 dNTP 時,熒光信號被激發并記錄,通過信號分析確定堿基類型。
- 滾環測序:對于環狀 DNA 模板,聚合酶可以多次繞環測序,提高測序準確性。
- 數據生成:生成長讀長的測序數據,如 Polymerase Read、Subreads、CLR 和 CCS 等。
3. 特點
- 優點:
- 超長讀長:平均讀長可達 10-70kb,甚至更長,適合復雜基因組的組裝和結構變異檢測。
- 高準確性:通過多次測序和算法校正,可以獲得高準確性的 HiFi Reads(>99.9%)。
- 無需 PCR 擴增:避免了 PCR 擴增帶來的偏向性,適合低豐度基因的檢測。
- 缺點:
- 數據量小:單次測序產生的數據量相對較小,適合小規模基因組測序。
- 成本高:測序成本較高,不適合大規模應用。
- 設備昂貴:測序儀價格較高,不適合小規模實驗室購買。
(二)納米孔測序
1. 背景與歷史
- 時間:2014 年左右,Oxford Nanopore 公司推出了基于納米孔技術的測序儀,如 MinION。
- 意義:提供了實時、長讀長的測序能力,適合現場快速測序和長片段基因組分析。
2. 測序原理
- 核心方法:基于納米孔的電信號檢測。
- 具體步驟:
- 納米孔準備:選擇合適的生物納米孔或固態納米孔,將其嵌入到合成膜中。
- DNA 樣本處理:將待測 DNA 樣本連接上測序接頭和馬達蛋白,使其能夠通過納米孔。
- 測序過程:
- DNA 通過納米孔:在電場作用下,DNA 鏈在馬達蛋白的牽引下逐個堿基通過納米孔。
- 電流變化檢測:每個堿基通過納米孔時會引起特定的電流變化,通過檢測電流變化信號,識別堿基序列。
- 堿基識別:利用機器學習算法將電流信號(Squiggle)轉換為堿基序列。
- 數據生成:生成長讀長的測序數據,通常以 fastq 格式輸出。
3. 特點
- 優點:
- 長讀長:可以生成長達數十萬個堿基的測序數據,適合復雜基因組的組裝和結構變異檢測。
- 實時測序:數據可以實時生成和分析,適合快速檢測和現場應用。
- 便攜性:測序設備輕便,如 MinION 適合野外和現場使用。
- 缺點:
- 高錯誤率:初始測序錯誤率較高(約 5%-15%),但可以通過算法校正和多次測序提高準確性。
- 數據處理復雜:需要復雜的堿基識別算法和軟件進行數據處理。
- 成本高:雖然單次運行成本較低,但設備和試劑成本較高。
總結
- 第一代測序技術(Sanger 測序):準確性高、讀長長,但速度慢、成本高,適合小規模、高精度的測序項目。
- 第二代測序技術(NGS):高通量、成本低、應用廣泛,但讀長短、有偏向性,適合大規模基因組測序和轉錄組分析。
- 第三代測序技術(PacBio 和納米孔測序):長讀長、無需 PCR 擴增、適合復雜基因組分析,但數據量小、成本高、設備昂貴,適合特定應用場景,如基因組組裝、結構變異檢測和現場快速測序。