測序的原理

Sanger
測序原理 https://v.qq.com/x/page/d0124c0k44t.html
illumina
測序原理: https://v.qq.com/x/page/i0770fd7r9i.html
PacBio
第三代 SMRT 單分子測序 https://v.qq.com/x/page/r03534cry7u.html
Ion torrent
測序原理 https://v.qq.com/x/page/v01754s6r82.html
Oxford Nanopore
https://v.qq.com/x/page/v0746ixokzz.html

好的,以下是根據這份講義內容,對第一、二、三代測序技術相關知識的詳細講解:

一、第一代測序技術(Sanger 測序)

(一)背景與歷史

  • 時間:1977 年,Frederick Sanger 和 Coulson 開創了雙脫氧鏈終止法(Sanger 測序法),并完成了第一個噬菌體全基因組的測序。
  • 意義:開啟了現代基因測序的時代,為后續的基因組學研究奠定了基礎。

(二)測序原理

  • 核心方法:基于 DNA 聚合酶的鏈終止反應。通過在 DNA 合成過程中隨機引入標記了不同熒光染料的雙脫氧核苷酸(ddNTP),使 DNA 鏈在不同位置終止。
  • 具體步驟
    1. 模板制備:將待測 DNA 片段克隆到合適的載體中,獲得單鏈 DNA 模板。
    2. 引物退火:加入短的引物,使其與模板 DNA 的互補序列結合。
    3. 鏈合成與終止:在反應體系中加入 DNA 聚合酶、dNTP(正常脫氧核苷酸)和少量標記了熒光的 ddNTP。DNA 聚合酶從引物開始延伸 DNA 鏈,當隨機遇到一個 ddNTP 時,鏈合成終止。
    4. 電泳分離與檢測:將反應產物在聚丙烯酰胺凝膠中進行電泳分離,根據熒光標記的 ddNTP 不同,產生不同顏色的熒光信號,通過檢測熒光信號的位置和顏色,確定 DNA 序列。

(三)特點

  • 優點
    • 準確性高:單次測序的準確性可達 99.9% 以上,適合對準確性要求極高的應用,如基因組參考序列的構建。
    • 讀長較長:單次測序讀長可達 500-1000 個堿基,能夠覆蓋較長的 DNA 片段,減少拼接錯誤。
  • 缺點
    • 速度慢:每次測序只能處理一個 DNA 片段,通量低,難以滿足大規模基因組測序的需求。
    • 成本高:設備和試劑成本較高,不適合大規模應用。

二、第二代測序技術(Next-Generation Sequencing, NGS)

(一)背景與歷史

  • 時間:2005 年左右,隨著 Roche 454 測序儀和 Illumina Solexa 測序儀的推出,第二代測序技術逐漸成熟并廣泛應用。
  • 意義:極大地提高了測序通量,降低了測序成本,推動了基因組學研究的快速發展,使大規模基因組測序成為可能。

(二)測序原理(以 Illumina 測序為例)

  • 核心方法:基于可逆終止化學和邊合成邊測序(Sequencing by Synthesis, SBS)技術。

  • 具體步驟

  • 在這里插入圖片描述

    1. 建庫
      • DNA 片段化:將待測 DNA 隨機打斷成一定長度的小片段(如 300bp-800bp)。
      • 末端修復與接頭連接:對 DNA 片段的末端進行修復,并連接上特定的接頭序列,使片段能夠固定在測序芯片上。
      • 加 index 標簽:為不同樣本的 DNA 添加獨特的 index 標簽,便于后續數據拆分。
    2. Flowcell 芯片準備
      在這里插入圖片描述
Flowcell 的結構
  • 通道(Lanes):Flowcell 包含多個通道,每個通道稱為一個 lane。圖中顯示的 flowcell 有八條 lane,意味著可以同時進行八個獨立的測序運行。
  • 表面修飾:每個 lane 的表面都經過化學修飾,以便能夠固定 DNA 片段。這些修飾包括大量的引物,如 P7 和 P5 引物,它們與 DNA 文庫上的接頭序列互補,從而能夠固定 DNA 片段。
  • Swath 和 Tile:每個 lane 有兩個面,每個面上有三個 swath(區域),每個 swath 包含 16 個 tile(小方格)。因此,每個 lane 總共有 98 個 tile(兩面各 48 個)。整個 flowcell 有 768 個 tile(96 lanes × 8 tiles/lane)。
Flowcell 的功能
  • DNA 固定:在測序過程中,DNA 片段需要固定在 flowcell 上,以防止在液體流動時被沖走。這是通過 DNA 片段上的接頭與 flowcell 表面的引物結合來實現的。

  • 大規模并行測序:由于 flowcell 上有大量的 tile,每個 tile 可以獨立進行測序反應,因此可以實現大規模并行測序,大大提高測序效率和通量。

  • 測序反應容器:所有的測序反應都在 flowcell 上進行,包括 DNA 的固定、擴增和測序。

    • 芯片表面修飾:Flowcell 芯片表面含有大量固定化的引物,與 DNA 片段上的接頭序列互補。
    • DNA 固定:將建庫后的 DNA 片段加入 Flowcell,使其與芯片上的引物結合。
    1. Cluster 擴增
      • 橋式 PCR:通過橋式 PCR 擴增,使每個 DNA 片段在芯片上形成一個簇(Cluster),每個簇包含多個相同的 DNA 拷貝,放大信號。
    2. 測序
      • 邊合成邊測序:在反應體系中加入帶有熒光標記的 dNTP 和 DNA 聚合酶。每次只添加一個 dNTP 到 DNA 鏈上,通過激發熒光信號并記錄,確定堿基類型。
      • 信號處理與堿基識別:將熒光信號轉換為堿基序列,生成 fastq 格式的測序數據。

(三)特點

  • 優點
    • 高通量:一次運行可以產生大量的測序數據,適合大規模基因組測序。
    • 成本低:單位堿基的測序成本大幅降低,使基因組學研究更加普及。
    • 應用廣泛:可用于基因組組裝、變異檢測、RNA 測序、單細胞測序等多種應用。
  • 缺點
    • 讀長短:單次測序讀長較短(通常在 50-300bp),難以處理重復序列和復雜基因組區域。
    • 測序時間長:從建庫到測序完成通常需要數天時間。
    • 偏向性:由于 PCR 擴增等步驟,可能導致某些區域的測序偏向性。

三、第三代測序技術

(一)PacBio 測序

1. 背景與歷史
  • 時間:2010 年左右,PacBio 公司推出了基于單分子實時測序(SMRT)技術的測序儀。
  • 意義:提供了超長讀長的測序能力,解決了第二代測序技術在處理復雜基因組區域時的局限性。
2. 測序原理
  • 核心方法:單分子實時測序(SMRT)。
  • 具體步驟
    1. SMRT Cell 準備:將待測 DNA 樣本轉移到 SMRT Cell 中,該芯片含有大量零模波導孔(ZMW)。
    2. 文庫構建:構建 SMRTbell 文庫,將 DNA 片段連接成環狀結構,便于多次測序。
    3. 測序過程
      • DNA 聚合酶固定:在 ZMW 孔底部固定 DNA 聚合酶。
      • 單分子測序:DNA 模板與聚合酶結合,四種不同熒光標記的 dNTP 被逐個添加到 DNA 鏈上。每次添加一個 dNTP 時,熒光信號被激發并記錄,通過信號分析確定堿基類型。
      • 滾環測序:對于環狀 DNA 模板,聚合酶可以多次繞環測序,提高測序準確性。
    4. 數據生成:生成長讀長的測序數據,如 Polymerase Read、Subreads、CLR 和 CCS 等。
3. 特點
  • 優點
    • 超長讀長:平均讀長可達 10-70kb,甚至更長,適合復雜基因組的組裝和結構變異檢測。
    • 高準確性:通過多次測序和算法校正,可以獲得高準確性的 HiFi Reads(>99.9%)。
    • 無需 PCR 擴增:避免了 PCR 擴增帶來的偏向性,適合低豐度基因的檢測。
  • 缺點
    • 數據量小:單次測序產生的數據量相對較小,適合小規模基因組測序。
    • 成本高:測序成本較高,不適合大規模應用。
    • 設備昂貴:測序儀價格較高,不適合小規模實驗室購買。

(二)納米孔測序

1. 背景與歷史
  • 時間:2014 年左右,Oxford Nanopore 公司推出了基于納米孔技術的測序儀,如 MinION。
  • 意義:提供了實時、長讀長的測序能力,適合現場快速測序和長片段基因組分析。
2. 測序原理
  • 核心方法:基于納米孔的電信號檢測。
  • 具體步驟
    1. 納米孔準備:選擇合適的生物納米孔或固態納米孔,將其嵌入到合成膜中。
    2. DNA 樣本處理:將待測 DNA 樣本連接上測序接頭和馬達蛋白,使其能夠通過納米孔。
    3. 測序過程
      • DNA 通過納米孔:在電場作用下,DNA 鏈在馬達蛋白的牽引下逐個堿基通過納米孔。
      • 電流變化檢測:每個堿基通過納米孔時會引起特定的電流變化,通過檢測電流變化信號,識別堿基序列。
      • 堿基識別:利用機器學習算法將電流信號(Squiggle)轉換為堿基序列。
    4. 數據生成:生成長讀長的測序數據,通常以 fastq 格式輸出。
3. 特點
  • 優點
    • 長讀長:可以生成長達數十萬個堿基的測序數據,適合復雜基因組的組裝和結構變異檢測。
    • 實時測序:數據可以實時生成和分析,適合快速檢測和現場應用。
    • 便攜性:測序設備輕便,如 MinION 適合野外和現場使用。
  • 缺點
    • 高錯誤率:初始測序錯誤率較高(約 5%-15%),但可以通過算法校正和多次測序提高準確性。
    • 數據處理復雜:需要復雜的堿基識別算法和軟件進行數據處理。
    • 成本高:雖然單次運行成本較低,但設備和試劑成本較高。

總結

  • 第一代測序技術(Sanger 測序):準確性高、讀長長,但速度慢、成本高,適合小規模、高精度的測序項目。
  • 第二代測序技術(NGS):高通量、成本低、應用廣泛,但讀長短、有偏向性,適合大規模基因組測序和轉錄組分析。
  • 第三代測序技術(PacBio 和納米孔測序):長讀長、無需 PCR 擴增、適合復雜基因組分析,但數據量小、成本高、設備昂貴,適合特定應用場景,如基因組組裝、結構變異檢測和現場快速測序。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/81142.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/81142.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/81142.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

高項-邏輯數據模型

邏輯數據模型的核心理解 1. 定義與特點 邏輯數據模型(Logical Data Model, LDM): 是一種抽象的數據結構設計,用于描述業務實體(如客戶、訂單)及其關系(如“客戶下單”)&#xff0c…

《數字分身進化論:React Native與Flutter如何打造沉浸式虛擬形象編輯》

React Native,依托JavaScript語言,借助其成熟的React生態系統,開發者能夠快速上手,將前端開發的經驗巧妙運用到移動應用開發中。它通過JavaScript橋接機制調用原生組件,實現與iOS和Android系統的深度交互,這…

提高繩牽引并聯連續體機器人運動學建模精度的基于Transformer的分段學習方法

合肥工業大學王正雨老師團隊針對繩牽引并聯連續體機器人的運動學建模提出一種基于Transformer網絡的分段學習方法,該方法較傳統建模性能卓越、精度更高。相關研究論文“Transformer-based segmented learning for kinematics modelling of a cable-driven parallel …

【PX4飛控】在 Matlab Simulink 中使用 Mavlink 協議與 PX4 飛行器進行交互

這里列舉一些從官網收集的比較有趣或者實用的功能。 編寫 m 腳本與飛行器建立 UDP 連接,并實時可視化 Mavlink 消息內容,或者讀取腳本離線分析數據。不光能顯示 GPS 位置或者姿態等信息的時間曲線,可以利用 Matlab Plot 功能快速定制化顯示一…

Oracle中的select1條、幾條、指定范圍的語句

在Oracle中,可以使用不同的方法來選擇一條記錄、多條記錄或指定范圍內的記錄。以下是具體的實現方式: 1. 查詢單條記錄 使用ROWNUM偽列限制結果為1條: SELECT * FROM your_table WHERE ROWNUM 1;特點:Oracle會在結果集生成時分…

自營交易考試為何出圈?一場模擬交易背后的真實競爭

在交易圈里,有個現象正在悄悄發生:越來越多交易員開始主動報名參與一類“非實盤”的考試,原因卻并不復雜。不是為了資格證書,也不是為了炫技,而是為了一個更實在的東西——穩定、透明的利潤分成,以及一次向…

一鍵生成達夢、Oracle、MySQL 數據庫 ER 圖!解鎖高效數據庫設計!

從事企業軟件項目開發的同學們一定對 ER 圖很熟悉,可以幫助用戶快速厘清數據庫結構,方便后續維護和優化。但是在日常工作中,面對復雜的數據結構,整理表設計文檔對于每一位DBA來說都很頭大,需要將設計細節轉化為條理清晰…

游戲行業DDoS攻擊類型及防御分析

游戲行業作為DDoS攻擊的高發領域,攻擊類型復雜多樣,結合多個來源的信息,以下是其主要攻擊類型及特征分析: 1. 傳統流量型DDoS攻擊 UDP洪水攻擊:通過大量UDP報文淹沒服務器端口,消耗帶寬資源,導…

Web 架構之狀態碼全解

文章目錄 一、引言二、狀態碼分類2.1 1xx 信息性狀態碼2.2 2xx 成功狀態碼200 OK201 Created204 No Content 2.3 3xx 重定向狀態碼301 Moved Permanently302 Found304 Not Modified 2.4 4xx 客戶端錯誤狀態碼400 Bad Request401 Unauthorized403 Forbidden404 Not Found 2.5 5x…

jedis+redis pipeline詭異的鏈接損壞、數據讀取異常問題解決

文章目錄 問題現象棧溢出(不斷的重連)讀取超時未知響應嘗試讀取損壞的鏈接讀取到的數據和自己要讀的無關,導致空指針、類型轉換錯誤,數據讀取錯亂 問題寫法問題分析修復注意點 問題現象 棧溢出(不斷的重連&#xff09…

c++STL-list的模擬實現

cSTL-list的模擬實現 list源碼剖析list模擬實現list構造函數拷貝構造函數賦值重載迭代器 iterator訪問結點數size和判空尾插 push_back頭插 push_front尾刪pop_back頭刪pop_front插入 insert刪除 erase清空clear和析構函數訪問結點 參考程序 list源碼剖析 建議先看cSTL-list的…

WeakAuras Lua Script ICC (BarneyICC)

WeakAuras Lua Script ICC (BarneyICC) https://wago.io/BarneyICC/69 全量英文字符串: !WA:2!S33c4TXX5bQv0kobjnnMowYw2YAnDKmPnjnb4ljzl7sqcscl(YaG6HvCbxaSG7AcU76Dxis6uLlHNBIAtBtRCVM00Rnj8Y1M426ZH9XDxstsRDR)UMVCTt0DTzVhTjNASIDAU…

校園網規劃與設計方案

一、項目概述 校園網是學校實現信息化教學、科研與管理的重要基礎設施,其性能與穩定性直接影響學校的整體發展。隨著學校規模不斷擴大、教學科研活動日益豐富,對校園網的帶寬、可靠性、安全性以及智能化管理等方面提出了更高要求。本規劃與設計方案旨在構建一個高速、穩定、…

算法分析:蠻力法

一、實驗目的 1 掌握蠻力法的設計思想(利用計算機去窮舉所有的可能解,再從中依次找出可行解) 2 掌握蠻力法的具體實現和時間復雜度分析 3 理解蠻力法的常見特性 實驗要求:先用偽代碼描述利用蠻力法解決的算法解決方案,再用程序實現,計算時間…

信息系統運行管理員:臨陣磨槍版

信息系統運行管理員考試 - 全覆蓋詳細背誦大綱 (根據考情分析和原始材料,力求完整覆蓋考點細節) 第一部分:基礎知識與運維概覽 Chapter 1: 信息系統運維概述 (上午題 5分) 信息: 含義:香農 - 減少隨機不確定性的東西&#xff1b…

Linux的進程管理和用戶管理

gcc與g的區別 比如有兩個文件:main.c mainc.cpp(分別是用C語言和C語言寫的)如果要用gcc編譯: gcc -o mainc main.c gcc -o mainc mainc.cpp -lstdc表明使用C標準庫; 區別一: gcc默認只鏈接C庫&#x…

Python 常用模塊(八):logging模塊

目錄 一、引言:日志模塊在項目開發中的重要性二、從 Django 日志配置看 Logging 模塊的核心組成三、logging模塊核心組件詳解3.1 記錄器Logger3.2 級別Level3.3 根記錄器使用3.4 處理器Handler3.5 格式化器Formatter3.6 日志流3.7 日志示例 四、日志模塊總結 一、引…

Servlet原理

Servlet 體系結構的類層次關系 Servlet(接口):定義了 Servlet 的核心生命周期方法(如 init()、service()、destroy()),是所有 Servlet 的頂層規范,任何 Servlet 都需實現該接口。GenericServlet…

數據科學和機器學習的“看家兵器”——pandas模塊 之五

目錄 4.5 pandas 高級數據處理與分析 一、課程目標 二、對數據表格進行處理 (一)行列轉置 (二)將數據表轉換為樹形結構 三、數據表的拼接 (一)merge () 函數的運用 (二)concat () 函數的運用 (三)append () 函數的運用 四、對數據表格的同級運算 五、計算數據表格中數…

組合問題(去重)

40. 組合總和 II - 力扣&#xff08;LeetCode&#xff09; class Solution { private:vector<vector<int>>result;vector<int>path;void backtracking(vector<int>& candidates, int target,int sum,int startIndex,vector<bool>&used)…