AM J BOT | 黃芪穩健骨架樹構建

Astragalus(黃芪屬,豆科,含約 3,400 種)是最大的被子植物屬之一,其多樣化在北半球多個地區的植被形成與生物多樣性格局中扮演了重要角色。然而,由于屬內物種數量龐大、形態復雜且演化歷史可能受到網狀進化的影響,該類群的系統發育關系長期以來一直未能得到可靠解析。研究開發并應用了一個進化枝特異性的靶向富集誘餌組(clade-specific target enrichment bait set),覆蓋 819 個核基因,以便在屬級尺度上獲得穩健的系統發育框架。我們從 107 個樣本中成功回收序列,其中包含 80 個來源于標本館的樣本(采集年代最早可追溯至 1899 年)。核基因的物種樹分析為 Astragalus 提供了一個支持度極高的骨干系統樹,但在某些關鍵節點處,基因樹之間存在顯著的不一致性。同時,我們利用非靶向回收的葉綠體基因組序列重建的質體樹,與核樹在若干位置也表現出明顯沖突。進一步的網絡分析表明,這些沖突可能源于不完全譜系整理(ILS)與歷史上的雜交/基因流事件的疊加。

? ? ? 本研究證明,進化枝特異性靶向富集方法不僅能夠高效回收老舊標本的核與質體數據,而且能夠在“超級大屬”的系統學研究中構建穩健的骨干框架。同時,我們的結果也強調:在多樣化速率高、演化復雜的大屬中,系統發育信號往往受到 ILS 與古代雜交的顯著影響,因此必須結合共祖模型與網絡方法加以解析。

文章來源:https://doi.org/10.1002/ajb2.70084

?方法

總體設計與目的

使用為 Astragalean 設計的?819-locus clade-specific bait set,以標本館樣本為主(有的標本采集于 1899 年),結合公開轉錄組數據,重建 Astragalus 的核骨干樹并比較核/質體信號以檢測 cytonuclear 沖突與網狀(reticulate)演化證據。

1. 取樣(Taxon sampling)

  • 總共選取 ~107 個樣本(作者表述略有處),其中?80 個為本研究新測(77 屬于 Astragalus,3 屬于其它 Astragalean 屬用于對照),并整合公開轉錄組/基因組數據以補充序列。

2. DNA 提取與文庫構建(Herbarium-friendly wet lab)

  • 從 ~20 mg 干標本組織提取(NucleoSpin Plant II),為老標本對步驟作了具體修改(如:600 μL PL1、無 RNase、1.5 h 裂解、額外清洗、50 μL 洗脫),用 Qubit 和 TapeStation 質控。

  • 聲波斷裂至 ~350 bp(Covaris M220),NEBNext Ultra II 文庫構建,接頭后按樣本片段大小微調篩選,PCR 擴增 8 周期。16 聯樣 pooled,myBaits 富集(hybridization temp = 60°C,wash temp = 60°C),富集后再擴增 10 周期;測序使用 Illumina NextSeq 1000。

3. 讀段質控與組裝(Read QC & locus assembly)

  • FastQC / MultiQC 檢查;去 PCR 重復(ParDRe);Trimmomatic 去接頭并丟棄 Q < 20 或 <25 bp 的讀段。

  • 用?HybPiper v2.1.5?進行靶位組裝:

    • SPAdes 的 coverage cutoff 為每樣本單獨決定(先跑初始組裝再計算平均覆蓋);

    • Diamond mapping(--diamond),Exonerate 和 sliding-window 閾值設為 85(--thresh?和?--exonerate_hit_sliding_window_thresh?= 85);

    • 處理 chimeric 相關參數(--chimeric_stitched_contig_edit_distance = 0?等);并用 HybPiper的?paralog_retriever?回收長 paralog。

4. 同源/正交映射與基因篩選(Orthology inference)

  • 序列用?MACSE?對齊;用?Pxclsq?清理堿基列(核數據 min occupancy 10%);用?TreeShrink?去除異常長分支,mask 單系/并系 tip(保留信息量最多的 tip)。

  • 正交推斷采用?monophyletic outgroup (MO)?方法(Yang & Smith 2014)與 Morales-Briones 等(2022)流程生成同源/正交 fasta

5. 基因樹與物種樹構建(Phylogenetic inference)

  • 基因樹:IQ-TREE v2(ModelFinder?-m TEST,1000 ultrafast bootstrap)。

  • 物種樹(nuclear):并行使用(a)ASTRAL(quartet-based coalescent 方法)、(b)ASTRAL-Pro(可處理多拷貝/并行基因)和(c)concatenated ML(把所有 ortholog 拼接成 supermatrix 用 IQ-TREE)。這樣一套并行策略可對比 ILS / paralogy 的影響。

6. 基因不一致性與網狀演化檢測(Discordance & networks)

  • PhyParts(統計基因與物種樹的一致/不一致)與?QuartetSampling (QS)(評估四分體支持和替代拓撲頻率)用于量化基因樹不一致。

  • PhyloNet(maximum pseudo-likelihood)在代表性 22 個樣本(覆蓋 11 大類群、576 個基因)上推斷帶 reticulations 的物種網絡,檢驗 0–6 個雜交事件(reticulations)情形并以 log-likelihood 比較模型優劣。

7. 葉綠體(plastome)數據的回收與分析

  • 利用 off-target reads 用?FastPlast?/ SPAdes 組裝 plastome,導入 Geneious 以 A. pattersonii(NC_063490)為參考做高靈敏 mapping,手工去除 discordant contigs,合并并對 CDS/分區建樹(IQ-TREE),并用 Pxclsq 清除列缺失 >40% 的位點。這樣得到獨立的 plastome 樹,用以對比核樹。

?結果

1) 測序與靶位回收(數據量與覆蓋)

  • 每樣本原始 paired-end reads 在?1.2M 到 12M?之間。

  • 平均每樣本?≥75% 長度回收的靶位為 701.1 個(范圍 484–767),表明 bait set 對許多老標本亦有效。且作者未檢測到標本年代(1899–2014)與回收位點數的明顯相關性(Supporting Fig. S1)。

2) 并行/副本與正交序列數

  • HybPiper 報告的 paralog warnings?平均 33.4 個/樣本(范圍 3–252),顯示在某些樣本/基因上并行拷貝問題明顯。平均每個樣本檢索到?~599.8 個 ortholog 序列(范圍 230–718)。最終篩得?781 個 MO orthologs(每個基因至少含 20 個樣本)。

3) 矩陣規模(拼接矩陣)

  • 拼接超級矩陣長度?778,623 個對齊堿基,總體矩陣占有率約?73%(約 27% 缺失)。葉綠體矩陣為?~114,580?列,對齊占有率約?74.6%

4) 核樹(ASTRAL / ASTRAL-Pro / concatenated)– 總體拓撲與支持

  • 三種方法(coalescent、ASTRAL-Pro、concatenated ML)產生的主干拓撲非常相似,背骨(backbone)節點普遍具有很高支持(LPP=1 / BS=100 在許多關鍵節點)。Astragalean 整體與 Eu-Astragalus 被強烈支持為單系群。

  • 部分細節差異:ASTRAL-Pro 在某些深節點(例如 Hypoglottis)與 concatenated 方法給出略異結論(ASTRAL-Pro 使 Hypoglottis 單系),另一些類群(Astracantha、Hamosa)的支持值在方法間也存在差別(見文中數值)。

5) 核—質體(cytonuclear)不一致

  • 雖然核樹給出高支持的 backbone,但?plasmome(葉綠體)樹在少數關鍵處與核樹沖突:例如 Ophiocarpus 在核樹中呈散布/多系,而葉綠體樹支持 Ophiocarpus 單系且與 Glottis 為姐妹(BS=100)。這提示曾發生器官體交換或古代基因流/捕獲事件。

6) 基因不一致量化(PhyParts & QuartetSampling)

  • 某些大節點表現出高度一致性(例如 Astragalean:628/628 informative genes concordant,QS score = 1/–/0.96;Eu-Astragalus + Oxytropis:728/741,QS = 1/–/0.96),顯示這些節點幾乎所有基因都支持相同拓撲。

  • 然而,沿 Astragalus 背骨(尤其是?Meso-Astragalus?區域)存在高水平基因樹不一致與?QS 對替代拓撲的強烈偏斜。舉例:Hypoglottis 與 Diholcos 這一節點,只有?23 個 informative genes(out of 668)?給出該 QS 指標?0.27/1/0.48,雖然物種樹的支持值仍顯示 LPP = 1 / BS = 100——說明高支持度的節點可能由少數強信號或合并效應驅動,但基因層面替代拓撲頻率不低。

7) 網狀演化證據(PhyloNet)

  • 在用?22 個代表性類群(576 loci)?進行 PhyloNet 分析時,作者檢驗了 0–6 個 reticulation 的模型,發現最優模型為 6 個 reticulations(log-likelihood ≈?–392,572),并在多個主類群間重建出復雜的 reticulation 事件。

  • 許多推斷出的雜交事件涉及?“ghost lineage”(未采樣或已滅絕譜系)?或祖先節點(例如 Trimeniaeus 與 Neo-Astragalus 祖先的相互作用),且某些事件在不同 reticulation 假設下重復出現(例如 Trimeniaeus ? Diholcos),增強了“真實存在歷史混合”的可信度;作者仍建議更密集取樣以穩健確認細節。

8) 質控與其他觀察

  • 標本年代不顯著影響基因回收量(支持用標本館樣本做大規模靶位富集的可行性)。

  • 并行/副本(paralogy)在 Astragalus 中較為常見(個別樣本 paralog warnings 高達數百),因此作者采用 HybPiper 的 paralog_retriever、ASTRAL-Pro 等工具來降低 paralogy 對物種樹推斷的干擾。

?關鍵發現

1.系統發育重建:核基因數據(781個直系同源位點)支持黃芪屬分為11個主要分支,但發現Ophiocarpus分支在核基因組中多系分布,而在葉綠體基因組中單系。

2.核質沖突:葉綠體系統發育與核基因組存在顯著不一致,特別是在Ophiocarpus、Hypoglottis和Diholcos等分支的拓撲結構上。

3.網狀進化證據:系統發育網絡分析(PhyloNet)檢測到至少6次雜交事件,主要發生在Meso-Astragalus類群間,遺傳貢獻概率在0.135-0.4之間。

?關鍵圖解析

圖1:基于ASTRAL的黃芪屬物種樹

圖片

基于ASTRAL軟件構建的黃芪屬種系樹,采用781個正交基因座數據。節點支持度(局部后驗概率,LPP)≥0.95(未特別標注時)。餅圖顯示主干節點處基因不一致性(由PhyParts計算)。歐黃芪屬內各分支的彩色標注名稱遵循Azani等(2017)及Su等(2021)的命名體系。插圖展示主干沿線主要差異,采用標注方法進行比較,省略拓撲結構相同的樹形部分。

圖2:核質基因組沖突與網狀進化證據

圖片

圖2A:核質基因組拓撲結構比較

核基因組樹(左圖)特征:

  1. Ophiocarpus分支:多系分布于Hypoglottis類群中(紅色標記),與形態學分類沖突

  2. Diholcos分支:嵌套于Hypoglottis內部,形成兩個獨立的高支持度亞支(BS=100)

  3. Contortuplicata分支:與Hamosa分支形成姐妹群關系

葉綠體樹(右圖)特征:

  1. Ophiocarpus分支:單系且與Glottis分支形成姐妹群(BS=100)

  2. Hypoglottis分支:單系且與Contortuplicata分支姐妹關系

  3. Diholcos分支:與Astracantha分支姐妹關系

關鍵沖突點:

  • Ophiocarpus的單系性(葉綠體)vs多系性(核基因)

  • Diholcos在核基因組中嵌套于Hypoglottis,而在葉綠體中與Astracantha關聯

  • Contortuplicata與不同分支的關聯關系

圖2B:系統發育網絡分析

網絡結構特征:

  1. 主要雜交事件:6個明確信號(紅色箭頭),涉及Trimeniaeus、Hypoglottis和Diholcos等分支

  2. 遺傳貢獻概率

    • Trimeniaeus→Hypoglottis+Diholcos共同祖先(0.3)

    • 滅絕譜系→Contortuplicata(0.3)

    • Trimeniaeus→Neo-Astragalus祖先(0.4)

圖3:與他人研究的比較

圖片

  • 左圖:本研究結果,Glottis分支(藍色)位于Eu-Astragalus基部

  • 右圖:Folk等人的結果,Glottis代表種A. epiglottis被置于Astragalean clade之外

  • 差異:節點支持度(LPP)和Neo-Astragalus的位置存在顯著不同

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/95503.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/95503.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/95503.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

if __name__=‘__main__‘的用處

在 Python 中&#xff0c;if __name__ __main__:是一個常見的代碼模式&#xff0c;用于控制模塊的執行行為。它的核心作用是區分模塊是被直接運行還是被導入到其他文件中。作用詳解&#xff1a;?當文件被直接運行時?__name__會被自動設置為 __main__&#xff0c;此時 if塊內…

MySQL慢查詢優化策略

一、問題定位 1、慢查詢日志 -- 查看當前設置 SHOW VARIABLES LIKE slow_query%; ? -- 開啟慢查詢日志&#xff08;my.cnf永久配置&#xff09; [mysqld] slow_query_log 1 slow_query_log_file /var/log/mysql/slow.log long_query_time 1 -- 超過1秒的查詢 log_querie…

如何使用 ASP.NET Core 創建基于角色的 Web API

在使用 ASP.NET Core 構建基于角色的 Web API 時&#xff0c;代碼優先方法是一種強大而高效的方法。使用它&#xff0c;我們可以在代碼中定義數據模型和關系&#xff0c;然后自動生成相應的數據庫模式。這會帶來什么&#xff1f;當然是更快的開發周期和更大的靈活性。為什么&am…

無字母數字命令執行

寫在前面 說白了數字還是好構造的&#xff0c;bash的算數拓展&#xff01; base64命令 這玩意說白了有點雞肋&#xff0c;因為你得知道flag的文件名和位置&#xff01; base64 flag.php這個會將flag.php里面的內容給base64編碼輸出來。那么如何用無字母數字構造呢&#xff1f; …

AAB包轉apks轉apk

1. 下載bundletool-all-1.17.2.jar&#xff08;不一定非得1.17.2&#xff0c;可以其他版本&#xff09; https://github.com/google/bundletool/releases/tag/1.17.2 2. 在aab、keystore、bundletool-all-1.17.2.jar的目錄下&#xff0c;運行指令 java -jar bundletool-all-1…

從零開始:用uv構建并發布一個Python CLI應用,集成CI/CD自動化發布與Docker容器化部署

使用uv構建并發布一個完整的Python CLI應用 概述 初始化項目 編寫應用代碼 定義項目 (`pyproject.toml`) 使用`uv`安裝依賴 本地運行和測試 依賴鎖定 構建 發布 生產環境實踐之CI/CD 創建工作流配置文件 配置GitHub Secrets 創建和推送tag 驗證發布 生產環境實踐之Docker 創建D…

如何在Qt中使用周立功USB轉CAN卡

如何在 Qt 中使用周立功 USB 轉 CAN 卡 文章目錄如何在 Qt 中使用周立功 USB 轉 CAN 卡一、簡介二、準備工作三、使用四、運行效果五、寫在最后?一、簡介 最近在工程中用到了周立功的 USB 轉 CAN 卡&#xff0c;需求是要通過上位機進行通信&#xff0c;因此有了這篇文章。 有…

JavaScript 源碼剖析:從字節碼到執行的奇妙旅程

JavaScript&#xff0c;這門風靡全球的腳本語言&#xff0c;以其靈活性和跨平臺性征服了無數開發者。我們每天都在使用它&#xff0c;但它在后臺是如何工作的&#xff1f;一段看似簡單的JS代碼&#xff0c;在執行之前究竟經歷了哪些“變形記”&#xff1f;今天&#xff0c;讓我…

FPGA—硬件電路一旦上電配置完成,各個功能模塊會并行地持續工作

1.示例代碼參考這段代碼是用 Verilog 編寫的一個 LED 閃爍控制模塊&#xff0c;主要實現了 LED 按一定時間間隔循環移位閃爍的功能。下面詳細解釋其架構組成&#xff1a;模塊定義與端口聲明模塊名為 led_flash&#xff0c;包含三個端口&#xff1a;sys_clk&#xff1a;輸入端口…

從零到上線:Docker、Docker Compose 與 Runtime 安裝部署全指南(含實戰示例與應用場景)

文章目錄一、Docker 安裝1. Ubuntu / Debian&#xff08;官方倉庫&#xff09;2. RHEL / CentOS / Rocky / AlmaLinux3. 驗證4. macOS / Windows&#xff08;Docker Desktop&#xff09;二、Docker Compose&#xff08;V2&#xff09;安裝與基本用法1) 驗證2) 最小示例&#xf…

Java基礎篇02:基本語法

1 注釋 注釋是寫在程序中對代碼進行解釋說明的文字&#xff0c;方便自己和其他人查看&#xff0c;以便理解程序的。注釋分為三種&#xff1a;單行注釋、多行注釋、文檔注釋注釋不影響代碼的執行&#xff1a; 原因是編譯后的文件已經沒有注釋了// 這是單行注釋&#xff1a;。通常…

【SECS/GEM 】SECS/GEM 日志管理相關的消息

明白 ? 在 SECS/GEM 架構里&#xff0c;設備日志&#xff08;Equipment Logging 主要涉及 事件日志&#xff08;Event Log&#xff09;、報警日志&#xff08;Alarm Log&#xff09;、配方操作日志&#xff08;Recipe Log&#xff09;、以及用戶操作/命令日志。這些日志通過 S…

ragas 框架使用Chat-GLM模型報API 調用參數有誤,請檢查文檔

ragas 框架使用Chat-GLM模型報API 調用參數有誤&#xff0c;請檢查文檔解決方案 from ragas.llms import LangchainLLMWrapper # 點擊LangchainLLMWrapper 進入這個類找到這個方法直接 return 0.1出現問題原因 ChatGLM 不支持設置temperature等于0&#xff0c;默認的值太小了

Kaggle - LLM Science Exam 大模型做科學選擇題

Kaggle - LLM Science Exam Science Exam Simple Approach w/ Model Hub | Kaggle Platypus2-70B with Wikipedia RAG | Kaggle 5個選項只有一個選項正確&#xff0c;目標&#xff1a;回答一個選項序列&#xff08;只有前三個有效&#xff09; 輸出正確選項 &#xff08;可…

貪吃蛇魚小游戲抖音快手微信小程序看廣告流量主開源

核心優勢&#xff1a;為流量主運營者與新手量身打造 1. 為流量主運營者破解成本困局 本地化運行&#xff0c;零服務器成本&#xff1a;數據運行與存儲全程在用戶手機本地完成&#xff0c;無需部署服務器及后臺系統&#xff0c;徹底擺脫服務器租賃、維護等硬性支出&#xff0c;…

PDF Reader 編輯閱讀工具(Mac中文)

原文地址&#xff1a;PDF Reader 編輯閱讀 for Mac v5.2.0 PDF Reader Pro Mac&#xff0c;是一款PDF編輯閱讀&#xff0c;PDF Reader Pro讓您直接在 Mac 上進行PDF文件閱讀、筆記、編輯、轉換、創建PDF、簽署PDFs、填寫PDF Forms表單、設置密碼、合并拆分文件、水印等等&…

Django REST framework:SimpleRouter 使用指南

1. SimpleRouter 是什么&#xff1f; SimpleRouter 是 DRF&#xff08;Django REST framework&#xff09;提供的路由器&#xff0c;能根據 ViewSet 自動生成標準的 REST 路由&#xff0c;包括&#xff1a; GET /resources/ → 列表&#xff08;list&#xff09;POST /resource…

覆蓋Transformer、GAN:掩碼重建正在重塑時間序列領域!

隨著大數據與深度學習的發展&#xff0c;時間序列分析的建模能力顯著提升&#xff0c;而掩碼重建作為一種自監督學習范式&#xff0c;已成為提升序列表征能力的重要技術。該方法通過隨機掩碼部分數據并重建原始序列&#xff0c;迫使模型挖掘時序依賴性與潛在模式&#xff0c;在…

用AI做TikTok影視解說,全流程全自動成片,不懂外語也能做全球矩陣!

多語種解說&#xff1a; 短劇出海狂吸美金 多語種解說搶先機 TikTok、YouTube等平臺&#xff0c;尤其在非英語市場&#xff0c;內容供給仍遠遠不足&#xff0c;每一個小語種市場都是潛在藍海。 有人用英語講仙俠、西語講爽劇、日語講宮斗、阿語講懸疑&#xff0c;一夜漲粉百…

解密大語言模型推理:輸入處理背后的數學與工程實踐

解密大語言模型推理&#xff1a;輸入處理背后的數學與工程實踐當你向ChatGPT提問時&#xff0c;短短幾秒內就能獲得流暢的回答&#xff0c;這背后隱藏著怎樣的技術魔法&#xff1f;答案在于大語言模型高效推理過程中精妙的輸入處理機制。在現代大語言模型推理中&#xff0c;輸入…