Nature Protocols:整合多組學并進行因果推理的系統框架

轉載自:MetaAI

在生物學研究中,隨著實驗和計算技術的進步,生物系統研究產生了大量高通量數據。技術努力主要集中在提高吞吐量、降低成本和提升實驗與計算效率。因此,整合不同類型組學數據,并通過關聯分析識別關鍵因素和機制的計算方法變得尤為重要。

發表在《Nature Protocols》中的這篇文章,提出了一個可以從多組學中推斷因果關系的系統框架 - Transkingdom Network Analysis (TkNA),并詳細介紹了該框架的使用流程。TkNA是一種獨特的因果推理分析框架,能夠整合多個數據集和不同類型的組學數據,執行薈萃分析并識別關鍵的調控關系。它之前被用于研究抗生素耐藥微生物、2型糖尿病和免疫缺陷相關腸病,以及宮頸癌、淋巴瘤和黑色素瘤中微生物組的作用。TkNA可以識別微生物和微生物基因、宿主途徑、宿主基因以及控制宿主-微生物群相互作用的主要調節因素。

圖1. TkNA流程圖

TkNA流程包括3個主要部分,5個階段,并在這些之前有兩個預處理步驟(圖1)。TkNA可以用于分析實驗驗證后的結果,構成一個循環的分析框架(圖2)。

圖2. TkNA管道以循環方式進行

a、進行實驗并獲得樣品。b,在開始TkNA之前對樣品進行測序和標準化。c、對每種數據類型進行比較。bar圖分別代表測量的基因表達水平、微生物豐度和表型。星號代表治療組之間的顯著差異,因為僅保留顯著變化的特征下游分析。d、在每種數據類型之間和內部執行相關性。e,刪除意外的相關性。f、重建網絡。g,詢問網絡以尋找調控節點。h,確定從網絡中找到前部節點的概率,然后進行后續驗證研究并重復該循環。

TkNA不僅可以識別關鍵調節節點,還能計算網絡的拓撲屬性,并通過如Cytoscape這樣的外部程序可視化網絡。TkNA的方法已經用于驗證多項研究中的推論。它提供了一種分析不同組學數據之間交互作用的方法,可以用于分析遺傳和轉錄數據、代謝物、蛋白質和表型之間的相互作用。與其他方法相比,TkNA側重于通過薈萃分析識別跨多個隊列的穩健模式,并且專注于建立因果關系而非僅僅發現關聯。盡管TkNA提供了強大的工具,但用戶仍需要具備一定的統計知識來理解軟件的適用性和局限性。

TkNA的目標用戶是宿主和/或微生物組領域的研究人員,這些人員可能缺乏計算和統計專業知識。該方法適用于生物和生物醫學研究的多個學科,從建立新的細胞和分子治療靶點到研究基礎生物學問題。用戶無需編程專業知識,但需要熟悉Unix環境中的命令行操作,以及能夠理解JSON文件格式以自定義和修改程序選項。

該手冊詳細描述了一個復雜的分析流程和具體步驟,并給出了相應的命令行,這個流程分為3個主要部分,涵蓋了5個階段,以及在這些階段之前的兩個預處理步驟(圖1)。下面只做簡單描述,具體詳細步驟見原文:

第一部分:重建網絡

這部分涉及數據的標準化、文件格式化以及設定統計閾值(預處理步驟)。

階段1:數據導入、計算/薈萃分析和按用戶指定的條件過濾數據。這一步驟首先找出基于用戶定義的統計標準的不同類別樣本(如病態與健康對照組)間表達/豐富的變量(基因、微生物、代謝物等)。然后,進行每組內和組間的相關性分析。

階段2:基于網絡的拓撲特性,用戶決定是否進入下一個分析階段。這些特性包括網絡密度、觀察到的正/負相關偏差及意外相關比例等。

第二部分:詢問/分析重建的網絡

階段3:分析重建的網絡以找出在調查的生物過程中因果作用的節點或節點組。用戶可以使用TkNA識別網絡中的節點集群,并通過外部推薦軟件進行富集分析,以識別集群中的節點所貢獻的生物途徑或功能。

第三部分:從用戶重建的網絡分析中創建發布就緒的圖表

階段4:評估特定節點顯示非隨機值的概率。在這里,TkNA重建了許多隨機網絡,與重建網絡進行比較。

階段5:創建多種高質量的圖表,包括度分布的點圖、節點及其計算屬性的點圖,以及前調節節點的豐富度或表達水平。

圖3展示了TkNA的一些輸出結果。

圖3. TkNA生成的示例圖

a,網絡屬性度(degree)分布圖。b,左:節點屬性可視化示例,其中每個點代表重建網絡中的一個節點。右圖:同一張圖,放大了前10個微生物BiBC節點。c,b中前部BiBC節點的豐度/表達圖示例。圖例顯示了數據集中的兩個類。在本例中,將名為“高”的樣本類別與名為“低”的樣本類別進行比較。盒子顯示每次實驗每組的四分位數;須線包括除邊遠點之外的其余分布。d,10,000個隨機網絡的二維密度圖。

TkNA方法依賴于在多個實驗中進行薈萃分析,以識別多個隊列中倍數變化(fold change)和相關性的穩健模式。默認情況下,它使用Fisher方法來組合來自多個獨立測試的P值。其他通用R包(例如,meta、netmeta和mixmeta)提供了多種元分析方法,但這些方法并未考慮因果關系原理,例如相關不等式。其他R軟件包(例如MixOmics、MOFA+和iClusterPlus)也使用復雜的統計方法來組合從同一患者測量的多個組學數據。然而,它們同時應用于多個隊列或獨特的組學數據(其中數據組成或不滿足分布假設)可能具有挑戰性。TkNA提供了一個框架來實現多種組學類型和群組的同時整合。請注意,“整合”一詞指的是兩種截然不同的分析。具體來說,在整篇文章中以以下方式使用它:薈萃分析是來自多個獨立數據集的數據的集成,而網絡重建涉及在多種類型的組學數據之間建立統計依賴關系的集成。

參考文獻:

Newman, N.K., Macovsky, M.S., Rodrigues, R.R. et al. Transkingdom Network Analysis (TkNA): a systems framework for inferring causal factors underlying host–microbiota and other multi-omic interactions. Nat Protoc (2024). https://doi.org/10.1038/s41596-024-00960-w

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/44515.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/44515.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/44515.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

linux 內核 紅黑樹接口說明

紅黑樹(rbtree)在linux內核中使用非常廣泛,cfs調度任務管理,vma管理等。本文不會涉及關于紅黑樹插入和刪除時的各種case的詳細描述,感興趣的讀者可以查閱其他資料。本文主要聚焦于linux內核中經典rbtree和augment-rbtree操作接口的說明。 1、基本概念 二叉樹:每個…

基于主成分分析PCA的一維時間序列信號降噪方法(Python)

主成分分析PCA是面向模式分類的特征提取最典型的工具,是滿足上述映射準則的一種數據壓縮的方法。作為經典的特征提取方法,是在不減少原始數據所包含的內在信息前提下,將原始數據集轉化為由維數較少的“有效”特征成分來表示,使其在…

GD32F303之CAN通信

1、CAN時鐘 GD32F303主時鐘頻率最大是120Mhz,然后APB1時鐘最大是60Mhz,APB2時鐘最大是120Mhz,CAN掛載在APB1總線上面 所以一般CAN的時鐘頻率是60Mhz,這個頻率和后面配置波特率有關 2、GD32F303時鐘配置 首先我們知道芯片有幾個時鐘 HXTAL:高速外部時鐘&#xff1…

用理解與包容對待阿斯伯格綜合征患者

在我們的社會中,存在著這樣一個特殊的群體——阿斯伯格綜合征患者。他們在社交互動、溝通交流和行為模式上有著獨特的表現,需要我們以正確的方式去理解和對待。 我們要認識到阿斯伯格綜合征是一種神經發育障礙,而非個人的選擇或過錯。患者可能…

AI Earth——中國城市綠地對大氣污染干沉降作用估計數據集(DDEP)應用APP

基于數學模型量化植被的干沉降過程,突破傳統站點尺度研究的局限性,結合多源衛星遙感產品形成2000-2020年中國城市綠地對PM2.5和PM10的干沉降量估計柵格數據集,對城市大氣污染防治、綠地區域規劃和城市可持續發展有重要意義. 應用結果 代碼 #導入安裝包 import os import …

本地部署,強大的面部修復與增強網絡CodeFormer

目錄 什么是 CodeFormer? 技術原理 主要功能 應用場景 本地部署 運行結果 結語 Tip: 在圖像處理和計算機視覺領域,面部修復和增強一直是一個備受關注的研究方向。近年來,深度學習技術的飛速發展為這一領域帶來了諸多突破性…

c++:面向對象的繼承特性

什么是繼承 (1)繼承是C源生支持的一種語法特性,是C面向對象的一種表現 (2)繼承特性可以讓派生類“瞬間”擁有基類的所有(當然還得考慮權限)屬性和方法 (3)繼承特性本質上是為了代碼復用 (4)類在C編譯器的內部可以理解為結構體,派…

BJT交流分析+共發射極(CE)放大器+單片機的中斷系統(中斷的產生背景+使用中斷重寫秒表程序+中斷優先級)

2024-7-10,星期三,16:58,天氣:陰,心情:晴。今天終于陰天啦,有點風涼快一點了,不然真要受不了了,然后沒有什么特殊的事情發生,繼續學習啦,加油加油…

yolov5中訓練長條型目標召回率低問題

對于長條目標長寬比比較大的目標,如長1000pix,寬度10pix等在訓練時masic數據增強圖片中會出現有的圖片中標簽遺失問題,將原來標注好的目標,但是在增強圖片中沒有標簽,就會導致召回率低的問題。 在訓練代碼中augmentations.py文件…

MATLAB——運算符

文章目錄 MATLAB——運算符算數運算符矩陣的算數運算 關系運算邏輯運算符運算優先級 MATLAB——運算符 算數運算符 MATLAB中算數運算符包括加、減、乘、除、點乘、點除等。其運算規則如下表所示: 運算符運算規則ABA與B相加(A、B為數值或矩陣&#xff0…

一鍵安裝ros及出現問題的解決方案

wget http://fishros.com/install -O fishros && . fishroscatkin_make時出現報錯如下 catkin_make時出現錯誤提示如下: catkin_make Base path: /home/efsz/zmq_to_ros Source space: /home/efsz/zmq_to_ros/src Build space: /home/efsz/zmq_to_ros/build…

科普文:HTTPS協議

概敘 HTTPS(Secure Hypertext Transfer Protocol)即安全超文本傳輸協議,是一個安全通信通道。用于計算機網絡的安全通信,已經在互聯網得到廣泛應用。 HTTPS 是基于 HTTP 的擴展,其相當于 HTTP協議SSL(安全套…

0708,LINUX目錄相關操作

主要是冷氣太足感冒了&#xff0c;加上少吃藥抗藥性差&#xff0c;全天昏迷&#xff0c;學傻了學傻了 cat t_chdir.c #include <stdio.h> #include <unistd.h> #include <error.h> #include <errno.h> #include <sys/stat.h>int main(int argc…

魯棒控制器設計方法:systune,hinfsyn,musyn,slTuner

systune和hinfsyn更側重于基于數學模型的控制器設計&#xff0c;而musyn則特別考慮了系統的不確定性。slTuner則提供了在Simulink環境中進行控制器設計和調整的能力。 指定結構的控制器整定&#xff1a;systune, hinfstruct廣義控制對象整定&#xff1a;musyn, mixed musyn, h…

應急響應-ELK日志分析系統

&#x1f3bc;個人主頁&#xff1a;金灰 &#x1f60e;作者簡介:一名簡單的大一學生;易編橙終身成長社群的嘉賓.? 專注網絡空間安全服務,期待與您的交流分享~ 感謝您的點贊、關注、評論、收藏、是對我最大的認可和支持&#xff01;?? &#x1f34a;易編橙終身成長社群&#…

2024年PMP考試備考經驗分享

PMP是項目管理領域最重要的認證之一,本身是IT行業比較流行的證書&#xff0c;近幾年在臨床試驗領域也漸漸流行起來&#xff0c;是我周圍臨床項PM幾乎人手一個的證書。 考試時間&#xff1a;PMP認證考試形式為180道選擇題&#xff0c;考試時間為3小時50分。 考試計劃&#xff…

NFS綜合項目

現有主機 node01 和 node02&#xff0c;完成如下需求&#xff1a; 1、在 node01 主機上提供 DNS 和 WEB 服務 2、dns 服務提供本實驗所有主機名解析 3、web服務提供 www.rhce.com 虛擬主機 4、該虛擬主機的documentroot目錄在 /nfs/rhce 目錄 5、該目錄由 node02 主機提供的NFS…

Spring——自動裝配Bean

自動裝配是Spring滿足bean依賴的一種方式 Spring會在上下文中自動尋找&#xff0c;并自動給bean裝配屬性 在Spring中有三種裝配的方式&#xff1a; 1. 在xml中顯示配置 2. 在java中顯示配置 3. 隱式的自動裝配bean【重要】 測試 記得創建Cat、Dog、People類 public clas…

NI 5G大規模MIMO測試臺:將理論變為現實

目錄 概覽引言MIMO原型驗證系統MIMO原型驗證系統硬件LabVIEW通信系統設計套件&#xff08;簡稱LabVIEW Communications&#xff09;CPU開發代碼FPGA代碼開發硬件和軟件緊密集成 LabVIEW Communications MIMO應用框架MIMO應用框架特性單用戶MIMO和多用戶MIMO基站和移動站天線數量…

常用控件(三)

輸入類控件 QLineEditQTextEditQComboBoxQSpinBoxQDateTimeEditQDialQSlider QLineEdit QLineEdit用來表示單行輸入框&#xff0c;可以輸入一段文本&#xff0c;但是不能換行; 核心屬性: 屬性說明text輸入框中的文本inputMask輸入內容格式約束maxLength最大長度frame是否添加邊…