TCGA數據庫臨床亞型可用!貝葉斯聚類+特征網絡分析,這篇 NC 提供的方法可以快速用起來了!

生信堿移

貝葉斯網絡聚類

CANclust是一種基于貝葉斯的聚類方法,系統性地對基因突變、細胞遺傳學信息和臨床指標進行聯合建模,用于多種模態數據的聯合聚類分析,并識別在患者群體中反復出現的特征模式。

個體的遺傳與環境背景決定其應對疾病的反應狀態,進而產生單一疾病的不同疾病分型。不同疾病分型的病人具有高度異質性,但在臨床表現和基因特征上可能存在顯著重疊。比如,髓系腫瘤包括急性髓系白血病(AML)、骨髓增生異常綜合征(MDS)、慢性髓單核細胞白血病(CMML)和骨髓增殖性腫瘤(MPN)等多個疾病類型,他們之間并非截然分離,而是構成一個連續譜系,其中MDS、CMML 和 MPN 等可進一步進展為AML。

盡管近年來臨床分型方法已經逐步由傳統臨床指標向突變特征轉變,但當前分類體系仍面臨三大問題:

  1. 異質性顯著:即使是同一疾病,患者在臨床表現、預后以及治療響應方面存在廣泛的差異;

  2. 變量組合十分復雜:基因組層面驅動突變數量眾多、相互組合多樣,臨床協變量(如血液、骨髓指標)與遺傳因素的聯合分析復雜度極高;

  3. 聚類方法有限:多數已有聚類研究僅關注基因層面,忽略了臨床協變量在亞型識別中的重要性,同時現有的方法在建模中無法體現不同變量類型的差異角色。

為此,來自瑞士生物信息學研究所的研究人員開發了一種基于貝葉斯網絡的協變量校正聚類方法(CANclust),于2025年4月30日發表于Nature Communications[IF: 14.7]。CANclust從數據整體視角出發,系統性地對基因突變、細胞遺傳學信息和臨床指標進行聯合建模,用于多種模態數據的聯合聚類分析。作者在正文中利用模擬、TCGA、自測數據進行了驗證分析,不過像聚類結果出來以后一些套路性的分析比如免疫治療那些都可以做起來了

圖片

▲ DOI:10.1038/s41467-025-59374-1。?

簡單來講,CANclust通過建模變量之間的概率關系,識別在患者群體中反復出現的特征模式。對于每一個潛在的患者亞型(聚類結果),該方法都會用一個貝葉斯網絡來描述變量間的特征組合,所以不僅考慮了單個特征,也關注了特征變量之間的協同變化。不理解也沒關系,反正使用這個聚類方法我們可以除了獲得樣本聚類結果以外,還能夠獲得不同聚類特異性的特征交互網絡。

圖片

▲ CANcluster原理。該方法以患者在確診時的基線數據為輸入(圖左),包括不同癌癥類型(左側顏色區分)、基因突變信息(左上)和臨床協變量(左下)。在建模過程中,通過區分協變量類型:Cluster-independent 協變量(如年齡、性別)被設定為僅向突變變量發出邊(圖右虛線),用于建模其對突變發生的影響,并在聚類時進行統計校正;Cluster-dependent 協變量(如癌癥類型)則被視為可能由突變決定的結果變量,可與突變變量共同參與聚類建模。隨后貝葉斯網絡對不同潛在亞型中的變量依賴結構進行建模(右側藍色圖結構),每個亞型對應一個特有的網絡模型,反映其內在的突變模式與協變量關聯結構(圖右實線)。通過聯合學習網絡結構與患者歸屬(圖右下),該方法能夠在控制已知協變量影響的基礎上,識別出具有生物學一致性和臨床解釋力的全新患者亞群。

圖片

▲ 樣本聚類結果演示。一個點代表一個樣本,左圖為樣本真實的癌癥類型;右圖為對應的聚類結果,總共有A,B,C,D,E,F,G,H,I九個聚類簇。上圖為作者NC文章中的結果,表明該方法能夠發現新的臨床亞型。

圖片

▲ 兩種癌癥中的特異性網絡。除了突變特征以外,還有性別、年齡等臨床信息。實線代表正相關,而虛線代表負相關。

01.R包安裝

該R包在CRAN中提供,可以使用以下代碼進行安裝:

install.packages("clustNet")

02.使用示例

①示例數據加載:

library(clustNet)# 模擬數據
ss <- c(400,?500,?600)?# samples in each cluster
simulation_data <- sampleData(k_clust = k_clust, n_vars =?20, n_samples = ss)
sampled_data <- simulation_data$sampled_data

模擬了一個基因突變的數據,行是樣本共1500個,列是基因共20個。這個數據可以換成其它類型的數據,但是必須是0或1的類別變量。下面簡單來看一下:

dim(sampled_data)
#[1] 1500 ? 20# 因為是基因突變數據,所以0/1分別代表無或有突變
sampled_data[1:5,?1:5][,1] [,2] [,3] [,4] [,5]
[1,] ? ?1? ??0? ??0? ??0? ??1
[2,] ? ?0? ??1? ??1? ??1? ??0
[3,] ? ?1? ??0? ??0? ??0? ??0
[4,] ? ?1? ??0? ??1? ??0? ??0
[5,] ? ?0? ??0? ??1? ??0? ??0

② 使用get_clusters函數進行聚類,可以指定聚類數量(下面是指定聚為3類)。需要注意一下,sampled_data必須是0/1的變量;n_bg參數默認為0,可以用于指定需要調整的協變量如性別年齡等,但是需要放在sample_data的最后n_bg列(所以默認的0則意味著不需要考慮任何的協變量)。

k_clust <-?3?# 選定聚類為3類
cluster_results <- get_clusters(sampled_data, k_clust = k_clust, n_bg =?0)

可視化一下聚類的結果圖:

library(car)
library(ks)
library(graphics)
library(stats)# 2D降維結果
density_plot(cluster_results)

圖片

③ 可視化一下聚類特異性特征網絡:

library(ggplot2)
library(ggraph)
library(igraph)
library(ggpubr)# 可視化
plot_clusters(cluster_results)

圖片

各位老鐵51快樂啊

得到工作日了

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/78888.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/78888.shtml
英文地址,請注明出處:http://en.pswp.cn/web/78888.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【算法】隨機快速排序和隨機選擇算法

文章目錄 1、隨機快速排序1.1 什么是隨機快排1.2 隨機快排的好處 2、隨機選擇算法 前言&#xff1a; 快速排序就是每次劃分前&#xff0c;通過一種方法將一個基準值的位置確定好&#xff0c;再進入不同的部分重復相同的工作以此確定好每個值的位置以達到有序。如果你之前并不了…

網絡技術基礎,NAT,橋接,交換機,路由器

什么是NAT Network Address Translation&#xff08;網絡地址轉換&#xff09;&#xff0c;它負責將目標IP或源IP進行了改變&#xff0c;相當于一個中間代理&#xff0c;我們家庭常用的路由器就是一個NAT設備&#xff0c;NAT是為了解決IPv4的IP地址快要耗盡的問題&#xff0c;…

DVWA靶場保姆級通關教程--03CSRF跨站請求偽造

提示&#xff1a;文章寫完后&#xff0c;目錄可以自動生成&#xff0c;如何生成可參考右邊的幫助文檔 文章目錄 目錄 文章目錄 前言 一、low級別的源碼分析 二、medium級別源碼分析 安全性分析 增加了一層 Referer 驗證&#xff1a; 關鍵點是&#xff1a;在真實的網絡環境中&a…

【Ansible自動化運維實戰:從Playbook到負載均衡指南】

本文是「VagrantVirtualBox虛擬化環境搭建」的續篇&#xff0c;深入探索Ansible在自動化運維中的核心應用&#xff1a; ? Ansible核心技能&#xff1a;Playbook編寫、角色&#xff08;Roles&#xff09;模塊化、標簽&#xff08;Tags&#xff09;精準控制 ? 實戰場景覆蓋&a…

基于STM32、HAL庫的STC31-C-R3氣體傳感器驅動程序設計

一、簡介: STC31-C-R3是Sensirion公司推出的一款基于CMOSens技術的CO2傳感器,具有以下特點: 測量范圍:0-100%體積濃度 I2C數字接口 低功耗設計 高精度和長期穩定性 小尺寸封裝(5mm x 5mm) 二、硬件接口: STC31-C-R3 STM32L4xx ---------------------------- VDD (P…

Nginx篇之限制公網IP訪問特定接口url實操

一、nginx配置限制IP訪問 要在 Nginx 配置中添加 IP 限制&#xff0c;阻止來自指定公網 IP 地址段的訪問&#xff0c;并且只對特定路徑進行限制&#xff0c;可以在 location 配置中使用 deny 和 allow 指令來控制訪問。 二、案例 1. 需求 對來自特定公網的地址段&#xff0…

算法研習:無重復字符的最長子串問題剖析

算法研習:無重復字符的最長子串問題剖析 一、引言 在算法的廣袤天地中,字符串相關問題一直是備受關注的焦點。“無重復字符的最長子串”這一問題,不僅在面試中頻繁出現,更是對算法思維和編程技巧的一次深度考驗。它要求我們從給定字符串中找出不含有重復字符的最長子串的長…

Spring Cloud Gateway路由+斷言+過濾

目錄 介紹核心功能三大核心Route以服務名動態獲取URLPredicate常用斷言Path Route PredicateAfter Route PredicateBefore Route PredicateBetween Route PredicateCookie Route PredicateHeader Route PredicateHost Route PredicateQuery Route PredicateRemoteAddr Route Pr…

springboot集成langchain4j記憶對話

流式輸出 LLM 一次生成一個標記&#xff08;token&#xff09;&#xff0c;因此許多 LLM 提供商提供了一種方式&#xff0c;可以逐個標記地流式傳輸響應&#xff0c;而不是等待整個文本生成完畢。 這顯著改善了用戶體驗&#xff0c;因為用戶不需要等待未知的時間&#xff0c;幾…

【SpringCloud GateWay】Connection prematurely closed BEFORE response 報錯分析與解決方案

一、背景 今天業務方調用我們的網關服務報錯: Connection prematurely closed BEFORE response二、原因分析 三、解決方案 第一步: 增加 SCG 服務的JVM啟動參數,調整連接獲取策略。 將連接池獲取策略由默認的 FIFO&#xff08;先進先出&#xff09;變更為 LIFO&#xff08…

使用ZYNQ芯片和LVGL框架實現用戶高刷新UI設計系列教程(第十一講)

這一期講解lvgl中下拉框的基礎使用&#xff0c;下拉列表允許用戶從選項列表中選擇一個值&#xff0c;下拉列表的選項表默認是關閉的&#xff0c;其中的選項可以是單個值或預定義文本。 當單擊下拉列表后&#xff0c;其將創建一個列表&#xff0c;用戶可以從中選擇一個選項。 當…

【神經網絡與深度學習】VAE 在解碼前進行重參數化

在 VAE 中&#xff0c;解碼之前進行重參數化主要有以下幾個重要原因&#xff1a; 可微分性 在深度學習里&#xff0c;模型是通過反向傳播算法來學習的&#xff0c;而這需要計算梯度。若直接從潛在變量的分布 (q_{\theta}(z|x))&#xff08;由編碼器輸出的均值 (\mu) 和方差 (…

BBDM學習筆記

1. configs 1.1 LBBDM: Latent BBDM [readme]

mysql主從復制搭建,并基于?Keepalived + VIP實現高可用

以下是基于 ?Keepalived VIP? 實現 MySQL 主從復制高可用的詳細步驟&#xff0c;涵蓋主從復制搭建與故障自動切換&#xff1a; 一、MySQL 主從復制搭建&#xff08;基礎步驟回顧&#xff09; 1. ?主庫&#xff08;Master&#xff09;配置? 修改配置文件? /etc/my.cnf&…

CD36.【C++ Dev】STL庫的string的使用 (下)

目錄 1.reserve函數(不是reverse) 代碼示例 2.resize 代碼示例 3.reserve和resize的區別 4.shrink_to_fit 代碼示例 5.與C語言的配合的接口函數: c_str 代碼示例 6.rfind 知識回顧:find函數 rfind 代碼示例 練習題: 字符串最后一個單詞的長度 代碼 提交結果 ?…

STM32的網絡天氣時鐘項目

一、項目概述與硬件架構 1.1 核心功能 本智能天氣時鐘系統集成了實時天氣獲取、網絡時間同步、環境監測和低功耗管理四大核心功能&#xff1a; 網絡數據獲取&#xff1a; 通過ESP8266 WiFi模塊連接心知天氣API&#xff08;每小時更新&#xff09;獲取北京標準時間服務器的時…

FPGA DDR4多通道管理控制器設計

DDR4控制器一般采用自帶的MIG控制器&#xff0c;用戶控制主要是基于MIG IP核進行設計 實際工程項目中可能只掛載了一組DDR&#xff0c;但是用戶數據可能有很多種&#xff0c;用戶通過給每種數據劃分特定地址進行存儲&#xff0c;如何實現靈活管理成為設計的關鍵 為了方便后端數…

低代碼 x AI,解鎖數智化應用的創新引擎

AI 智能體開發指南 隨著全球信息化浪潮的持續推進&#xff0c;數字化、智能化轉型已成為企業發展的必經之路。在這個變革的時代&#xff0c;企業面臨著前所未有的挑戰與機遇。一方面&#xff0c;市場環境瞬息萬變&#xff0c;企業需要快速響應并調整業務模式&#xff1b;另一方…

【Spring Boot 注解】@Configuration與@AutoConfiguration

文章目錄 Configuration與AutoConfiguration一、Configuration二、AutoConfiguration Configuration與AutoConfiguration 一、Configuration 這是最常用的 Spring 注解之一&#xff0c;表示當前類是一個 配置類&#xff0c;可以定義 Bean 方法&#xff0c;等效于傳統的 XML 配…

arXiv論文 MALOnt: An Ontology for Malware Threat Intelligence

文章講惡意軟件威脅情報本體。 作者信息 作者是老美的&#xff0c;單位是倫斯勒理工學院&#xff0c;文章是2020年的預印本&#xff0c;不知道后來發表在哪里&#xff08;沒搜到&#xff0c;或許作者懶得投稿&#xff0c;也可能是改了標題&#xff09;。 中心思想 介紹開源…