AIDD-深度學習 MetDeeCINE 破譯代謝調控機制

深度學習 MetDeeCINE 破譯代謝調控機制

Image

目錄

  1. 使用 FEP/REMD 和 DFT 方法準確預測藥物多靶點絕對結合自由能的新途徑。
  2. Scorpio 框架利用對比學習優化核苷酸序列表示,提升基因組分析效率,尤其在未知序列的分類和泛化能力上表現出色。
  3. LPM 模型整合多模態擾動數據,預測轉錄組結果,加速藥物發現和系統生物學研究。
  4. MetDeeCINE 利用深度學習和多組學數據,無需詳細動力學參數即可預測酶活性對代謝物濃度的影響。
  5. MSNGO 利用結構信息和網絡傳播,顯著提升了跨物種蛋白質功能注釋的準確性。

1. 快速精準預測藥物多靶點結合自由能

藥物的毒性和副作用通常與脫靶結合密切相關。因此,準確預測藥物與體內多個蛋白質的絕對結合自由能至關重要,它決定了藥物對其分子靶點的親和力及其選擇性。

然而,ABFE 的實驗測量具有挑戰性,許多蛋白質與潛在藥物和其他結合分子的 ABFE 值尚不清楚。因此,迫切需要開發準確的 ABFE 計算方法。

本研究計算了兩種藥物分別與多個蛋白質的 ABFE,以檢驗現有計算方法的準確性并探索改進途徑。

研究者采用了兩種主要方法:自由能微擾結合副本交換分子動力學 (FEP/REMD) 和基于簇方法和簡化模型的密度泛函理論 (DFT)。

此外,研究者還利用能量分解分析 (EDA) 對 DFT 計算結果進行了補充分析。

Image

通過比較不同方法的計算結果與已知的實驗數據,作者評估了 FEP/REMD 和 DFT 方法在 ABFE 預測方面的準確性和適用性。結果表明,兩種方法均能在一定程度上預測 ABFE,但精度受多種因素影響,例如蛋白質的結構復雜性和計算資源的限制。此外,EDA 分析揭示了藥物與蛋白質之間相互作用的關鍵能量組分,為進一步優化計算方法和指導藥物設計提供了 valuable insights。

📜Paper: https://doi.org/10.1021/acs.jcim.4c01555

2. 基于對比學習的 Scorpio 框架提升基因組序列分析效率

研究者開發了一種名為 Scorpio 的框架,該框架利用對比學習優化核苷酸序列表示,從而提升基因組分析效率。具體而言,Scorpio 通過優化嵌入向量來有效區分相似和不相似 DNA 序列,從而在分類任務中,例如分類單元和基因分類,取得了顯著的改進。與傳統的基于比對的方法相比,Scorpio 展現出更強的泛化能力,尤其體現在對先前未見 DNA 序列的處理上,使其成為宏基因組分析的理想工具。此外,Scorpio 還能處理不同長度的序列,甚至包括新的分類單元。

為了實現卓越的性能,Scorpio 結合了預訓練基因組語言模型和 k-mer 頻率嵌入。這種方法在抗菌素耐藥性 (AMR) 檢測和啟動子區域識別等應用中表現出色。框架的多功能性使其能夠適應不同的應用場景。

Scorpio 的一大優勢在于能夠在單個模型中同時處理基因水平和分類學數據。與需要針對不同分類任務構建單獨模型的方法相比,這極大地提高了效率。Scorpio 采用三元組網絡,通過比較序列的相似性進行學習,增強了其對基因和分類單元進行高精度分類的能力,尤其對于訓練數據中未出現的新基因或分類單元。

此外,Scorpio 還包含一個置信度評分機制,可衡量預測的質量,從而提高其在下游應用中的可靠性。在實際的基因組分析中,不確定性是不可避免的,因此這項功能至關重要。Scorpio 的靈活性還體現在其分層學習結構上,該結構可以針對各種數據集和不同級別的生物信息進行定制,從而增強其在各種基因組任務中的泛化能力。

Image

📜Paper: https://www.nature.com/articles/s42003-025-07902-6
💻Code: https://github.com/EESI/Scorpio

3. LPM:AI 驅動生物發現新引擎

大型擾動模型 (LPM) 是一項深度學習框架,它通過整合化學、基因、轉錄組和細胞活力等多模態擾動數據集,實現了計算機模擬的生物學發現。

LPM 使用擾動 §、讀數 ? 和上下文 ? 的解耦潛在表征,能夠準確預測擾動后的轉錄組結果,其性能優于 CPA、GEARS、Geneformer 和 scGPT 等現有模型,尤其是在涉及未見擾動 - 上下文 - 讀數組合的情況下。

LPM 采用僅解碼器、PRC 解耦的架構,不同于基于編碼器的模型。這種架構使其能夠獨立于嘈雜的實驗環境學習擾動 - 響應規則,并無縫擴展以適應不同的數據格式。

值得注意的是,LPM 是第一個將基因和化學擾動整合到統一潛在空間的模型,從而能夠識別共享的分子機制。例如,它可以將 CRISPR 敲除與靶向相同基因(例如,MTOR、HDAC2/3、HMGCR)的藥物正確地聚類。

此外,LPM 學習的嵌入具有生物學意義,在基因功能預測方面優于 STRING 和 Gene2Vec 等人工篩選的嵌入,并且反映了已知的蛋白質復合物和分子通路。研究者利用 LPM 通過估算缺失的擾動結果來進行基因 - 基因相互作用網絡的因果推斷。結果表明,使用 LPM 預測的結果增強真實數據可以顯著提高 Guanlab 等最先進網絡推斷算法在基準評估中的性能。

在一個概念驗證應用中,研究者使用 LPM 預測上調 PKD1(一種與常染色體顯性遺傳性多囊腎病 (ADPKD) 相關的基因)表達的藥物。他汀類藥物(如辛伐他汀)是排名靠前的候選藥物,回顧性臨床數據顯示,他汀類藥物使用者中 ESRD 進展顯著減少。

LPM 還展現了其擴展性:隨著更多擾動類型或實驗環境的添加,預測精度會提高,這表明它有潛力從不斷增長的公共數據集中受益。雖然 LPM 缺乏對詞匯表外上下文的零樣本泛化能力,但其詞匯表內插值和多任務處理能力使其對于利用合并的擾動實驗非常有用。

這項研究表明,LPM 可以通過計算填補未觀察到的實驗結果并從高通量篩選中提取潛在的生物學結構,從而加速實驗設計、治療發現和系統生物學研究。

Image

📜Paper: https://arxiv.org/abs/2503.23535
💻Code: https://github.com/GSK-AI/LPM (to be released)

4. 深度學習 MetDeeCINE 破譯代謝調控機制

MetDeeCINE 是一種可擴展、可解釋的深度學習框架,它直接從多組學數據中建模代謝調控,預測酶活性如何影響代謝物濃度,而無需詳細的動力學參數或通量數據。其核心是采用了一種代謝信息圖神經網絡 (MiGNN),該網絡整合了代謝物之間的化學計量關系。

該模型的性能優于標準機器學習方法,并能捕捉代謝網絡中的遠程調控效應。與傳統的動力學模型不同,MetDeeCINE 僅需要蛋白質組學和代謝組學測量值以及已知的化學計量關系。它推斷濃度控制系數 (CCC),量化酶 - 代謝物的影響,從而實現對代謝控制的網絡規模理解。

在使用大腸桿菌代謝動力學模型進行的模擬中,MiGNN 即使在模型中沒有明確的變構數據的情況下,也能準確地恢復 CCC 和調控結構,甚至捕捉到間接和變構效應。將 MetDeeCINE 應用于小鼠肝臟多組學數據,成功地將 Fbp1 鑒定為糖異生的限速酶,并揭示了果糖 -6-磷酸、葡萄糖 -6-磷酸和葡萄糖 -1-磷酸等代謝物之間的機制聯系,這與已知的生物學知識一致。

MetDeeCINE 的一個關鍵創新在于,即使某些成分未被測量,它也能識別有意義的酶 - 代謝物聯系,使其適用于未完全注釋的生物體,并擴展其在系統生物學和代謝工程中的效用。與其他基于機器學習的組學整合模型相比,MetDeeCINE 的可解釋性因其生物學指導的架構而得到增強。可以通過探測學習到的權重矩陣來揭示隱藏的調控機制和潛在的治療靶點。MetDeeCINE 彌合了數據密集型動力學建模和黑盒機器學習之間的差距。它可以很好地推廣到不同生物體和條件,并在疾病機制發現、藥物靶點識別和合成生物學設計方面具有應用潛力。

Image

📜Paper: https://www.biorxiv.org/content/10.1101/2025.03.24.645125v1

5. MSNGO:跨物種蛋白質功能預測新標桿

MSNGO 是一種新型的多物種蛋白質功能預測方法,它首次將 AlphaFold2 衍生的結構特征整合到異構網絡傳播框架中,顯著提高了跨物種功能注釋的準確性。

與以往僅依賴序列和蛋白質相互作用 (PPI) 數據的模型不同,MSNGO 使用在 3D 接觸圖上訓練的圖卷積池化網絡提取蛋白質結構表征,從而更深入地理解結構與功能之間的關系。

該模型構建了一個包含 13 個物種的異構網絡,結合了序列同源性和 PPI 數據,并使用圖注意力機制傳播蛋白質特征和功能標簽,實現了跨物種功能轉移。

在訓練過程中,MSNGO 將蛋白質結構和序列特征連接起來,并在網絡中傳播。在預測階段,標簽傳播補充了特征傳播,尤其提升了注釋稀疏蛋白質的預測準確性。

與 SPROF-GO、DeepGraphGO 和 PSPGO 等現有方法相比,MSNGO 在生物過程 (BPO)、分子功能 (MFO) 和細胞組分 (CCO) 三個 GO 分支上均表現更優,實現了更高的 Fmax 和 AUPR,以及更低的語義距離。尤其在 BPO 分支中,MSNGO 的性能比次優方法提升了 10% 以上,表明其在處理多標簽預測中的大型復雜標簽空間方面具有顯著優勢。

Image

消融研究證實了結構特征的重要性:去除結構特征會顯著降低性能,尤其是 Fmax 值。這驗證了蛋白質結構能夠捕獲序列信息中無法體現的關鍵功能線索。

此外,MSNGO 對序列特征的變化具有魯棒性,即使使用 Interproscan 和 ESM-2 等快速替代方案也能保持良好的性能,這證明了其在大規模、多物種注釋任務中的可擴展性。MSNGO 也能很好地泛化到單物種數據。在人類和小鼠數據集上的評估結果表明,MSNGO 優于 Struct2GO 等單物種方法,這得益于其利用跨物種功能信號的能力。

憑借高效的傳播、對多種數據模態的支持以及改進的泛化能力,MSNGO 為多物種蛋白質功能預測樹立了新的標桿,為特征信息不足的生物體進行更快速的蛋白質功能注釋鋪平了道路。

📜Paper: https://arxiv.org/abs/2503.23014
💻Code: https://github.com/blingbell/MSNGO

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/900391.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/900391.shtml
英文地址,請注明出處:http://en.pswp.cn/news/900391.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【2】搭建k8s集群系列(二進制)之安裝etcd數據庫集群

一、etcd服務架構 Etcd 是一個分布式鍵值存儲系統,Kubernetes 使用 Etcd 進行數據存儲,所以先 準備一個 Etcd 數據庫,為解決 Etcd 單點故障,應采用集群方式部署,這里使用 3 臺組建集群,可容忍 1 臺機器故障…

fastGPT—前端開發獲取api密鑰調用機器人對話接口(HTML實現)

官網文檔鏈接&#xff1a;OpenAPI 介紹 | FastGPT 首先按照文檔說明創建api密鑰 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><meta name"viewport" content"widthdevice-width, initial-sca…

cpp自學 day19(多態)

一、基本概念 同一操作作用于不同的對象&#xff0c;產生不同的執行結果 &#x1f449; 就像「按F1鍵」&#xff1a;在Word彈出幫助文檔&#xff0c;在PS彈出畫筆設置&#xff0c;?同一個按鍵觸發不同功能 &#xff08;1&#xff09;多態類型 類型實現方式綁定時機?靜態多態…

Java 大視界 -- Java 大數據在航天遙測數據分析中的技術突破與應用(177)

&#x1f496;親愛的朋友們&#xff0c;熱烈歡迎來到 青云交的博客&#xff01;能與諸位在此相逢&#xff0c;我倍感榮幸。在這飛速更迭的時代&#xff0c;我們都渴望一方心靈凈土&#xff0c;而 我的博客 正是這樣溫暖的所在。這里為你呈上趣味與實用兼具的知識&#xff0c;也…

人臉考勤管理一體化系統(人臉識別系統,簽到打卡)

人臉考勤管理一體化系統 項目介紹 本項目是基于Flask、SQLAlchemy、face_recognition庫的人臉考勤管理一體化系統。 系統通過人臉識別技術實現員工考勤打卡、人臉信息采集、人臉模型訓練等功能。 項目采用前后端分離的技術框架&#xff0c;基于Flask輕量級Web框架搭建后端服務…

單調棧學習C++

目錄 一&#xff0c;每日溫度 二&#xff0c;下一個更大的元素I 三&#xff0c;下一個更大的元素II 四&#xff0c;接雨水 小結&#xff1a; 單調棧是一種特殊的棧結構&#xff0c;里面的元素按照單調遞增或者遞減的順序排列。常用于解決元素左邊或者右邊比它大或者小的問…

網絡釣魚攻擊的威脅和執法部門的作用(第一部分)

在當今的數字世界中&#xff0c;網絡犯罪分子不斷開發新技術來利用個人、企業和政府機構。 最普遍和最具破壞性的網絡犯罪形式之一是網絡釣魚——一種社會工程手段&#xff0c;用于欺騙人們提供敏感信息&#xff0c;例如登錄憑據、財務數據和個人詳細信息。 隨著網絡釣魚攻擊…

左值與右值,空間與數據

左值是空間&#xff0c;右值是數據 編程總是對“數據”&#xff0c;對"存放數據的空間"操作 a返回一個當前的數據&#xff0c;存放到一個臨時空間中&#xff0c;自身的空間中的數據再進行運算 a直接對自身空間中的數據進行運算 其余知識&#xff1a; 1.變量名的意…

無人機飛行術語科普!

一、基礎操作類 1. 炸機 指無人機意外墜毀或嚴重損壞&#xff08;如撞樹、撞樓、失控摔機等&#xff09;。 例句&#xff1a;“今天風太大&#xff0c;差點炸機&#xff01;” 2. 一鍵放生 調侃某些情況下無人機失控飛丟&#xff0c;無法找回&#xff08;源自某些品牌…

模擬算法(一):一維數組模擬

目錄 模擬的概念 例1&#xff1a;開關燈 算法思路&#xff1a; 代碼如下&#xff1a; 輸入輸出&#xff1a; 例2&#xff1a;序列操作和查詢 算法思路&#xff1a; 代碼如下&#xff1a; 輸入輸出&#xff1a; 例3&#xff1a;數組折疊 算法思路&#xff1a; 代碼如…

MySQL 基礎入門

寫在前面 關于MySQL的下載安裝和其圖形化軟件Navicat的下載安裝,網上已經有了很多的教程,這里就不再贅述了,本文主要是介紹了關于MySQL數據庫的基礎知識。 MySQL數據庫 MySQL數據庫基礎 MySQL數據庫概念 MySQL 數據庫&#xff1a; 是一個關系型數據庫管理系統 。 支持SQL語…

Qt中的多種輸出方式,信號與槽的基本使用

完成Hello World可以通過很多控件實現 如采用編輯框來完成hello world 編輯框分為單行編輯框----QLineEdit 和多行編輯框---QTextEdit 采用單行編輯框&#xff0c;創建項目后&#xff0c;展開forms文件夾&#xff0c;雙擊ui文件進入 qt designer設計頁面 找到line edit 拖到頁…

英語表達年代和世紀

英語表達年代和世紀 1. Century (世紀)1.1. Start and end of centuries 2. Decade (年代)2.1. Usage 3. 英語表達年代和世紀4. HomeworkReferences XXX0 年代指 XXX0 年 - XXX9 年的連續 10 年&#xff0c;例如 1760 年代指 1760 年至 1769 年這連續 10 年。 XX 世紀 X0 年代…

MySQL數據庫管理5

23.事務 1&#xff09;事務&#xff1a;可以認為是做一件事情 需要多個SQL 要么同時成功 要么同時失敗 需求&#xff1a;銀行轉賬update 你的賬戶 把你的錢減少update 你朋友的賬戶 把他的錢增多?這兩個SQL不能只成功一個 要么都成功 要么都失敗那么 我們就需要用到事務了 它…

閉包和裝飾器

什么是閉包 閉包&#xff08;Closure&#xff09;是 Python 中一個非常重要的概念&#xff0c;它是一種特殊的函數對象&#xff0c;通常用于封裝和延遲計算某些值。以下是閉包的詳細定義和解釋&#xff1a; 1.閉包的定義 閉包是指一個函數對象&#xff0c;它不僅包含函數的代…

notepad++8.6.4安裝及細節

notepad8.6.4下載安裝&#xff08;附安裝包&#xff09; 一、安裝包下載1.1方法一&#xff1a;官網下載&#xff08;點擊跳轉&#xff09;1.2方法二&#xff1a;網盤鏈接分享8.6.4版本 二、安裝過程細節2.1這里的組件建議全部勾選。點擊“下一步”。2.2 勾選①&#xff1a;可以…

COZE通關指南:工作流與插件開發

前言 本文隸屬于專欄《AI Agent 通關指南》,該專欄為筆者原創,引用請注明來源,不足和錯誤之處請在評論區幫忙指出,謝謝! 本專欄目錄結構和參考文獻請見《AI Agent 通關指南》 正文 1. 平臺基礎介紹 ?? 1.1 COZE平臺概述 COZE平臺(coze.cn)是一個強大的AI應用開發平臺…

【Block總結】ENLTransformerBlock,高效非局部變換器塊|即插即用

1. 論文信息 標題: Perspective+ Unet: Enhancing Segmentation with Bi-Path Fusion and Efficient Non-Local Attention for Superior Receptive Fields論文地址: arXiv:2406.14052 2. 創新點 雙路徑編碼策略: 在編碼器階段引入雙路徑策略,結合傳統卷積和空洞卷積的結果,平…

【爬蟲】網易云音樂評論數據爬取

文章目錄 &#x1f356; 前言&#x1f3b6;一、抓取要求?二、代碼展示&#x1f3c0;三、運行結果&#x1f3c6;四、知識點提示 &#x1f356; 前言 【爬蟲】網易云音樂歌詞/評論數據爬取 &#x1f3b6;一、抓取要求 描述: 輸入歌曲的id&#xff0c;獲取對應歌曲的用戶評論信…

C++使用Qt Charts創建數據可視化圖表

Qt Charts 是一個強大的工具&#xff0c;用于創建直觀的數據可視化圖表。本文將通過一個具體的示例&#xff0c;展示如何使用 Qt Charts 創建一個包含多條數據序列、自定義坐標軸和隨機數據生成的圖表。 示例代碼解析 以下是一個完整的示例代碼&#xff0c;展示如何使用 Qt Ch…