BioTech - ADMET的性質預測 概述

歡迎關注我的CSDN:https://spike.blog.csdn.net/
本文地址:https://blog.csdn.net/caroline_wendy/article/details/136438192

ADMET

ADMET,即 Absorption、Distribution、Metabolism、Excretion、Toxicity,吸收、分布、代謝、排泄、毒性,這些性質對于藥物的療效和安全性有重要的影響。因此,在藥物開發的早期階段,就能依據化合物的 ADMET 性質,對于先導化合物進行有針對性的選取和優化,是非常必要的。然而,實驗評估 ADMET 性質是耗時、耗費和有限的,因此,利用機器學習或深度學習等計算方法來預測 ADMET 性質,是一種有效的替代方案。

1. ADMET 預測算法

ADMET 預測算法

目前,有許多基于機器學習或深度學習的 ADMET 性質預測的算法和工具,主要利用了大量的公共數據庫中的化合物數據和相關的 ADMET 實驗數據,以及一些專業的特征提取方法,來構建不同的預測模型。例如:

  • ADMETboost:基于樹的機器學習模型,使用多種特征,包括指紋和描述符,來預測 22 個 ADMET 任務,包括溶解度、血漿蛋白結合、肝臟代謝、腎臟排泄等。該模型在 Therapeutics Data Commons (TDC,治療數據共享) 的 ADMET 基準數據集上表現優異,對于 22 個任務,該模型在 18 個任務中排名第一,在 21 個任務中排名前三。
  • ADMETlab:在線工具,提供了一系列計算模型,包括溶解度、血漿蛋白結合、肝臟代謝、腎臟排泄等,可以預測藥物在人體內的吸收、分布、代謝和排泄過程,并且評估其潛在的毒性和安全性。該工具使用多種機器學習模型,如隨機森林、支持向量機和 k-最近鄰等,以及一些深度學習模型,如多任務圖注意力網絡等。該工具可以預測 53 個 ADMET 終點,覆蓋了多種 ADMET 相關的性質。
  • SwissADME:免費的在線工具,提供了一系列計算模型,包括溶解度、血漿蛋白結合、肝臟代謝、腎臟排泄和 CYP450 互作等,可以預測藥物在人體內的吸收、分布、代謝和排泄過程,并評估其潛在的毒性和安全性。該工具還提供了一些額外的功能,如藥物分子庫篩選和藥物相互作用預測等。
  • XenoSite Web:這是一款非常有用的在線工具,采用多種機器學習算法和特征提取方法,可以幫助藥物研究人員更好地了解和預測藥物分子在細胞色素 P450 酶(CYP450)中的代謝過程及相應的代謝位點,并生成代謝產物的結構。這對于藥物研究和開發來說非常重要,因為 CYP450 酶是藥物代謝和毒性的主要通路之一。

盡管基于機器學習或深度學習的 ADMET 性質預測的算法和工具已經取得了很多進展和成果,但是仍然存在一些難點和挑戰,例如:

  • 數據的質量和數量:ADMET 性質預測的準確性和可靠性很大程度上依賴于數據的質量和數量。然而,目前,可用的數據往往是不完整、不一致、不可靠或不可獲取的,這給數據的收集、整理、標準化和共享帶來了困難。因此,需要更多的努力來提高數據的質量和數量,以及建立更好的數據管理和交換平臺。
  • 特征的選擇和提取:特征是指用于描述和表示化合物的一些屬性或參數,如指紋、描述符、拓撲、結構等。特征的選擇和提取對于機器學習或深度學習模型的性能和效率有重要的影響。然而,目前,還沒有一個統一的標準或方法來確定哪些特征是最適合或最重要的,以及如何從復雜的化合物結構中提取這些特征。因此,需要更多的研究來探索和開發更好的特征選擇和提取方法。
  • 模型的構建和評估:模型是指用于預測 ADMET 性質的一些數學或計算的方法或過程,如線性回歸、決策樹、神經網絡等。模型的構建和評估涉及到很多的參數和指標,如訓練集、測試集、驗證集、交叉驗證、超參數、準確率、靈敏度、特異度等。這些參數和指標的選擇和調整對于模型的性能和效率有重要的影響。然而,目前還沒有一個統一的標準或方法來確定哪些參數和指標是最適合或最優化的,以及如何從多個模型中選擇或組合最佳的模型。因此,需要更多的研究來探索和開發更好的模型構建和評估方法。

ADMET 應用場景主要包括:

  • 藥物篩選:對于大量的候選化合物進行ADMET性質的評估,從中篩選出符合成藥要求的化合物,以進入后續的藥效和安全性的驗證。
  • 藥物設計:對于已知的化合物進行ADMET性質的分析,從中發現影響ADMET性質的結構特征或分子描述符,以指導化合物的結構優化或改造,以提高藥物的成藥性。
  • 藥物代謝:對于藥物在體內的代謝過程及相應的代謝產物進行預測和分析,以了解藥物的代謝途徑、代謝酶、代謝穩定性、代謝活性等,以評估藥物的藥效和毒性。
  • 藥物毒性:通過計算方法或實驗方法,對藥物在體內的毒性效應進行預測和分析,以了解藥物的致癌性、致畸性、致敏性、肝毒性、腎毒性等,以評估藥物的安全性和副作用。

2. 藥物毒性預測

藥物毒性預測
毒性是指化合物對生物體的不良影響,是藥物發現過程中的一個重要因素,屬于藥物的 ADME/T (吸收、分布、代謝、排泄和毒性) 屬性之一。藥物毒性預測,是指利用計算方法來評估候選藥物的潛在毒性,以篩選出安全有效的化合物,降低藥物開發的時間和成本。

基于機器學習或深度學習的藥物毒性預測是指利用人工智能技術來構建預測模型,從化學結構、基因組數據、高通量篩選數據等各種數據源中提取特征,學習化合物與毒性的關系,預測化合物在不同的毒性終點上的活性或風險。這些方法可以提高預測的準確性和效率,同時也可以減少對動物實驗的依賴。

基于機器學習或深度學習的藥物毒性預測,也面臨著一些難點和挑戰,主要包括:

  • 數據的質量和數量。藥物毒性預測需要大量的高質量的數據來訓練和驗證模型,但是,目前可用的數據往往存在不完整、不一致、不平衡、不可比等問題,導致模型的泛化能力和可靠性受到影響。
  • 特征的選擇和工程。藥物毒性預測需要從復雜的數據中提取有效的特征來表示化合物的結構和性質,但是,目前還沒有統一的標準和方法來選擇和構造最優的特征,不同的特征可能導致不同的預測結果。
  • 模型的解釋性和透明度。藥物毒性預測需要模型能夠提供可解釋的預測結果,以便理解化合物的毒性機制和作用途徑,但是,目前的機器學習或深度學習模型往往是黑盒式的,難以揭示預測的內在邏輯和依據。
  • 倫理和監管的問題。藥物毒性預測需要模型能夠符合倫理和監管的要求,以保證藥物的安全性和有效性,但是,目前的機器學習或深度學習模型還沒有得到廣泛的認可和接受,需要更多的驗證和評估。

3. 藥物代謝產物預測

藥物代謝產物
代謝 Metabolism 是藥物在體內受酶系統或者腸道菌叢的作用而發生結構轉化的過程,是藥物代謝動力學 (ADME) 中的一個重要方面。代謝產物預測是指根據藥物分子的結構和性質,預測其可能的代謝途徑和代謝產物的結構。這對于評估藥物的安全性、有效性和藥物相互作用有重要意義。其中,細胞色素 P450 (CYP450) 是一類廣泛存在于生物體中的氧化還原酶,參與了大約 75% 的藥物代謝反應。因此,預測藥物分子的 CYP450 代謝位點和代謝產物是代謝產物預測的核心問題。

基于機器學習或深度學習的代謝產物預測是一種利用計算模型和算法,從大量的實驗數據中學習和推斷藥物代謝規律的方法。近年來,這種方法在代謝產物預測領域取得了一些進展和突破,提高了預測的準確性和效率。

藥物代謝產物預測的難點和挑戰,包括:

  • 數據的質量和數量:代謝產物預測需要大量的高質量的實驗數據來訓練和驗證計算模型,但是,目前可用的數據集往往規模有限、分布不均、缺乏標準化和注釋,導致模型的泛化能力和可靠性受到影響。
  • 模型的復雜性和可解釋性:代謝產物預測涉及到多種代謝酶、多種代謝途徑、多種代謝產物,以及它們之間的相互作用和影響,這使得模型的構建和優化變得非常復雜和困難。同時,基于機器學習或深度學習的模型往往缺乏可解釋性,難以揭示藥物代謝的分子機制和生物學意義。
  • 模型的適應性和可擴展性:代謝產物預測需要考慮不同的生物體、不同的組織、不同的環境、不同的藥物等多種因素的影響,這要求模型具有良好的適應性和可擴展性,能夠適應不同的場景和需求,但是,目前的模型往往只針對特定的條件和數據進行訓練和測試,難以泛化到其他情況。

CYP450 是細胞色素 P450 的簡稱,是含有血紅素作為輔因子的單加氧酶,廣泛存在于生物體中,參與許多重要的生物合成和代謝過程。CYP450 酶可以催化多種有機底物的氧化反應,例如將氧氛中的一個氧原子插入到底物分子中,而另一個氧原子被還原形成水。CYP450 酶在藥物代謝中起著關鍵作用,影響藥物的活性、安全性和藥物-藥物相互作用。CYP450 酶是一個龐大的酶超家族,有許多不同的同工酶和亞型,根據氨基酸序列和結構特征進行分類和命名。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/717451.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/717451.shtml
英文地址,請注明出處:http://en.pswp.cn/news/717451.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

題目 1629: 藍橋杯算法訓練VIP-接水問題

題目描述: 學校里有一個水房,水房里一共裝有m個龍頭可供同學們打開水,每個龍頭每秒鐘的供水量相等,均為1。現在有n名同學準備接水,他們的初始接水順序已經確定。將這些同學按接水順序從1到n編號,i號同學的接水量為wi。…

Linux shell:補充命令的使用

目錄 一.導讀 二.正文 三.結語 一.導讀 上一篇介紹了腳本的簡單概念以及使用,現在補充一些命令。 二.正文 目前處于全局目錄,通過mkdir創建名我為day01的文件。 通過cd命令day01 切換至day01文件當中。 使用vim文本編輯器文件名(firstdir&…

設計模式學習筆記——工廠方法模式

設計模式(創建型)—— 工廠方法模式 傳統的獲取對象方法,是通過 new 關鍵字獲取一個對象,但是如果多個地方都需要該對象,就需要 new 很多次,這時候如果這個類發生了一些改變,如類名變了&#x…

靜態上下文調用了非靜態上下文

問題描述: static修飾的方法不能調用非static修飾方法 問題原因: 在Java中,靜態方法(如main方法)可以直接訪問靜態成員(包括靜態變量和靜態方法),但不能直接訪問非靜態成員&#…

【Python】進階學習:pandas--query()用法詳解

📚【Python】進階學習:pandas–query()用法詳解 🌈 個人主頁:高斯小哥 🔥 高質量專欄:Matplotlib之旅:零基礎精通數據可視化、Python基礎【高質量合集】、PyTorch零基礎入門教程👈 希…

劍指offer面試題24 二叉樹搜索樹的后續遍歷序列

考察點 二叉搜索樹,樹的后序遍歷知識點 題目 分析 本題目要求判斷某序列是否是二叉搜索樹的后序遍歷序列,后序遍歷的特點是左右根,因此序列的最后一個元素肯定是根結點,而前面的序列可以分為倆部分,第一部分是左子樹…

LeetCode --- 無重復字符的最長子串

題目描述 無重復字符的最長子串 找到無重復的最長連續字符串。 示例1中 abc | bca | cab 都符合題意。輸出3即可。 代碼 可以使用暴力枚舉 哈希表,哈希表來判斷是否重復,枚舉來判斷每一種情況,需要開兩層for循環,時間復雜度n…

linux高級編程:線程(二)、進程間的通信方式

線程: 回顧線程(一): 1.線程間通信問題 線程間共享同一個資源(臨界資源) 互斥: 排他性訪問 linux系統 -- 提供了Posix標準的函數庫 -- 互斥量(互斥鎖) 原子操作&#x…

精通Matplotlib:從入門到精通的繪圖指南

在本篇文章中,我們將深入探索Matplotlib庫,這是一個強大的Python繪圖庫,廣泛用于數據可視化。Matplotlib讓我們能夠以簡單而直觀的方式創建各種靜態、動態和交互式的圖表。無論你是數據分析師、科研人員,還是任何需要數據可視化的…

用Redis如何實現延遲隊列?

在Redis中實現延遲隊列可以利用有序集合(Sorted Set)和定時任務的方式。下面是一個基本的實現思路: 添加延遲任務: 將任務信息作為一個字符串存儲在Redis中,同時將其對應的執行時間作為分數(score)存儲在有序集合中。使…

Bililive-go 實現直播自動監控錄制

前言 最近有直播錄制的需求,但是自己手動錄制太麻煩繁瑣,于是用了開源項目Bililive-go進行全自動監控錄制,目前這個項目已經有3K stars了 部署 為了方便我使用了docker compose 部署 version: 3.8 services:bililive:image: chigusa/bilil…

win環境nginx實戰配置詳解

項目中經常使用nginx做負載均衡,接口路由、文件、文檔的上傳及下載、視頻的代理播放等等,都離不開nginx的支持,今天我們分享一下其個使用場景。 1、配置文件 nd-nginx.conf 全局配置 #全局配置端,對全局生效,主要設置…

leetcode-字符串相加

415. 字符串相加 題目中已經說明不能使用庫函數直接將輸入的字符串轉換為整數。這就需要我們自己實現大數加法的邏輯,我們可以從兩個字符串的最后一位開始,逐位相加,同時記錄進位。如果某一位相加的結果超過10,那么需要向前進位。…

javascript實現的星座查詢

今天在這個網站http://xzxys.wiicha.com/看到查詢星座幸運色的效果,想研究一下代碼,結果右鍵禁用。后來參考了一下別人的代碼,琢磨著先實現了一下星座查詢的功能,輸入月份和日期四位數后,可以查詢屬于哪個星座&#xf…

群體風暴之錘(War3地圖編輯器)

文章目錄 0、大致原理1、創建隱形單位2、新事件開端3、環境→新條件4、動作4.1、單位組4.1.1、圓范圍內單位4.1.2、指定條件 4.2、對單位組內的所有單位釋放風暴之錘 0、大致原理 真MK向目標點釋放風暴之錘時選定(以技能釋放點為圓心,設定半徑&#xff0…

Python編程語言常用的包管理工具介紹

conda是一個開源的包管理器和環境管理器,用于安裝、運行和更新包和它們的依賴項。conda可以用于Python編程語言,但它也支持其他編程語言。conda的主要特點是它能夠在不同的環境中管理不同的包集合,這使得它非常適合于數據科學和機器學習項目&…

洛谷 P1439 最長公共子序列

題目描述 給出 1,2,…,n 的兩個排列 P1? 和 P2? ,求它們的最長公共子序列。 輸入格式 第一行是一個數 n。 接下來兩行,每行為 n 個數,為自然數 1,2,…,n 的一個排列。 輸出格式 一個數,即最長公共子序列的長度。 輸入輸出…

詳解算法的時間復雜度和空間復雜度!

目錄 ?編輯 1. 算法效率 2. 時間復雜度 2.1 時間復雜度的概念 2.2 大O的表示漸進法 2.3 一個栗子 3. 空間復雜度 4. 常見復雜度對比 5. 完結散花 ??????? 悟已往之不諫,知來者猶可追 創作不易,寶子們!如果這篇文章對你們有…

Flex布局

Flex布局是一種用于創建靈活且自適應的布局模型,它使得元素能夠更好地響應不同的屏幕尺寸和設備。Flex布局基于容器和項目的概念,通過設置容器的屬性來控制項目的布局和對齊方式。 Flex布局的關鍵概念包括: 父容器(Flex容器&…

Git實戰(3)之merge與rebase區別

1,采用merge和rebase后,git log的區別,merge命令不會保留merge的分支的commit 2,處理沖突的方式: (一股腦)使用merge命令合并分支,解決完沖突,執行git add .和 git commit -mfix conflict。這個時候會產生一個commit。(交互式)使用rebase命令合并分支,解決完沖突,…