善用KEGG數據庫挖掘目的基因

有關KEGG的分析在很多已發表的論文中都十分常見,涉及到的方向也很廣泛,比如:代謝組、表觀組、轉錄組等等。通常得到相關的基因集或者代謝物后,我們都希望能夠快速了解它們的蛋白功能和涉及的調控機制,從而進一步鎖定接下來關注的核心基因。

KEGG富集分析就是一種很好的手段。該分析方法是由Kanehisa實驗室(Kanehisa Laboratories)在1995年開發。

?什么是KEGG數據庫??

KEGG(Kyoto Encyclopedia of Genes and Genomes)是一個包含生物信息學數據庫和相關工具的綜合性資源,旨在幫助研究人員理解生物系統的功能和組成。KEGG數據庫包含了多種生物信息學數據,包括基因組、代謝途徑、疾病和藥物等信息。主要包括以下幾個部分:

1

基因組數據庫:

包括已知生物物種的基因組序列和注釋信息。

2

代謝途徑數據庫:

包括生物體內代謝途徑的圖譜和相關基因、蛋白質等信息。

3

疾病數據庫:

包括與基因和代謝途徑相關的疾病信息。

4

藥物數據庫:

包括與基因和代謝途徑相關的藥物信息。

KEGG數據庫還提供了一系列工具和資源,如KEGG Pathway,KEGG BRITE,KEGG Orthology等,幫助我們進行生物信息學分析和研究。

圖片

進入KEGG官網的頁面后我們可以看到便捷搜索框、簡介與引用、KEGG子庫列表以及各種分析工具等。其中,KEGG PATHWAY會是我們要重點關注的部分,點擊進入后首先會看到pathway的一級分類。目前可以分為七大類,分別為:

1

代謝途徑(Metabolic Pathways):

包括碳水化合物代謝、脂類代謝、氨基酸代謝、核苷酸代謝等。

2

遺傳信息處理( Genetic Information Processing):

包括轉錄、翻譯、DNA 復制、修復等。

3

環境信息處理( Environmental Information Processing):

包括信號轉導、細胞周期、細胞凋亡等。

4

細胞過程(Cellular Processes):

包括細胞結構、細胞運動、細胞分裂等。

5

有機系統(Organismal Systems):

包括免疫系統、內分泌系統、循環系統、消化系統、排泄系統、神經系統等。

6

人類疾病(Human Diseases):

包括各種人類疾病的相關基因和蛋白質信息。

7

藥物開發(Drugs Development):

包括各種藥物的作用機制和代謝途徑等信息。

圖片

除此之外,頁面的下方我們也可以看到更為詳細的分類。KEGG目前一共有三級分類,我們常說的富集通路為第三級分類。

說到這里,大家可能會問到不同的編號有什么含義呢?或者他們的區別在哪里?

其實每個通路都由一個五位數字標識,后跟以下任意一個:map,ko,ec,rn和三字母或四字母生物代碼,它們分別代表五種通路類型:

  • map編號:代表reference pathway,根據已有的知識繪制的、概括的、詳盡的具有一般參考意義的代謝圖。一個點同時表示一個基因,這個基因編碼的酶或這個酶參加的反應

  • org編號:物種特異性通路,這里就是將K編號基因(直系同源基因,后面會介紹)換為每個物種中對應的基因

  • ko編號:KO通路中的點表示直系同源基因

  • ec編號:EC通路中的點表示相關的酶

  • rn編號:化學反應通路中的點只表示該點參與的某個反應、反應物及反應類型

這五種前綴其實都是同一張通路圖,只不過高亮顯示的內容不同。要注意的是KEGG各個通路并非完全獨立的,而是存在著普遍的聯系。而且KEGG通路的聯系一般不是單純的上下游關系,更多是重疊交錯的關系。在轉錄組、表觀組研究中我們最常見的是map編號和ko編號。

了解完KEGG數據庫的基本界面信息,我們再來認識下KEGG注釋結果和富集分析結果。以下是富集分析后最常見的兩種文件格式。

?KEGG注釋結果文件?

與富集分析不同,KEGG注釋是基于基因本身比對數據庫后給出對應的K號,K號表示基因,每個號代表的是所有物種的一個同源基因。

以“K00410”為例,通過K號的搜索也能查找到對應的通路圖。

Entry、Symbol、Name為基本信息;Pathway表示相關的map通路,點擊map號可顯示對應通路圖;Module表示包含這個KO條目的KEGG模塊,點擊鏈接后在模塊map中相應的KO矩形會被標記為紅色;Brite代表了遵循KEGG通路層次結構的KO系統的分級分類,以及BRITE數據庫中的其他分類;Other DBs鏈接到KEGG REACTION,以及COG,GO和其他分類系統;Genes表示KEGG組織中屬于這個KO組的基因;Reference、Authors、Title、Journal 為該通路圖的參考文獻信息。

KEGG富集分析的結果文件

通過目的基因集和背景文件,完成富集分析后我們會得到下方格式的結果文件。

圖片

ID :KEGG pathway ID

Description :KEGG Pathway ID 的描述

GeneRatio :本次富集實驗注釋到該 KEGG Pathway 的基因數/本次富集實驗注釋到 KEGG Pathway 數據庫的基因總數

BgRatio :基因組中能注釋到該KEGG Pathway的基因數/基因組中能注釋到 KEGG Pathway數據庫的基因總數

pvalue :富集P value (本表格中保留 3 位小數)

p.adjust :校正后的P value (本表格中保留 3 位小數)

qvalue :富集Q value (本表格中保留 3 位小數)

geneID :富集的基因名稱

Count :富集的基因個數

一般來說,通過Description列對于通路的描述可以快速鎖定與研究目的相關的通路和基因。但有些通路的簡單描述可能并不能滿足老師的需求,此時就需要我們關注ID,即結果第一列的KEGG map號,“00190”=“map00190”。

這里我們以map00190為例,通過KEGG官網輸入map號再Search可以得到更為詳盡的map通路信息。

圖片

圖片

  • 關于導航欄:

  1. scale拉動可以調節右側圖片大小

  2. 用來通過ID或別名搜索map中對象,并可顯示基因對應的ko號

  3. 可通過多個ID 和KEGG標識符搜索map中對象

  4. 按照模塊選擇代謝途徑

  5. 光標移至圖中任意圓圈顯示對應的C number/化合物,方框顯示ko number/基因名稱,圓角矩形顯示的是另外的通路圖。

注:圖中我們可以標注出感興趣的蛋白、mRNA或者酶等等,標注后的圖片點擊上方Download即可下載。點擊“Change pathway type”可切換每種通路類型以及對物種進行選擇。

KEGG通路圖本質是一副線框圖,即由點和線構成的基因-代謝物關系圖。圖中的方框、箭頭、圓圈等也分別代表著不同的含義,關系類型可以分為蛋白-蛋白互作關系,基因表達關系和酶-酶關系。要注意的是KEGG通路圖之間并非孤立的,而是常常會標注該通路中的基因或代謝物來自或流向其它相關的通路。

富集分析常見結果圖

使用KEGG數據庫分析后,結果如何可視化呢?這里有些例子供大家參考。

圖片

......

其中大部分圖通過愛基百客云平臺即可實現無代碼完成,真正的小白福音,歡迎咨詢哦~

相關教程:富集分析不求人,零代碼可視化GO/KEGG分析結果

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/15269.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/15269.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/15269.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

NetSuite Intercompany COGS科目設置問題

在22年底的NetSuite多公司功能串講中,有一個題目是Intercompany COGS科目的設置問題。近期在項目上這個問題被密集討論。為了方便分享,所以在此摘出來獨立成文。有興趣的同學也可以翻看之前的視頻。 NetSuite知識會 第8談 多公司功能串講 NetSuite Inter…

圖論(從數據結構的三要素出發)

文章目錄 邏輯結構物理結構鄰接矩陣定義性能分析性質存在的問題 鄰接表定義性能分析存在的問題 十字鏈表(有向圖)定義性能分析 鄰接多重表(無向圖)定義性能分析 數據的操作圖的基本操作圖的遍歷廣度優先遍歷(BFS)算法思想和實現性能分析深度優先最小生成…

WORD、PPT技巧

WORD技巧 編輯設置 word標題導航窗口怎么調出word2016,縮小了頁面,可是怎么是豎著的一頁一頁排列啊?以前不是好幾頁橫排著的么?怎么設置,求救:在Word標題欄那一行找到“視圖”,點擊“顯示比例…

20212416 2023-2024-2 《移動平臺開發與實踐》第5次作業

百度地圖應用 1.實驗內容2.實驗過程2.1 Android Studio配置2.1. 創建一個Android項目2.2 在項目中本地集成BaiduMap SDK 2.2 編寫代碼2.2.1 配置AndroidManifest.xml文件2.2.2 編寫UI界面布局文件2.2.3 編寫主函數代碼2.2.4 運行結果 3.學習中遇到的問題及解決4.學習感悟與思考…

向量數據庫的使用

向量數據庫 向量數據庫是一種專門用于存儲、管理和查詢高維向量數據的數據庫系統。隨著人工智能和機器學習的廣泛應用,向量數據庫在處理非結構化數據(如文本、圖像、音頻和視頻等)的任務中變得越來越重要。本文將介紹快速使用Chroma 安裝 …

Pyqt5中獲取按鈕的值

使用Sender()函數 // An highlighted block class MyWindow(QWidget):def __init__(self):super(MyWindow, self).__init__()self.setui()# #def calculate(self):button self.sender()print("button:{}".format(button.text()))def setui(self):data [["7&…

Nginx將https重定向為http進行訪問的配置(附Demo)

目錄 前言1. Demo2. 彩蛋前言 對應nginx的基本知識推薦閱讀: Nginx配置靜態網頁訪問(圖文界面)Nginx從入門到精通(全)java框架 零基礎從入門到精通的學習路線 附開源項目面經等(超全)由于網站默認無配置https,但輸入網址的時候瀏覽器默認帶https,導致網頁一直無法訪問…

Spring的依賴注入

Date public class Student{public String name ;public String[] array ;public Grade grade;public List list;public Set set;public Map map;public Properties prop;//使用IOC默認使用無參構造器創建對象,沒有無參構造器會報錯 // public Student(Strin…

數據結構篇其三---鏈表分類和雙向鏈表

? 前言 數據結構篇其二實現了一個簡單的單鏈表,鏈表的概念,單鏈表具體實現已經說明,如下: 單鏈表 事實上,前面的單鏈表本質上是無頭單向不循環鏈表。此篇說明的雙向鏈表可以說完全反過來了了。無論是之前的單鏈表還…

Java進階學習筆記12——final、常量

final關鍵字: final是最終的意思。可以修飾類、方法、變量。 修飾類:該類就被稱為最終類,特點是不能被繼承了。 修飾方法:該方法是最終方法,特點是不能被重寫了。 修飾變量:該變量只能被賦值一次。 有些…

智慧校園的建設思路

智慧校園建設的一個主要目的就是要打破學校內的信息孤島,其核心是在人、流程和信息三個層面的全面整合。智慧校園應該能夠為全校師生員工及校外用戶提供統一的、一站式的服務渠道;能夠將學校各種業務流程連接起來,實現各種應用系統的互聯互通…

postgresql insert on conflict 不存在則插入,存在則更新

向一張表執行插入動作,如果插入的字段數據已存在,則執行更新操作,不存在則進行插入操作。 1、創建一張表 CREATE TABLE "user_info" ( "id" int2 NOT NULL, "name" varchar(20) COLLATE "pg_catalog&quo…

基于Tensorflow卷積神經網絡人臉識別公寓人員進出管理系統

歡迎大家點贊、收藏、關注、評論啦 ,由于篇幅有限,只展示了部分核心代碼。 文章目錄 一項目簡介 二、功能三、系統四. 總結 一項目簡介 一、項目背景與意義 隨著科技的快速發展和智能化水平的提高,公寓管理面臨著越來越多的挑戰。傳統的公寓…

Go語言標準庫之log和三方庫zap

一、Log 1.1 logger基本使用 Go語言內置的log包實現了簡單的日志服務。本包也提供了一個預定義的“標準”logger,可以通過調用函數Print系列(Print|Printf|Println)、Fatal系列(Fatal|Fatalf|Fatalln)、和Panic系列(Panic|Panicf|Panicln)來…

C++ 數據結構算法 學習筆記(32) -五大排序算法

C 數據結構算法 學習筆記(32) -五大排序算法 選擇算法 如下若有多個女生的身高需要做排序: 常規思維: 第一步先找出所有候選美女中身高最高的,與最后一個數交換 第二步再找出除最后一位美女外其它美女中的最高者,與倒數第二個美女交換位置 再找出除最…

k8s-pod詳解

一、Pod基本概念: 1.pod介紹: Pod是kubernetes中最小的資源管理組件,Pod也是最小化運行容器化應用的資源對象。一個Pod代表著集群中運行的一個進程。kubernetes中其他大多數組件都是圍繞著Pod來進行支撐和擴展Pod功能的,例如&am…

電賽經驗分享——賽前準備

? 大家好哇!我是小光,想要成為系統架構師的嵌入式愛好者。 ?在之前的電賽中取得了省一的成績,本文對電賽比賽前需要準備什么做一個經驗分享。 ?感謝你的閱讀,不對的地方歡迎指正。 加入小光嵌入式交流群(qq群號&…

在線人才測評在企業招聘和大學生求職中的應用場景

每年的春招秋招,都是畢業生們忙著找工作的季節,相比社招來說,春招秋招是每個畢業生務必重視的機會,大廠名企畢竟名額有限,如果找到自己心儀的職業崗位,作為畢業生就必須提前準備,深入了解招聘的…

五管OTA輸入極性快速判斷

做CMFB還有負反饋的時候曾經在判斷輸入輸出極性上吃了大虧,直接做實驗波形正確就是輸入正端,全差分就不用考慮這么多了 和彎折,形狀類似7,相同方向輸入正端,相反的就是輸入負端,輸出也是和輸入負端一個方向…

【NLP】人機對話

概念 機器翻譯就是用計算機把一種語言翻譯成另外一種語言的技術 機器翻譯的產生與發展 17 世紀,笛卡爾與萊布尼茨試圖用統一的數字代碼來編寫詞典 1930 機器腦 1933 蘇聯發明家特洛陽斯基用機械方法將一種語言翻譯為另一種語言 1946 ENIAC 誕生 1949 機器翻譯問題…