用過KEGG的朋友應該都很熟悉里面的通路地圖。你是否想過如果自己可以控制通路圖將自己的基因繪制在一個通路圖中,那么今天給大家介紹一個新推出的Bioconductor軟件包pathview。這個包可以進行KEGG富集分析。
首先,我們不耐煩的介紹下Bioconductor包的安裝方式:
source("http://bioconductor.org/biocLite.R")
biocLite("pathview")
pathview安裝成功后載入R包出現以下信息表示安裝成功:
接下來我們介紹下這個包內的函數功能以及相關的參數設置。
pathview 繪制通路圖
gene.data是需要提供的基因向量,默認是Entrez_ID。其由gene.idtype決定
cpd.data 指的藥物分子的名稱向量。
Pathway.id指的是在KEGG中的ID。
kegg.native默認是TRUE輸出完整pathway的png格式文件,反之輸出僅是輸入的基因列表的pdf文件。
Map.null默認是TRUE,當使用FALSE時其pdf的文件圖像會更漂亮
Split.group 主要是在kegg.native為FALSE的時候會起到一定的作用,主要是將在同一個反應的基因歸在一起。
new.signature=FALSE將會將標簽去掉,只顯示圖像
總結:
1. 我們在繪圖前必須先知道我們的通路ID以及所有基因對應的EntrezID
2. 通路圖繪制實例
數據源:
data(gse16873.d)
data(demo.paths)
原始的kegg.native=TRUE時的圖像繪制:
pv.out
demo.paths$sel.paths[1], species ="hsa", out.suffix = "gse168731",cpd.idtype ="kegg", gene.idtype =
"entrez", gene.annotpkg = NULL,min.nnodes = 3, kegg.native =TRUE,
map.null = FALSE, expand.node =FALSE,split.group =FALSE, map.symbol =
TRUE,new.signature=FALSE, map.cpdname =TRUE)
如果保存為pdf文件情況:
pv.out
demo.paths$sel.paths[1], species ="hsa", out.suffix = "gse168731",cpd.idtype ="kegg", gene.idtype =
"entrez", gene.annotpkg = NULL,min.nnodes = 3, kegg.native =FALSE,
map.null = FALSE, expand.node =FALSE,split.group =FALSE, map.symbol =
TRUE,new.signature=FALSE)
進一步如果想將所有同一個反應的基因歸在一起,那么需要設置參數split.group:
pv.out
demo.paths$sel.paths[1], species ="hsa", out.suffix = "gse168731",cpd.idtype ="kegg", gene.idtype =
"entrez", gene.annotpkg = NULL,min.nnodes = 3, kegg.native =FALSE,
map.null = FALSE, expand.node =FALSE,split.group =TRUE, map.symbol =
TRUE,new.signature=FALSE)
歡迎大家學習交流