20W+喜愛的Pathview網頁版 | 整合表達譜數據KEGG通路可視化

Pathview網站簡介

網址:https://pathview.uncc.edu/

圖片

圖片

前段時間介紹了一個R包 —?Pathview。它可以整合表達譜數據并可視化KEGG通路,操作是先自動下載KEGG官網上的通路圖,然后整合輸入數據對通路圖進行再次渲染。從而對KEGG通路圖進行一定程度的個性化處理,并且豐富展示信息。

Pathview包6大功能分別是:化合物和基因集同時繪制在通路上,多狀態或樣本同時或分開繪制,展示離散數據標記上下調或是否存在,不同來源的ID的轉換和映射,不同物種使用時名稱的處理和未注釋物種的處理 (直接用于宏基因組或微生物組數據)。具體見Pathview包:整合表達譜數據可視化KEGG通路

Pathview網站是在該包的基礎上,對一些核心功能進行延伸:

 
  • 簡單直觀的圖形使用界面。

  • 用的是RESTful API,因此訪問速度很快。(該API是一個bash腳本,通過cURL使用。cURL是一個利用URL語法在命令行下工作的文件傳輸工具)

  • 有完整的通路分析流程,支持多組學數據和整合分析。

  • 交互式并帶有超鏈接的結果圖能更好地解釋數據。

  • 通過同步常規數據庫獲得最完整以及最新的通路數據。

  • 所有資源和分析都是開源的。

  • 注冊免費,登錄之后可以共享數據和保存分析歷史。

  • 有完整的在線Help和幫助文檔。

  • 多個示例帶你快速上手使用。

輸入數據

 

輸入數據是最重要的且是唯一一個沒有默認值的選項。儲存數據矩陣的文件格式都是以tab或者逗號分隔的txt或者csv文件,點擊編輯框可設置對照組和處理組樣本。

圖片

數據類型主要分為兩類:

  • 任何類型基因數據(表達譜、組蛋白修飾、染色質開放性等)的數據表,需要包含一列基因ID用于數據映射,比如ENTREZ GeneSymbolRefSeqGenBank Accession NumberEnzyme Accession Number等等,在選項框中共有13種基因ID可選。這里的基因數據是一個廣泛的概念,包括基因、轉錄本、蛋白質、酶及其表達、修飾和任何可測量的屬性。基因數據文件的第一列是基因ID,第一行是樣本ID。如果文件只有一列基因ID也是可以的。

  • 化合物數據也是如此,包括代謝物、藥物、小分子和它們的測量值和屬性,以及用于數據映射的化合物ID,選項框中化合物數據庫ID共計22種,常用的是KEGG數據庫ID。除了行是化合物,化合物數據文件格式和基因數據文件的基本一致(或許還需要指定樣本列和實驗設計)。

輸出結果

 

結果主要是數據整合得到的通路圖,有兩種:原始KEGG視圖和Graphviz視圖。

圖片

  • 原始KEGG視圖將數據渲染到KEGG通路圖(柵圖,比如png格式),帶有大量的前后關系和元數據,解釋性更強。瀏覽器版本中該圖是可交互的,每個Node都帶有超鏈接,可點擊它們轉到更詳細的解釋。

  • 3種不同形狀表示不同的對象。

  • 4種箭頭表示四種對象之間的關系。

  • 12種蛋白質-蛋白質相互作用關系

  • 4種基因表達之間的關系。

  • 1種酶-酶關系:兩步連續反應。

圖片

  • Graphviz視圖是使用Graphviz引擎(矢量圖,如pdf格式)渲染的通路圖,在點/線屬性和圖形拓撲上更好理解。

  • 16種連線類型

  • 4種節點類型

操作

網頁版用示例展示了4個主要功能:多樣本的KEGG視圖,多樣本的Graphviz視圖,ID mapping和整合通路分析。最后一個會得到可視化文件和通路分析的結果統計文件(可下載),耗時較長。

該網站最突出的功能是ID mapping,整合的Mapper模塊將13種的基因或者蛋白質ID,22種化合物或者代謝物ID比對到標準KEGG的基因或化合物ID。換句話說,能將輸入的不同類型的數據ID精準比對到目標KEGG通路。

輸入和輸出選項/Input&Output

物種|Species:對應物種的KEGG號,科學名稱或公用名稱,比如可以在該選項中直接選擇KEGG OrthologyKO——ko-KEGG Orthology-N。常用的是hsa——home sapiens-human。具體根據導入的數據類型判斷。

通路選擇|Pathway Selection:對于連續型數據采用GAGE(Generally Applicable Gene-set Enrichment)方法或者離散型數據(比如基因或者化合物ID表)采用over-representation方法做通路分析(GO、GSEA富集分析一網打進)

GAGE是一種自限性原假設的基因集分析方法,充分利用了表達譜數據,并將表達數據分為實驗集和通路集分別進行分析處理,會考慮到基因集的上調和下調,得到更為準確和科學的結果。

如果沒有得到顯著的通路,會自動選擇靠前的幾個通路。基因數據和化合物數據一起分析的時候,會先各自篩選通路,然后通過meta分析將結果組合成更強大的全局統計量/ p值。

Pathway Selection一般建議選用auto,這在不確定通路的情況下再適用不過。若想自定義幾個通路,則可以選擇Manual

圖片

通路ID|PathwayID:是KEGG的通路ID,一般是5位數字,當通路選擇是auto時該選項自動關閉。

輸出后綴|Output Suffix:在結果文件名后面添加的后綴。

圖形選項/Graphics

Kegg Native:有KEGG圖形渲染(.png)和Graphviz引擎渲染(.pdf)。Graphviz引擎渲染可能會因為KEGG的xml數據文件缺失數據而丟失點。

Same Layer:圖層控制

  • Kegg Native項被勾選時,點的顏色會和通路圖在一個圖層,修改顏色的時候,節點標簽不變。

  • Kegg Native項未被勾選時,線/點類型的圖例會在一個圖層,節點標簽也會從原來的KEGG基因標簽(或EC編號)變為官方基因符號。

離散型(基因和化合物數據)|Discrete:基因數據或者化合物數據一般是作為連續型數據使用。但也可以選擇被視為離散數據,這樣就可以以p值,倍數變化來選擇顯著的基因或者化合物列表,從而個性化標出離散數據中是否存在上下調。

但是網頁版本沒有設置選值的選項,還是Pathview包更適合使用這個設置。

Keys Alignment:當基因數據和化合物數據都不為NULL時如何對齊顏色標簽。默認選項為“ x”(由x坐標對齊)和“ y”(由y坐標對齊)。

多狀態|Multi State:默認值為TRUE,判定多狀態(指多個樣本或多列)基因數據或化合物數據是否應該整合并繪制在一張圖中。

換句話說,不勾選“Multi State”的情況下,基因或者化合物節點會切成多個來對應數據中的狀況數或者樣本數,即由”一張圖每個節點多種顏色”變為”多張圖每個節點一種顏色”。

數據匹配|Match Data:默認是TRUE,判定基因數據或化合物數據的樣本數是否匹配。

假設基因數據和化合物數據的樣本大小分別為m和n(m>n),多余的空列NA(不加顏色顯示)會在保證樣本大小一致的情況下添加部分到化合物數據中,如此,才能在Multi StateTRUE時,得到相同數量的基因節點和化合物節點片段。

Signature Position:pathview的署名位置,默認是左下角。選擇“None”的時候不顯示。

Key Position:顏色標簽的位置,默認是“左上角”。一般上面是基因節點,下面是化合物節點。選擇“None”的時候不顯示。

化合物節點名偏移|Compound Label Offset:設置化合物節點標簽在默認位置或者節點中心處的長度(僅在Kegg Native=FALSE時有用)。這個選項在化合物用全名標記時很實用,能決定化合物節點的外觀。

顏色選項/Coloration

節點計算|Node Sum:在比對有多基因或化合物時選擇計算節點總數的方法。默認值是Sum,還有meanmedianmax,max.absrandom

空值的顏色|NA Color:基因數據或者化合物數據中缺失值或NA值的顏色。選項有透明"transparent"和灰色?"grey"

限制(基因和化合物)|Limit (Gene and Compound):基因數據或化合物數據轉換為顏色時的限制值(即顏色標簽的數值范圍)。

這個選項是數值型的,一個框可以輸入用逗號分隔的兩個數字,比如“1,2”(不帶引號)—— 第一個數字表示下限,第二個數字表示上限。輸入單個值“n”的時候,網站認為范圍是(-n, n)。

Bins (Gene and Compound): 在基因數據和化合物數據轉換為顏色時,此參數可以設置顏色標簽的長度。預設值為10。

Low, Mid, High (Gene and Compound):低,中,高(基因和化合物),這些參數可以選擇“基因數據”和“化合物數據”的色譜。

“基因數據”和“化合物數據”的默認數據(低-中-高)分別是“綠色-灰色-紅色”和“藍色-灰色-黃色”。

這里既可以用顏色的通用名稱(綠色,紅色等),也可以用十六進制顏色代碼(比如00FF00,D3D3D3等)或顏色選擇器指定顏色。

網頁版優勢

以上是網頁版的參數選擇,較Pathview包而言少了Split Group|分組擴展節點|Expand Node功能,個別參數的靈活性也待改進,但網頁版不需要占用本地內存,KEGG視圖的節點能超鏈接到更詳細的信息,而且多通路分析作為網頁版最大的優勢,有著完整的通路分析流程,支持多組學數據和連接公共通路。

這一步在本地的話還需要用gage包得到基因集在KEGG數據庫的所有通路分析結果,代碼如下:

> library(gage)
> data(gse16873)
> cn <- colnames(gse16873)
> hn <- grep('HN',cn, ignore.case =TRUE)
> dcis <- grep('DCIS',cn, ignore.case =TRUE)
> data(kegg.gs)
> #pathway analysis using gage  用gage做通路分析
> gse16873.kegg.p <- gage(gse16873, gsets = kegg.gs,
+ ref = hn, samp = dcis)
> #prepare the differential expression data  準備差異表達數據
> gse16873.d <- gagePrep(gse16873, ref = hn, samp = dcis)
> #equivalently, you can do simple subtraction for paired samples 得到成對的樣本
> gse16873.d <- gse16873[,dcis]-gse16873[,hn]
> #select significant pathways and extract their IDs 得到重要通路的ID
> sel <- gse16873.kegg.p$greater[, "q.val"] < 0.1 & !is.na(gse16873.kegg.p$greater[,
+ "q.val"])
> path.ids <- rownames(gse16873.kegg.p$greater)[sel]
> path.ids2 <- substr(path.ids[c(1, 2, 7)], 1, 8)
> #pathview visualization Pathview可視化
> pv.out.list <- sapply(path.ids2, function(pid) pathview(gene.data = gse16873.d[,
+ 1:2], pathway.id = pid, species = "hsa"))

網頁版本實現方式如下——Example 4

圖片

導入必要的數據,這里主要是設置了Pathway Selectionauto,選完之后點Submit就能得到完整分析結果,出來的頁面的中心處是設置說明,右側Completed下是分析結果和分析日志。

圖片

展示的是6種結果中的oxidative phosphorylation-氧化磷酸化代謝途徑的結果。

圖片

完整結果可看:

https://pathview.uncc.edu/resultview?analyses=5ddcd97621bd9&id=hsa-Homo%20sapiens&suffix=multistatekegg&autopathwayselection=True

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/41204.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/41204.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/41204.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

uniapp+nodejs實現小程序支付

1.準備商戶號、企業級小程序(或者個體工商戶級別的) 2.在小程序端調用uni.login獲取code&#xff0c;傳遞給后端 uni.login({success: loginRes > {uni.request({url: "http://127.0.0.1:3003/wxpay/pay",data: {code: loginRes.code},method: "get",…

RedHat9 | kickstart無人值守批量安裝

一、知識補充 kickstart Kickstart是一種用于Linux系統安裝的自動化工具&#xff0c;它通過一個名為ks.cfg的配置文件來定義Linux安裝過程中的各種參數和設置。 kickstart的工作原理 Kickstart的工作原理是通過記錄典型的安裝過程中所需人工干預填寫的各種參數&#xff0c;…

漏洞分析 | PHP CGI Windows平臺遠程代碼執行漏洞(CVE-2024-4577)

漏洞概述 PHP CGI&#xff08;Common Gateway Interface&#xff09;是在Windows平臺上運行PHP的一種方式。CGI是一種標準接口&#xff0c;允許Web服務器與外部應用程序&#xff08;如PHP腳本&#xff09;進行交互&#xff0c;從而生成動態網頁內容。 近期&#xff0c;PHP發布…

Request safe_get 小工具

接口安全獲取請求參數小工具&#xff08; python&#xff09; flask import logging import traceback from flask import (Blueprint, request, Response, jsonify, g, send_file)def safe_get(req: request, attr: str, defaultNone):try:if attr in req.form:return req.f…

拍攝泡咖啡的劇本!

泡咖啡的過程可以是一種放松和享受的儀式&#xff0c;同時也是一個記錄生活美好瞬間的好機會。以下是一些步驟和提示&#xff0c;幫助您記錄泡咖啡的過程&#xff1a; 1. **準備材料**&#xff1a; 確保您有新鮮的咖啡豆、磨豆機、咖啡壺、濾紙、熱水和杯子。 2. **選擇音樂**&…

Logstash安裝插件失敗的問題

Logstash安裝插件失敗的問題 安裝 logstash-output-jdbc 失敗 報錯為&#xff1a; Unable to download data from https://rubygems.org - Net::OpenTimeout: Failed to open TCP connection to rubygems.org:443 (execution expired) (https://rubygems.org/latest_specs.4.…

【算法 - 哈希表】兩數之和

這里寫自定義目錄標題 兩數之和題目解析思路解法一 &#xff1a;暴力枚舉 依次遍歷解法二 &#xff1a;使用哈希表來做優化 核心邏輯為什么之前的暴力枚舉策略不太好用了&#xff1f;所以&#xff0c;這就是 這道題選擇 固定一個數&#xff0c;再與其前面的數逐一對比完后&…

Linux系統(CentOS)安裝iptables防火墻

1&#xff0c;先檢查是否安裝了iptables 檢查安裝文件-執行命令&#xff1a;rpm -qa|grep iptables 檢查安裝文件-執行命令&#xff1a;service iptables status 2&#xff0c;如果安裝了就卸裝(iptables-1.4.21-35.el7.x86_64 是上面命令查出來的版本) 執行命令&#xff1a…

藍牙信標和藍牙標簽我們如何區分,區分方法有哪些?

藍牙信標和藍牙標簽其實是兩種不同的技術&#xff0c;很多人可能會把藍牙信標和藍牙標簽搞混&#xff0c;因為區分不開來&#xff0c;但實際上&#xff0c;區分這兩種技術也很簡單&#xff0c;因為它們各自都有不一樣的特性&#xff0c;通過這些特性&#xff0c;我們也能正常區…

相機光學(二十四)——CRA角度

CRA角度 0.參考資料1.什么是CRA角度2.為什么 CRA 會導致luma shading3.為什么 CRA 會導致color shading4.CRA相差過大的具體表現5.CRA Matching6.怎樣選擇sensor的CRA 0.參考資料 1.芯片CRA角度與鏡頭的匹配關系&#xff08;一&#xff09; ??2.芯片CRA角度與鏡頭選型的匹配關…

爬蟲進階:Selenium與Ajax的無縫集成

爬蟲與Ajax的挑戰 Ajax&#xff08;Asynchronous JavaScript and XML&#xff09;允許網頁在不重新加載整個頁面的情況下與服務器交換數據并更新部分內容。這為用戶帶來了更好的體驗&#xff0c;但同時也使得爬蟲在抓取數據時面臨以下挑戰&#xff1a; 動態內容加載&#xff…

go語言 函數和包

go語言 函數和包 一、函數 在Go語言中&#xff0c;函數是執行特定任務的自包含代碼塊。 1.函數的定義 函數通過func關鍵字定義&#xff0c;格式如下&#xff1a; func 函數名(形參 形參類型, 形參 形參類型) 返回值類型 {函數體return 返回值 }2.基礎函數類型 無參數無返回…

vue中數組出現__ob__: Observer屬性,導致不能正確使用問題解決

直接上圖&#xff0c;如下圖&#xff0c;數組中出現__ob__: Observer屬性&#xff0c;導致無法取值。 解決方案為&#xff1a;JSON.parse(JSON.stringify(數組變量名))深拷貝數組&#xff0c;重新生成一個可枚舉數組。 // 處理代碼如let tempIds JSON.parse(JSON.stringify(i…

一文帶你初探FreeRTOS信號量

本文記錄我初步學習FreeRTOS的信號量的知識&#xff0c;在此記錄分享&#xff0c;希望我的分享對你有所幫助&#xff01; 什么是信號量 在FreeRTOS中&#xff0c;信號量&#xff08;Semaphore&#xff09;是一種用于任務間同步和資源共享的機制。信號量主要用于管理對共享資源的…

Cgi上傳文件 注意事項

//核心代碼 ofstream outfile("/opt/software/" file.getFilename(), ios::out | ios::binary); outfile << file.getData(); //錯誤方式&#xff1a;outfile << file.getData() <<endl; outfile.close(); 參考博客&#xff1a; https://blog.cs…

GNU/Linux - 各種包管理器介紹

Linux 包管理器根據不同的發行版和包管理系統有所不同。以下是一些常見的 Linux 包管理器&#xff1a; 1. RPM (Red Hat Package Manager) * 用于&#xff1a; Red Hat Enterprise Linux (RHEL), Fedora, CentOS, openSUSE * 包管理器&#xff1a; rpm, yum, dnf 2. DEB (Deb…

HTML如何在圖片上添加文字

HTML如何在圖片上添加文字 當我們開發一個頁面&#xff0c;插入圖片時&#xff0c;需要有一組文字對圖片進行描述。那么HTML中如何在圖片上添加文字呢&#xff1f;這篇文章告訴你。 先讓我們來看下效果圖&#xff1a; 句子“這是一張夜空圖片”被放置在了圖片的左下角。 那么…

Leetcode.342 4的冪

給定一個整數&#xff0c;寫一個函數來判斷它是否是 4 的冪次方。如果是&#xff0c;返回 true &#xff1b;否則&#xff0c;返回 false 。 整數 n 是 4 的冪次方需滿足&#xff1a;存在整數 x 使得 n 4x 示例 1&#xff1a; 輸入&#xff1a;n 16 輸出&#xff1a;true示…

微信小程序的智慧物流平臺-計算機畢業設計源碼49796

目 錄 摘要 1 緒論 1.1 研究背景 1.2 研究意義 1.3研究方法 1.4開發技術 1.4.1 微信開發者工具 1.4.2 Node.JS框架 1.4.3 MySQL數據庫 1.5論文結構與章節安排 2系統分析 2.1 可行性分析 2.2 系統流程分析 2.2.1 用戶登錄流程 2.2.2 數據刪除流程 2.3 系統功能分…

C#面:ASP.NET Core Filter如何?持依賴注??

ASP.NET Core Filter可以通過依賴注入來支持。在ASP.NET Core中&#xff0c;依賴注入是一種將依賴對象提供給類的機制&#xff0c;它可以幫助我們解耦和測試代碼。 要在ASP.NET Core Filter中使用依賴注入&#xff0c;可以按照以下步驟進行操作&#xff1a; 首先&#xff0c;…