我想做信號通路分析,但我就是不想學編程

“我想做信號通路分析,但我就是不想學編程。”

“我又不是生信狗,學代碼會死。”

“你們這些做生信的,整天把數據分析搞得神神秘秘,不就是怕被人搶飯碗而已嘛。”

“這都沒分析出我想要的結果,不靠譜。”

“你們做生信的不都是寫好pipeline的嗎?怎么那么久還沒分析好?”

圖片

圖片

科研日常問題:我有一張基因/蛋白列表,想知道富集在什么通路上,如何做?

這篇文章就教大家,如何一句代碼都不用敲,通過簡單的復制粘貼還有點兩下鼠標,就能實現通路富集的分析

Metascape

1

http://metascape.org/gp/index.html#/main/step1

Metascape的主界面長這樣,操作起來非常簡單,只需要按照提示,一步一步進行操作即可。數據庫更新得很勤,不怕落伍。

首先在Step 1那里,粘貼你的基因列表。然后Step 2會問你是什么物種。Step 3點Express Analysis。然后就自動出結果了,輸出的圖片顏值很高,還能下載原始的excel表回去自己作圖,還能自動導出成漂釀的成套的ppt結果匯報……是不是so easy!!!

氮素!!!

Metascape有一個不是很討喜的地方,就是默認的Express Analysis,總是喜歡把各個數據庫的信號通路混一起分析,這樣很容易出現,某些非常general的數據庫,就容易搶戲,出現各種冗余。比如說,下面這個結果,就是默認把Reactome、CORUM和GO數據庫全部給攪在一起展示了。

圖片

當然,這并不是不可破解的問題。只要在Step 3那里,點擊Custom Analysis,然后在Enrichment的選項卡里,勾選你想要的數據庫就好了。

圖片

目前,Metascape支持不少流行的數據庫,比如Hallmark Gene Sets、Reactome等,還有我最不愛用的GO和KEGG。至于其他參數是啥意思,不懂話就佛系對待吧,別改了。。。

之前在《拿到基因兩眼一抹黑?沒關系,先做個基因富集分析吧!》一文里除了介紹了Metascape還介紹了另外一個在線富集分析軟件DAVID,網站:https://david.ncifcrf.gov/。正好本文未提到,做個補充。

Enrichr

2

如果嫌Metascape的數據庫少,那就試試數據庫多到上天的Enrichr吧。

http://amp.pharm.mssm.edu/Enrichr/

圖片

Enrichr的界面更加清爽了,只需要你把基因/蛋白列表貼進去然后點submit就完事了。

我第一次用Enrichr就被震驚了!

圖片

圖片

圖片

這也太多數據庫了吧!!!

以上只列出了其中三頁數據庫,即轉錄調控、信號通路、基因本體,后面還有疾病/藥物,細胞類型,還有一些雜七雜八的,甚至連過期數據庫都有。而且數據同樣支持導出。

氮素!!!

如果你用了就知道,Enrichr根本就沒問你,貼的基因到底是個啥物種。因此,這個程序有個很坑的地方,就是把所有物種的數據庫全部混一起分析了……比如下面這個WikiPathways分析,就把人和小鼠的結果一起展示了……(并且未知這種混合,是否會影響通路富集分析的結果)

圖片

此外,由于Enrichr的數據庫太多,所以更新不是很及時。比如上面展示的WikiPathways,還是2016年的,而這兩年WikiPathways的更新頻率幾乎是月更。

ConsensusPathDB

3

http://cpdb.molgen.mpg.de/

圖片

CPDB是德國人開發的,界面長這樣,不算很直觀。但數據庫量一樣很大,整合了32個數據庫。想做信號通路富集分析,點左邊的over-representation analysis,貼上列表,選擇數據類型(到底是gene id,還是symbol,還是別的什么),然后提交就好了。

圖片

下一步,就是選要用哪些數據庫來分析。

圖片

最好還是一次只選一個,因為不知道原始的程序設計是如何的,到底是各個數據庫獨立分析,還是跟metascape默認一樣,全部混一起。整體而言,分析速度極快,使用起來也很方便。

氮素!!!

CPDB只支持分析人類基因……

總結

4

以上這些工具的分析結果,在調教好參數的情況下(比如p值 cut-off,數據庫類型),各個網站出來的結果沒太大區別,所以算法上應該都是靠譜的。我拿同一套東西跑ClusterProfiler,結果也是沒差多少。

這幾個數據庫都有什么優缺點呢?

Metascape:支持物種多,數據庫更新非常及時,且導出的數據顏值高,甚至可以直接發表。但是支持數據庫較少,而且在國內打開較慢,且運行速度有時候較慢(畢竟分析完后還要生成pdf、excel、ppt還順便打成壓縮包那么一大堆東西)。

Enrichr:數據庫多到上天,分析速度還行。但是不支持選擇特定物種,默認就是多物種的數據庫混一起的,同時部分數據庫更新不夠及時。

CPDB:速度快,支持非常多的數據庫,更新還算勤,幾個月更一次吧。但只能分析人類基因。

總體而言,Metascape還是最好用的,畢竟支持的物種比較多,人、鼠、斑馬魚、果蠅、線蟲、瘧原蟲、酵母、擬南芥都有。雖然支持的數據庫不算多,但簡單過一遍分析,看看有什么通路冒出來,也算是勉強夠用。

那有沒有支持的物種多、數據庫多、更新勤、速度快,甚至能夠做非模式生物、自定義通路數據庫的在線工具呢?

圖片

R語言,然后琢磨一下ClusterProfiler這個神包吧。

圖片

PS:我自己喜歡用的通路數據庫是Reactome(沒錢買KEGG怎么辦?REACTOME開源通路更強大),WikiPathways,HumanCyc(雖然免費的庫比較舊),還有Hallmark gene sets。雖然ClusterProfiler只有Reactome(額外再下個包),但只要去下載對應的數據庫,用其中的通用enrichment分析函數enricher,就可以任性分析了。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/45718.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/45718.shtml
英文地址,請注明出處:http://en.pswp.cn/web/45718.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【自學安全防御】二、防火墻NAT智能選路綜合實驗

任務要求: (銜接上一個實驗所以從第七點開始,但與上一個實驗關系不大) 7,辦公區設備可以通過電信鏈路和移動鏈路上網(多對多的NAT,并且需要保留一個公網IP不能用來轉換) 8,分公司設備可以通過總…

使用Docker創建并運行一個create-react-app應用(超簡單)

創建并運行一個使用 Create React App (CRA) 創建的應用程序的 Docker 容器涉及幾個步驟。以下是一個詳細的過程,包括創建一個簡單的 React 應用、編寫 Dockerfile、構建鏡像以及運行容器。 步驟 1: 創建一個新的 React 應用 如果你還沒有一個 React 應用&#xf…

Java爬蟲安全策略:防止TikTok音頻抓取過程中的請求被攔截

摘要 在當今互聯網時代,數據采集已成為獲取信息的重要手段。然而,隨著反爬蟲技術的不斷進步,爬蟲開發者面臨著越來越多的挑戰。本文將探討Java爬蟲在抓取TikTok音頻時的安全策略,包括如何防止請求被攔截,以及如何提高…

RK3568 安卓12 EC20模塊NOCONN沒有ip的問題(已解決)

從網上東拼西湊找了不少教程,但是里面沒有提到rillib.so需要替換,替換掉就可以上網了,系統也有4G圖標了。 注意,這個rillib.so是移遠提供的。把他們提供的文件放到rk3568_android_sdk/vendor/rockchip/common/phone/lib下&#x…

Andriod Stdio新建Kotlin的Jetpack Compose簡單項目

1.選擇 No Activity 2.選擇kotlin 4.右鍵選擇 在目錄MyApplication下 New->Compose->Empty Project 出現下面的畫面 Finish 完成

C++——類和對象(中)

文章目錄 一、類的默認成員函數二、構造函數三、析構函數四、拷?構造函數五、賦值運算符重載1. 運算符重載2. 賦值運算符重載 六、取地址運算符重載const成員函數取地址運算符重載 七、應用:?期類實現Date.hDate.cpptest.cpp 一、類的默認成員函數 默認成員函數就…

技術成神之路:設計模式(七)狀態模式

1.介紹 狀態模式(State Pattern)是一種行為設計模式,它允許一個對象在其內部狀態改變時改變其行為。這個模式將狀態的相關行為封裝在獨立的狀態類中,并將不同狀態之間的轉換邏輯分離開來。 2.主要作用 狀態模式的主要作用是讓一個…

數據結構—鏈式二叉樹-C語言

代碼位置:test-c-2024: 對C語言習題代碼的練習 (gitee.com) 一、前言: 在現實中搜索二叉樹為常用的二叉樹之一,今天我們就要通過鏈表來實現搜索二叉樹。實現的操作有:建二叉樹、前序遍歷、中序遍歷、后序遍歷、求樹的節點個數、求…

SMU Summer 2024 Contest Round 4

SMU Summer 2024 Contest Round 4 2024.7.16 9:00————11:00 過題數3/7 補題數6/7 Made Up H and V Moving Piece Sum of Divisors Red and Green Apples Rem of Sum is Num Keep Connect A - Made Up 題解: 給定三個數組a,b,c&#xf…

MySQL日期和時間相關函數

目錄 1. 獲取當前時間和日期 2. 獲取當前日期 3. 獲取當前時間 4. 獲取單獨的年/月/日/時/分/秒 5. 添加時間間隔 date_add ( ) 6. 格式化日期 date_format ( ) 7. 字符串轉日期 str_to_date () 8. 第幾天 dayofxx 9. 當月最后一天 last_day ( ) 10. 日期差 datedif…

H. Beppa and SwerChat【雙指針】

思路分析&#xff1a;運用雙指針從后往前掃一遍&#xff0c;兩次分別記作數組a&#xff0c;b&#xff0c;分別使用雙指針i和j來掃&#xff0c;如果一樣就往前&#xff0c;如果不一樣&#xff0c;i–,ans #include<iostream> #include<cstring> #include<string…

SQL server 練習題2

課后作業 作業 1&#xff1a;自己查找方法&#xff0c;將 homework_1.xls 文件數據導入到 SQLServer 的 homework 數據庫中。數據導入完成后&#xff0c;把表名統一改為&#xff1a;外賣表 如下所示&#xff1a; 作業 2&#xff1a;找出所有在 2020 年 5 月 1 日至 5 月 31 …

Zookeeper之CAP理論及分布式一致性算法

CAP理論 CAP理論告訴我們&#xff0c;一個分布式系統不可能同時滿足以下三種 一致性&#xff08;C:consistency&#xff09;可用性&#xff08;A:Available&#xff09;分區容錯性&#xff08;P:Partition Tolerance&#xff09; 這三個基本要求&#xff0c;最多只能同時滿足…

python 語法學習 day2

python有七大數據類型, 數據類型轉換, 多變量賦值與print間隔, split函數, int用法總結python有七大數據類型&#xff1a; &#xff08;1&#xff09;數字&#xff08;Number&#xff09;&#xff1a;int(整型&#xff0c;長整型)&#xff0c;float(浮點型)&#xff0c;com…

部署k8s 1.28.9版本

繼上篇通過vagrant與virtualBox實現虛擬機的安裝。筆者已經將原有的vmware版本的虛擬機卸載掉了。這個場景下&#xff0c;需要重新安裝k8s 相關組件。由于之前寫的一篇文章本身也沒有截圖。只有命令。所以趁著現在。寫一篇&#xff0c;完整版帶截圖的步驟。現在行業這么卷。離…

SpringBoot中常用的注解及其用法

1. 常用類注解 RestController和Controller是Spring中用于定義控制器的兩個類注解. 1.1 RestController RestController是一個組合類注解,是Controller和ResponseBody兩個注解的組合,在使 用 RestController 注解標記的類中&#xff0c;每個方法的返回值都會以 JSON 或 XML…

【Android安全】Ubuntu 下載、編譯 、刷入Android-8.1.0_r1

0. 環境準備 Ubuntu 16.04 LTS&#xff08;預留至少95GB磁盤空間&#xff0c;實測占94.2GB&#xff09; Pixel 2 XL 要買歐版的&#xff0c;不要美版的。 歐版能解鎖BootLoader、能刷機。 美版IMEI里一般帶“v”或者"version"&#xff0c;這樣不能解鎖BootLoader、…

網絡安全-網絡安全及其防護措施2

6.安全設計和日志 安全審計 安全審計是對系統和網絡活動進行檢查和記錄的過程&#xff0c;確保合規性和安全性。審計過程可以幫助發現潛在的安全漏洞和違規行為&#xff0c;并驗證系統配置和操作的正確性。 定期審計 定義&#xff1a;定期檢查系統和網絡的安全配置和活動記錄…

394. 字符串解碼 739. 每日溫度(LeetCode熱題100)

394. 字符串解碼 - 力扣&#xff08;LeetCode&#xff09; curr_str&#xff1a;遍歷整個字符串時 如果左邊有[&#xff0c;且無相應右括號和其匹配&#xff0c;那么curr_str就表示該[到當前位置的解碼字符串如果左邊的[]已經匹配&#xff0c;或者沒有[]&#xff0c;curr_siz…

找不到vcruntime140_1.dll 無法執行的相關解決方法,如何高效率修復vcruntime140_1.dll

當出現“找不到 vcruntime140_1.dll 無法執行”這類提示時&#xff0c;意味著你的系統中的 vcruntime140_1.dll 文件已經缺失或者損壞。為了恢復并正常啟動你的程序&#xff0c;你需要對這個 DLL 文件進行修復。接下來&#xff0c;我們將詳細介紹如何進行這一操作。 一.找不到v…