這一期我們介紹一個常見的,高分文章引用很高的一個單細胞轉錄組分析工具Hotspot,它可針對單細胞轉錄組數據識別有意義基因或者基因module,類似于聚類模塊。所謂的”informative "的基因是那些在給定度量中相鄰的細胞之間以相似的方式表達變化的基因。這也是我們在實際研究中期望的目的,發現與細胞類型以及狀態相干的基因,這些基因(一類基因)往往呈現出獨特的表達方式。聽這些詞是不是很熟悉呀,至少大家熟悉的WGCNA就有此類功能,那么相比于這些,Hotspot有什么突出點呢?
image.png
1-基于局部相關性網絡(克服單細胞數據稀疏性)
2-識別空間或功能特異性的基因模塊
3-能夠以更高的計算效率識別相關基因,在分析大型數據集時優勢明顯,
4-能夠識別反映細胞類型、亞型和表型梯度的基因,以及反映空間調控或遺傳表達程序的基因
5-Hotspot不僅可以識別相關基因,還可以將它們組織成協調的基因模塊。
工作流程如下:
Hotspot可用于單細胞轉錄組、空間轉錄組、譜系數據的分析。這里我們先介紹在單細胞轉錄組中的應用:
Hotspot是基于paython的分析工具,首先安裝Hotspot:原理以及更多信息的請閱讀作者原文paper:
pip install hotspotsc
#github 鏈接
# https://github.com/YosefLab/Hotspot
#原文paper
# https://linkinghub.elsevier.com/retrieve/pii/S2405471221001149
常規結果可視化如下:
image.png
很顯然這個熱圖達不到我們的要求,且龐大的數據不適合R中進行修飾,或者需要很麻煩,所以我們自定義了一個python函數,可以個性化可視hotsopt結果:可自定義module顏色,調整熱圖,指示module基因。
hotspot_lc_heatmap_plot(hs_file = hs, module_cols = ['#66C5CC', '#F6CF71', '#F89C74', '#87C55F', '#9EB9F3', '#FE88B1','#8BE0A4'],label_gene = {"Module 1": ["IGHG1","S100A3","MSX1","HSPD1","GLUL","HLA-DMB","CD164","COA6"],"Module 2": ["WDR49","DNAAF1","POU2AF1","ARMC2","ERICH3","DNAH3"],"Module 3": ["CHMP5","IFT27","SERPINB1"],"Module 4": ["ZFAND3","SMYD3","TEAD1","CDH1","CX3CL1"],"Module 5":["HCP5","GULP1","PREX2","DLG4"],"Module 6": ["ROR2","PHIP","TNKS","CHD6","CLMN","TMEM131"],"Module 7": ["DIPK2B","MCAM","RUNX3","CREM","GMFG","PTGDS","CHST11","CCL14","PRKG1"]})
image.png
完美!!!