帶 P 值的含數據點的小提琴圖是一種科研數據可視化圖表,它同時呈現數據的分布特征、原始觀測值和統計顯著性:通過小提琴形狀展示概率密度分布(反映數據集中趨勢和離散程度),疊加抖動散點顯示所有原始數據點(避免信息丟失并揭示潛在異常值),并在組間添加帶有 P 值標注的顯著性標記。
本期圖表來源于 2023 年發表于 Nature communication 的文章數據圖。
原文中使用差異小提琴圖展示了 CTSB(Cathepsin B)在不同腫瘤分期(Stage I & II vs. Stage III & IV)HCC(肝細胞癌)患者中的表達水平比較,表達指標為 IDO/area。其中X軸:Stage I & II(n = 119)代表早期腫瘤;Stage III & IV(n = 75)則代表晚期腫瘤;Y軸:CTSB expression(IDO/area)表示單位面積中的 CTSB 表達強度;
每個點表示一個患者樣本,小提琴圖表示表達值的分布,點的顏色區分了兩個組(藍色 vs. 紅色)。
統計顯著性:標注的p值為0.0439,p < 0.05說明在統計學上存在顯著差異。
圖表結論:CTSB 表達在晚期 HCC(Stage III & IV)患者中顯著高于早期患者(Stage I & II);這表明 CTSB 可能參與了腫瘤進展過程,是潛在的進展相關分子標志物。
本期教程我們來使用Graphpad復現Nature圖形,繪制帶P值的含數據點的小提琴圖。
1.雙擊打開Graphpad,選擇分組,在選項處選擇“為每個點輸入一個Y值并繪圖”;
2.將數據復制進軟件中,點擊新建分析;
3.在跳出的對話框,選擇列分析—t檢驗(和非參數檢驗),點擊確定;跳出對話框后,點擊確定即可;
4.在跳出的分析報告中,可以看出p值為0.0439,樣本值分別為119和75;
5.接著點擊新建圖表,在圖表類型選擇“列”,選擇箱線和小提琴圖,選擇小提琴圖;
6.繪制出來的圖形雛形如下圖所示,接著需要對其進行細節美化;
7.雙擊圖形,選擇不同組別,分別對填充顏色,數據點顏色進行修改;
8.點擊成對比較工具,雙擊對其修改,選擇顯示P值;
9.接著對其進行其他細節美化,包括縱坐標標題,樣本數量添加,字體格式等,其最終效果圖如下圖所示:
以上就是Graphpad繪制帶P值的小提琴圖的基本步驟。帶P值的含數據點的小提琴圖是一種多維度的科研數據呈現方式,它巧妙融合了三種關鍵信息:小提琴輪廓直觀展示數據的概率密度分布(揭示整體形態和離散程度),散布的原始數據點清晰呈現每個觀測值(保留樣本細節并識別離群值),而標注的顯著性P值則定量化驗證組間差異的統計學意義。大家快去試試吧!
——END——