《Brief Bioinform》: 鼠腦單細胞與Stereo-seq數據整合算法評估

一、寫在前面

基因捕獲效率、分辨率一直是空間轉錄組細胞類型識別的攔路虎,許多算法能夠整合單細胞(single-cell, sc)或單細胞核(single-nuclear, sn)數據與空間轉錄組數據,從而幫助空轉數據的細胞類型注釋。此前我們介紹過近年新出爐的Stereo-seq平臺,這一新興技術相關的分析思路及工具支持仍有所欠缺,因此本文的作者評估了9種單細胞數據與stereo-seq空轉數據進行mapping的算法,以幫助大家提示stereo-seq數據處理的準確性與效率。原文引用信息:

Tao Q, Xu Y, He Y, Luo T, Li X, Han L. Benchmarking mapping algorithms for cell-type annotating in mouse brain by integrating single-nucleus RNA-seq and Stereo-seq data. Brief Bioinform. 2024 May 23;25(4):bbae250.?

如果想系統性的學習空間轉錄組數據分析也可以看這里:

空間轉錄組學習手冊合輯

Stereopy空間轉錄組學習手冊

Squidpy空間轉錄組學習手冊

Scanpy空間轉錄組學習手冊

Seurat空間轉錄組學習手冊

一文搞定空間轉錄組與單細胞測序的整合分析

CellChat空轉細胞通訊合輯

SeekSpace| 會單細胞就會空間轉錄組

二、背景介紹

哺乳動物的腦組織具有極高的異質性以及復雜的細胞類型(神經元、免疫細胞、血管細胞等等)組成,較為傳統的技術例如免疫熒光或原位雜交技術無法同一時間內注釋出所有細胞類型,因此,腦組織常作為空間轉錄組想要占領的測試高地:長腦子了!時空轉錄組揭示大腦再生機制。stereo-seq憑借分辨率高(0.22μm)、視場大(芯片大小可定制)、無需預先設置探針等特點被廣泛應用于生命科學研究的各個領域之中。但實戰過程中,"cellbin"的劃分細胞策略容易遇到體積小的細胞捕獲到的分子數量不足、"square bin"劃分細胞不能滿足單細胞分辨率的尷尬。因此實際分析過程中stereo-seq與其它空間轉錄組數據一樣需要依賴單細胞水平的數據的mapping幫助完成注釋過程。目前能夠完成這一過程的軟件眾多:DestVI可以通過基因的"罰分"來完成參考單細胞數據與空轉數據的神經網絡構建;RCTD利用最大相似度預測各spot的細胞占比(能夠減少平臺不同帶來的影響);SpatialDWLS本質上利用阻尼加權最小二乘回歸,通過整合富集分析以及Giotto提供的差異分析來完成mapping過程;大家熟悉的神包Seurat能夠通過最近臨近法整合多來源的細胞;Tangram能夠梯度優化的計算連哥哥數據集間的KL離散度與余弦相似性;SpatialID利用轉化學習訓練深度神經網絡模型生成各細胞在空轉中分布的可能性;SpatialID利用每個數據集的高變基因構建系統模型,輸出全局最優的轉化矩陣可能性;Spann也能夠優化轉化模型,使得臨近的的樣本具有相同的細胞類型。此前也有過空轉與單細胞數據整合的工具benchmarking(空間轉錄組與單細胞轉錄組整合分析工具大比拼),但新出現的stereo-seq在之前并沒有被納入考察目標之中,并且這些工具的benckmarking大都依賴高質量的”groudtruth“,而stereo-seq能夠使用不同大小的bin size來互相做校驗,顯然對于這些工具來說也是一個良好的測試數據集。

三、主要結果

如Figure1 A的流程圖所示,作者通過已注釋的snRNA-seq數據生成了一個擬空間數據作為background,然后收集了八個包含對應腦區位置(例如海馬體、小腦、嗅球、皮質等)的snRNA-seq數據與stereo-seq數據。作者主要從square bin 50(大約25μmX25μm)與cell bin(利用ssDNA劃分生成的細胞單位)的各算法效果,可以明顯看出,Bin50的spot數量要明顯小于Cellbin,但nFeature和nCount方面前者更高,換句話說,在這些數據中Bin50的尺寸要大于Cellbin(Biomamba目前處理過的數據也基本都是這個情況)。

圖片

Figure 1

在完成了四個腦區數據的注釋(Figure 2A-B)之后,使用各mapping算法工具處理擬空間數據與stereo-seq空轉數據,并對每個spot中細胞比例進行皮爾森相關系數計算(Figure 2C),肉眼可見Cell2location(基于Python)與RCTD(基于R)的相關系數又高又穩(這兩個包的教程可見:一文搞定空間轉錄組與單細胞測序的整合分析)。在合并相同細胞類型的表達矩陣后,作者對stereo-seq細胞表達矩陣與snRNA-seq的細胞表達矩陣進行相關性系數分析(Figure 2D),可以看出RCTD這次遙遙領先,其余軟件除了Tangram外表現都很差。

圖片

Figure 2

接下來作者開始了實戰部分,成年腦矢狀面腦組織HIP的snRNA-seq與stereo-seq的運行結果如圖3A所示,通過作者的生物學知識基礎,可以發現RCTD與SpatialDWLS對主要的細胞類型如CA1、CA2、CA3分布的預測較為精準,而其它軟件存在邊界不清晰、注釋不準確的現象。作者引入了ASS來評估細胞距離及相關性,結果顯示RCTD(在多個數據集及分bin方法中均表現上乘)與SpatialDWLS表現最優,而Spatial-ID與DestVI墊底(Figure 3B-C)。在注釋結果的細胞類型中可見,RCTD與SpatialDWLS能夠預測到占比非常小的細胞類型,而DestVI這種僅能夠預測到占比比較大的細胞類型。

ASS公式如下,感興趣的同學可以看一下原文了解詳細參數含義:

圖片

圖片

Figure3

在小腦數據的layer的識別上來說,RCTD與SpatialDWLS無論是在cell bin還是在bin50均能夠精準的分配出符合其空間位置的細胞類型(Figure 4A),而其它工具都或多或少的丟失了一些layer,例如Cell2location沒有識別出Purkinje cell layer。

圖片

Figure 4

四、最后聊聊

這篇文章想提供給大家的信息很簡單,如果你想用R語言處理stereo-seq,你就用RCTD,如果你想用python處理stereo-seq,你就用SpatialDWLS。值得一提的是,以上的結果都是作者使用腦部數據測試得到的結果,其它的組織器官可能會遇到不同的情況。并且,作為一個benchmarking的文章,作者并沒有給出計算效率的評估,要知道,不同算法/工具對于相同輸入數據的計算時間可能會相差數千倍。最重要的是作者提出了Accuracy scoring system(ASS)這一概念來評估各工具對空間轉錄組mapping的效果。本篇文章的代碼鏈接如下,大家可以自行學習體會一番:https://github.com/qyTao185/Benchmarking-Mapping-Algorithms.git

如果你的計算機不足以支持該工具的計算,可按需選用適合自己的計算資源:

共享(經濟實惠):有root權限的共享服務器

獨享(省電省心):生信分析不求人

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/84120.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/84120.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/84120.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

camera功能真的那么難用嗎

背景 Android開發工作過程中,經常需要用到camera相關能力,比如:人臉識別,ai識別,拍照預覽,攝像頭錄制等等需求。都需要使用到camera,且需要拿到camera的預覽數據。但是每次開發這塊代碼都比較繁…

USART 串口通信全解析:原理、結構與代碼實戰

文章目錄 USARTUSART簡介USART框圖USART基本結構數據幀起始位偵測數據采樣波特率發生器串口發送數據 主要代碼串口接收數據與發送數據主要代碼 USART USART簡介 一、USART 的全稱與基本定義 英文全稱 USART:Universal Synchronous Asynchronous Receiver Transmi…

LeetCode 152. 乘積最大子數組 - 動態規劃解法詳解

文章目錄 問題描述解題思路動態規劃狀態定義狀態轉移方程完整代碼實現復雜度分析示例解析關鍵點說明總結問題描述 給定一個整數數組 nums,請找出數組中乘積最大的連續子數組(該子數組中至少包含一個數字),并返回該子數組對應的乘積。 示例: 輸入: [2,3,-2,4] 輸出: 6 解…

Python: 操作 Excel折疊

??Python 操作 Excel 折疊(分組)功能詳解(openpyxl & xlsxwriter 雙方案) 在處理 Excel 報表或數據分析時,我們常常希望通過 折疊(分組)功能 來提升表格的可讀性和組織性。本文將詳細介紹如何使用 Python 中的兩個主流 Excel 操作庫 —— openpyxl 和 xlsxwriter …

28、元組的遍歷

const_cast 只能用于指針或引用類型&#xff0c;而不能用于基本類型如 int。 在的代碼中&#xff0c;試圖將 i 轉換為 const_cast<int>(i)&#xff0c;這是不合法的。 可以使用模板函數來獲取元組中的元素&#xff0c;而不是使用 const_cast。以下是修正后的代碼&#x…

sendDefaultImpl call timeout(rocketmq)

rocketmq 連接異常 senddefaultimpl call timeout-騰訊云開發者社區-騰訊云 第一種情況&#xff1a; 修改broker 的配置如下&#xff0c;注意brokerIP1 這個配置必須有&#xff0c;不然 rocketmq-console 顯示依然是內網地址 caused by: org.apache.rocketmq.remoting.excep…

【仿生機器人】仿生機器人智能架構:從感知到個性的完整設計

仿生機器人智能架構&#xff1a;從感知到個性的完整設計 仿生機器人不僅需要模擬人類的外表&#xff0c;更需要具備類人的認知、情感和個性特征。本研究提出了一個綜合性的軟件架構&#xff0c;實現了從環境感知到情感生成、從實時交互到人格塑造的完整智能系統。該架構突破了…

Spring Boot微服務架構(十一):獨立部署是否拋棄了架構優勢?

Spring Boot 的獨立部署&#xff08;即打包為可執行 JAR/WAR 文件&#xff09;本身并不會直接喪失架構優勢&#xff0c;但其是否體現架構價值取決于具體應用場景和設計選擇。以下是關鍵分析&#xff1a; 一、獨立部署與架構優勢的關系 內嵌容器的優勢保留 Spring Boot 獨立部署…

HBuilderX安裝(uni-app和小程序開發)

下載HBuilderX 訪問官方網站&#xff1a;https://www.dcloud.io/hbuilderx.html 根據您的操作系統選擇合適版本&#xff1a; Windows版&#xff08;推薦下載標準版&#xff09; Windows系統安裝步驟 運行安裝程序&#xff1a; 雙擊下載的.exe安裝文件 如果出現安全提示&…

2025年6月3日面試總結

1. 面試官問一臺機器內存或者磁盤占用99% 再點一下就掛了&#xff0c;個人剛開始反應內存不足加內存&#xff0c;磁盤不足加磁盤&#xff0c;還有啥辦法&#xff0c;有些時候沒干過的事一定要大膽&#xff0c;敲命令都敲不成&#xff0c;只能換磁盤了和加內存了&#xff0c;要么…

從上下文學習和微調看語言模型的泛化:一項對照研究

大型語言模型表現出令人興奮的能力&#xff0c;但也可以從微調中表現出令人驚訝的狹窄泛化。例如&#xff0c;他們可能無法概括為簡單的關系反轉&#xff0c;或者無法根據訓練信息進行簡單的邏輯推理。這些未能從微調中概括出來的失敗可能會阻礙這些模型的實際應用。另一方面&a…

解決cocos 2dx/creator2.4在ios18下openURL無法調用的問題

由于ios18廢棄了舊的openURL接口&#xff0c;我們需要修改CCApplication-ios.mm文件的Application::openURL方法&#xff1a; //修復openURL在ios18下無法調用的問題 bool Application::openURL(const std::string &url) {// NSString* msg [NSString stringWithCString:…

Go 語言并發編程基礎:Goroutine 的創建與調度

Go 語言的并發模型是其最顯著的語言特性之一。Goroutine 是 Go 實現并發的核心機制&#xff0c;它比線程更輕量&#xff0c;調度效率極高。 本章將帶你了解 Goroutine 的基本概念、創建方式以及背后的調度機制。 一、什么是 Goroutine&#xff1f; Goroutine 是由 Go 運行時&a…

網頁繪制表格

說明&#xff1a; border"1"&#xff1a;設置表格邊框寬度為 1 像素&#xff08;可調整數值改變邊框粗細&#xff09;。cellspacing"0"&#xff1a;設置單元格間距為 0&#xff08;去除邊框間的空白間隙&#xff09;。<thead>&#xff1a;定義表頭區…

Python爬蟲實戰:研究Unirest庫相關技術

一、引言 在當今信息爆炸的時代,網絡數據的獲取與分析變得尤為重要。Python 作為一種功能強大且易于學習的編程語言,在網絡爬蟲領域有著廣泛的應用。Unirest 庫是一個輕量級的 HTTP 客戶端庫,它提供了簡潔的 API,使得發送 HTTP 請求變得更加容易。本論文將詳細分析如何使用…

二、【ESP32開發全棧指南:ESP32 GPIO深度使用】

GPIO&#xff08;通用輸入輸出&#xff09; 是ESP32最基礎卻最核心的功能。本文將帶你深入ESP32的GPIO操作&#xff0c;通過按鍵讀取和LED控制實現物理按鍵→ESP32→LED的完整信號鏈路。 一、ESP32 GPIO核心特性速覽 34個可編程GPIO&#xff08;部分引腳受限&#xff09;輸入模…

調用.net DLL讓CANoe自動識別串口號

1.前言 CANoe9.0用CAPL控制數控電源_canoe讀取程控電源電流值-CSDN博客 之前做CAPL通過串口控制數控電源&#xff0c;存在一個缺點&#xff1a;更換電腦需要改串口號 CSDN上有類似的博客&#xff0c;不過要收費&#xff0c;本文根據VID和PID來自動獲取串口號&#xff0c;代碼…

SpringBoot十二、SpringBoot系列web篇之過濾器Filte詳解

一、前言 JavaWeb三大組件Servlet、Filter、Listener&#xff0c;其中之一便是過濾器Filter。 其實&#xff0c;Filter我們平常用的不多&#xff0c;一般多為項目初期搭建web架構的時候使用&#xff0c;后面用的就少了&#xff0c;在日常業務開發中不太可能碰到需要手寫Filte…

Java實現飛機射擊游戲:從設計到完整源代碼

JAVA打飛機游戲畢業設計 一、游戲概述 本游戲基于Java Swing開發&#xff0c;實現了經典的飛機射擊游戲。玩家控制一架戰斗機在屏幕底部移動&#xff0c;發射子彈擊落敵機&#xff0c;同時躲避敵機攻擊。游戲包含多個關卡&#xff0c;隨著關卡提升&#xff0c;敵機速度和數量…

通俗易懂linux環境變量

如果想要清楚的了解環境變量&#xff0c;我覺得我們需要先大致搞清楚一個簡單的事——什么是會話&#xff1f; 會話大致是什么&#xff1f; 在這里我們的目的是更好的理解環境變量&#xff0c;所以適當講解一下會話即可。通常我們都是用xshell連接遠程服務器&#xff0c;都會打…