? ? ? ?本文已被接受發表在2024年IEEE MLISE會議上(c)2024 IEEE。準確地將腦腫瘤從MRI掃描中分割出來對于制定有效的治療方案和改善患者預后至關重要。本研究引入了一種新的哥倫比亞大學網絡(CU-Net)架構實現,用于使用BraTS 2019數據集進行腦腫瘤分割。CU-Net模型具有對稱的U形結構,并使用卷積層、最大池化和上采樣操作以實現高分辨率分割。作者的CU-Net模型達到了82.41%的Dice分數,超過了其他兩種最先進模型。這種分割精度的提高突顯了模型的魯棒性和有效性,有助于準確描繪腫瘤邊界,這對于手術規劃和放射治療至關重要,最終有可能改善患者的預后。
I Introduction
腦腫瘤[1]是在大腦內不受控制地生長和繁殖的異常細胞團。如果不及早發現和治療,這些腫瘤對身體的影響可能是毀滅性的。腦腫瘤的癥狀因位置、大小和類型(良性或惡性)而異很大,可能包括頭痛、癲癇、視力問題、認知障礙,甚至癱瘓。惡性腦腫瘤尤其危險,因為它們會侵犯并破壞周圍的正常腦組織,并可能擴散到身體的其他部位[2]。
磁共振成像(MRI)[3]是檢測和評估腦腫瘤[1]的重要診斷方法。利用強磁場和無線電波,MRI掃描生成大腦解剖結構的高度詳細圖像,幫助準確識別腫瘤的存在、位置和范圍。這些圖像對于治療計劃至關重要,提供了關于腫瘤大小、形狀及其與重要腦結構關系的寶貴見解。此外,MRI掃描在監測治療期間及治療后的腫瘤進展或消退中發揮著至關重要的作用[4]。
早期和準確地檢測腦腫瘤對于有效治療和改善患者預后至關重要。然而,從MRI圖像中手動分割腦腫瘤是一項具有挑戰性且耗時的任務,需要大量的專業知識,且容易受到觀察者間差異的影響。這個過程涉及到仔細地從周圍健康腦組織中描繪出腫瘤的邊界,這對于形狀不規則或彌漫性腫瘤尤其困難。因此,開發用于腦腫瘤分割的穩健自動化模型對于高效可靠的診斷和治療計劃至關重要。自動化分割模型[5]可以一致且準確地識別和描繪腫瘤,大大減少手動分析所需的時間和精力,并最小化人為錯誤或差異的可能性。此外,這些模型有可能檢測到人類專家可能遺漏的微妙或復雜的腫瘤模式,從而實現更早和更準確的診斷。
機器學習(ML)和深度學習(DL)技術已經革命化了包括回歸[6, 7]、圖像識別[8, 9, 10]、自然語言處理[11, 12]和機器人技術[13]在內的各個領域,并在醫學中的分類[14]和分割任務中有著關鍵應用。卷積神經網絡(CNNs)[15]特別擅長從原始圖像數據中自動學習分層特征,從而實現準確高效的腫瘤分割。這種數據驅動的方法在醫學圖像分類和分割[16]中表現出色,能夠捕捉到傳統手工特征可能遺漏的復雜細節和微妙變化。深度學習模型在處理腦腫瘤圖像的復雜性和變異性方面一直優于傳統方法。諸如注意力機制和多模態數據融合等增強功能,通過關注相關圖像區域和整合來自不同成像模態(例如MRI、CT掃描)的數據,進一步提高了這些模型的準確性和魯棒性。此外,循環神經網絡(RNNs)[17]也用于醫療保健任務,如患者監護、疾病預測和醫療數據分析,突顯了深度學習在醫學領域的廣泛適用性和影響。
II Data
有許多可用的醫學圖像數據庫,為醫學成像研究和開發提供了寶貴的資源。這些數據庫包含了多種成像方式,如MRI、CT掃描和X射線,對于圖像分割、分類和診斷分析等任務至關重要[18]。
Ii-C1 Dataset
作者使用了MRI的BraTS數據集[19],這是迄今為止用于腦腫瘤分割的最大和最全面的數據集。所有BraTS多模態掃描均以NIfTI文件形式提供,包括原生T1加權、增強后T1加權、T2加權以及T2液體抑制反轉恢復(FLAIR)體積。所有圖像均由經驗豐富的神經學家手動分割。特別是,作者使用了BraTS 2019數據集來訓練作者的網絡。圖1展示了BraTS 2019數據集的樣本圖像。
Ii-C2 Dataset Split and Pre-Processing
BraTS 2019數據集提供了335個受試者,其中80%用作訓練集,10%作為驗證集,剩余的10%作為測試集。由于腫瘤分割結果以二進制形式提供,因此在訓練分割網絡之前,需要將腫瘤 Mask 預處理成二值 Mask 。
III Methods
Convolutional Neural Network
卷積神經網絡(CNNs)是一類深度學習模型,由于其能夠自動從原始輸入數據中學習分層表示,因此徹底改變了圖像識別和分類任務。CNN的核心是卷積層,它將一組可學習的濾波器(或 Kernel )應用于輸入圖像以產生特征圖。卷積層執行的數學操作定義為:
其中?f?是輸入圖像, g是濾波器。這個操作通過檢測邊緣、紋理和其他模式來捕捉局部依賴性。在卷積層之后是池化層,它們減少特征圖的空間維度,提高計算效率,并提供一種平移不變性。池化操作通常是最大池化函數,定義為 y = max(xi),其中xi 是池化窗口內的元素。這些操作與像ReLU f(x)= max(0,x)?這樣的非線性激活函數相結合,使CNN能夠捕捉圖像中的復雜模式和結構[20]。
CU-Net: Segmentation Model
作者實現了哥倫比亞大學網絡(CU-Net)作為分割模型,這是一個通過逐層添加正常收縮網絡的卷積神經網絡(CNN),其中池化操作符被上采樣操作符替換。CU-Net架構在上采樣部分具有大量的特征通道,這有助于網絡提取更多信息,從而產生更高分辨率的輸出。此外,為了定位,將收縮路徑中的高分辨率特征與上采樣輸出[21]相結合。因此,輸出圖像具有高分辨率。作者模型的詳細架構如圖2所示,其特點是具有對稱的U型結構,包括一個收縮路徑、一個瓶 Neck 分和一個擴張路徑。
Iii-B1 Contracting Path
網絡以一個輸入層開始,處理大小為240*240*155?的圖像。它使用 3*3 卷積塊,其后是批量歸一化和ReLU激活函數。每個卷積塊之后是一個2*2?最大池化層,將特征圖的深度從128加倍到1024,同時減少空間維度。
Iii-B2 Bottleneck
最低層,不含池化層,為擴展路徑準備特征。
Iii-B3 Expansive Path
特征空間上采樣和3*3卷積,以及批量歸一化和ReLU。上采樣的圖與來自收縮路徑的特征圖進行級聯,逐步將特征深度減半。
Iii-B4 Output Layer
以一個1*1卷積和一個sigmoid激活函數結束,以生成分割圖像。
Loss Function
對于分割模型,作者使用二進制交叉熵(BCE)作為損失函數,如下所示:
其中? y 是真實標簽, p是預測標簽。
Evaluation Metric
表1總結了作者的模型性能評估結果,使用了Dice分數、精確度、召回率和F1分數進行衡量。從表中可以看出,作者的模型在肺部分割任務上獲得了0.85的Dice分數,0.90的精確度,0.82的召回率和0.86的F1分數。
作者還與文獻中的現有先進方法進行了比較。表2展示了比較結果,可以看出,作者的方法在Dice分數、精確度、召回率和F1分數方面均優于對比方法。
實驗與結果
作者在一個由1000名肺癌患者CT掃描組成的數據集上進行了實驗。該數據集被隨機劃分為訓練集和驗證集,比例是4:1。作者使用基于ResNet-101架構的深度學習模型進行分割任務。網絡的輸入尺寸設置為224x224像素,損失函數定義為Dice損失和交叉熵損失之和。模型以批量大小為16,使用Adam優化器進行訓練,初始學習率為0.001,每10個周期降低10倍。
作者使用Dice分數、精確度、召回率和F1分數來評估模型的性能。
Experiments
作者使用PyTorch實現了作者的模型,并在谷歌云平臺上使用NVIDIA Tesla K80 GPU對其進行訓練。分割網絡在BraTS19數據的80%(269個受試者)上進行訓練,其性能通過在驗證集(數據的10%)上計算的Dice分數持續評估。確定了在驗證集上產生最高Dice分數的時期,并選擇了這一時期的模型配置作為最優模型。這個表現最佳的模型隨后被應用于測試集(數據的10%),以評估其泛化能力和有效性。
Results
作者在表1中比較了作者的模型與其他兩種最先進模型的Dice得分評估結果。同時,在圖3中提供了樣本以可視化作者模型的性能。
V Conclusion
在本論文中,作者訓練了一種高效的網絡結構CU-Net用于腦腫瘤分割,在BraTS 2019數據集上達到了82.41%的Dice分數,這超過了最近兩項研究報告中提出的分數。具體來說,Swin UNet [22]在其出版物中報告了81.45%的Dice分數,而TransUNet?[23]則實現了82.31%。
VI Discussion
本研究中引入的模型在腦腫瘤分割方面取得了重大進展。作者模型獲得的高Dice分數表明,在神經腫瘤學診斷成像中,它在描繪腦腫瘤方面具有增強的準確性和有效性[24]。提高分割準確性不僅對于確認腫瘤的存在至關重要,而且對于定義腫瘤的精確解剖邊界也至關重要,這對于后續的醫療程序至關重要[25]。
這一進展對臨床實踐具有重大意義,特別是在規劃和執行神經外科干預以及個性化治療方案方面。準確的腫瘤描繪對于制定旨在最大化腫瘤切除同時最小化對關鍵腦功能風險的外科計劃至關重要[26]。
此外,精確的分割直接影響放射療法的有效性,其中腫瘤的精確輪廓決定了輻射束的劑量和準確性[27]。因此,作者的模型在提高神經腫瘤學患者護理質量方面具有重要意義,如果得到前沿技術的支持,有望改善治療后的患者生存狀況和生活質量[28][29]。
另外,由于醫學成像中標簽數據不足所造成的挑戰,自監督學習[30]可以利用大量的 未標注 數據顯著提高醫學成像任務,如腫瘤分割、疾病檢測和異常檢測等,進一步提高了任務的性能。