詳細圖解 Path-SAM2: Transfer SAM2 for digital pathology semantic segmentation

在這里插入圖片描述

? 背景動機

  • 數字病理中的語義分割(semantic segmentation)是非常關鍵的,比如腫瘤檢測、組織分類等。
  • SAM(Segment Anything Model)推動了通用分割的發展,但在病理圖像上表現一般。
    病理圖像(Pathology Images)指的是通過顯微鏡觀察生物組織切片后拍攝的圖像,主要用來幫助醫生診斷疾病。
  • SAM2相較于SAM提升了準確率和泛化性,但在病理圖像分割上,直接用SAM2還是不夠好。
  • 因此,Path-SAM2提出了專門為病理圖像設計的SAM2變體。

🛠 方法設計

整體架構如下:
在這里插入圖片描述

主要包括:

  • SAM2圖像編碼器
  • 外部病理編碼器UNI
  • 維度對齊模塊
  • KAN分類模塊(取代傳統prompt)
  • 混合解碼器

1. Pathology Encoder

  • SAM2自帶的Hiera網絡是為自然圖像設計的,不夠理解病理圖像細節。
  • 新引入了UNI —— 一個在1億張H&E病理圖上自監督訓練的超大模型,專門懂病理。
  • 做法:將SAM2編碼器輸出UNI編碼器輸出拼接(concat),作為后續特征輸入。

2. KAN分類模塊(取代Prompt)

  • 傳統SAM需要人工給“點提示”(點在腫瘤位置提示模型),很麻煩。
  • 這里引入了Kolmogorov–Arnold Network(KAN),代替人工prompt,自動生成分類提示。
  • KAN的特點:用可學習的單變量函數,取代傳統MLP的線性權重,提升了參數利用率和解釋性。

3. Loss設計

  • 總損失 = **Dice Loss + Focal Loss + IOU Loss(MSE)**的加權組合。
  • 參數 α 和 β 控制各部分的比重(文中默認α=0.125,β=0.01)。

📊 實驗與結果

數據集

  • EBHI:4,456張 224×224 的切片
  • CRAG:213張 1536×1536 的大圖
  • GlaS:165張 522×775 的腸腺癌組織

實驗設置

  • 使用SAM2UNI的預訓練權重
  • 三層KAN網絡
  • 優化器:AdamW
  • 訓練硬件:4× RTX V100 GPU

主要結果(見表格)

方法EBHI IOUCRAG IOUGlaS IOU
Fine-tuned SAM250.24%53.17%47.82%
MedSAM2 (pp)62.29%49.72%48.55%
Path-SAM2 (Ours)93.17%89.38%92.02%
  • ?? Path-SAM2在三個病理數據集上都大幅領先其他方法。
  • ?? 引入UNI病理知識+KAN分類模塊的改動起了決定性作用。
  • ?? 相比SAM/SAM2,即便人工精細點prompt,Path-SAM2仍明顯更好。

Ablation Study(消融實驗)

  • 證明了KAN模塊比傳統MLP更好,帶來了顯著的IOU提升。

🏁 結論

  • Path-SAM2是首個基于SAM2,且針對病理圖像語義分割特別設計的模型。
  • 核心貢獻:
    • 結合了UNI病理編碼器增強病理領域知識。
    • KAN分類器代替人工prompt,提升了自動化和精度。
  • 在多個病理數據集上驗證了出色性能,未來會公開代碼和模型權重。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/903205.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/903205.shtml
英文地址,請注明出處:http://en.pswp.cn/news/903205.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

初識Redis · 哨兵機制

目錄 前言: 引入哨兵 模擬哨兵機制 配置docker環境 基于docker環境搭建哨兵環境 對比三種配置文件 編排主從節點和sentinel 主從節點 sentinel 模擬哨兵 前言: 在前文我們介紹了Redis的主從復制有一個最大的缺點就是,主節點掛了之…

HTTP header Cookie 和 Set-Cookie

RFC 6265: HTTP State Management Mechanismhttps://www.rfc-editor.org/rfc/rfc6265 Set-Cookie 響應頭 服務器使用 Set-Cookie 響應頭向客戶端&#xff08;通常是瀏覽器&#xff09;發送 Cookie。 基本格式&#xff1a; Set-Cookie: <cookie名稱><cookie值>;…

【Unity完整游戲開發案例】從0做一個太空大戰游戲

1.實現飛機移動控制 // 這個腳本實現控制飛機前后移動&#xff0c;方向由鼠標控制 //1.WS控制前后移動2.鼠標控制上下左右旋轉3.AD控制傾斜 using System.Collections; using System.Collections.Generic; using UnityEngine;public class PlayerController : MonoBehav…

【C++】C++11新特性(一)

文章目錄 列表初始化initializer_list左值引用和右值引用 列表初始化 在 C98 中可以使用{}對數組或者結構體元素進行統一的列表初始值設定 struct Point {int _x;int _y; }; int main() {int array1[] { 1, 2, 3, 4, 5 };int array2[5] { 0 };Point p { 1, 2 };return 0; …

小黑享受思考心流: 73. 矩陣置零

小黑代碼 class Solution:def setZeroes(self, matrix: List[List[int]]) -> None:"""Do not return anything, modify matrix in-place instead."""items []m len(matrix)n len(matrix[0])for i in range(m):for j in range(n):if not m…

精益數據分析(19/126):走出數據誤區,擁抱創業愿景

精益數據分析&#xff08;19/126&#xff09;&#xff1a;走出數據誤區&#xff0c;擁抱創業愿景 在創業與數據分析的探索之旅中&#xff0c;我們都渴望獲取更多知識&#xff0c;少走彎路。今天&#xff0c;我依然帶著和大家共同進步的想法&#xff0c;深入解讀《精益數據分析…

循環神經網絡RNN---LSTM

一、 RNN介紹 循環神經網絡&#xff08;Recurrent Neural Network&#xff0c;簡稱 RNN&#xff09;是一種專門用于處理序列數據的神經網絡&#xff0c;在自然語言處理、語音識別、時間序列預測等領域有廣泛應用。 傳統神經網絡 無法訓練出具有順序的數據。模型搭建時沒有考…

優考試V4.20機構版【附百度網盤鏈接】

優考試局域網考試系統具有強大的統計分析功能。優考試通過對考試數據進行統計分析&#xff0c;諸如考試分數分布&#xff0c;考試用時分布&#xff0c;錯排行等&#xff0c;讓你從整體上了解你的學員&#xff08;員工&#xff09;狀態&#xff0c; 同時你也可以對學員&#xff…

【Amazing晶焱科技高速 CAN Bus 傳輸與 TVS/ESD/EOS 保護,將是車用電子的生死關鍵無標題】

臺北國際車用電子展是亞洲地區重量級的車用電子科技盛會&#xff0c;聚焦于 ADAS、電動車動力系統、智慧座艙、人機界面、車聯網等領域。各大車廠與 Tier 1 供應鏈無不摩拳擦掌&#xff0c;推出最新技術與創新解決方案。 而今年&#xff0c;“智慧座艙” 無疑將成為全場焦點&am…

面試:結構體默認是對齊的嘛?如何禁止對齊?

是的。 結構體默認是對齊的?。結構體對齊是為了優化內存訪問速度和減少CPU訪問內存時的延遲。結構體對齊的規則如下&#xff1a; 某數據類型的變量存放的地址需要按有效對齊字節剩下的字節數可以被該數據類型所占字節數整除&#xff0c;char可以放在任意位置&#xff0c;int存…

如何優雅地解決AI生成內容粘貼到Word排版混亂的問題?

隨著AI工具的廣泛應用&#xff0c;越來越多人開始使用AI輔助撰寫論文、報告或博客。然而&#xff0c;當我們直接將AI生成的文本復制到Word文檔中時&#xff0c;常常會遇到排版混亂、格式異常的問題。這是因為大部分AI輸出時默認使用了Markdown格式&#xff0c;而Word對Markdown…

Golang | HashMap實現原理

HashMap是一種基于哈希表實現的鍵值對存儲結構&#xff0c;它通過哈希函數將鍵映射到數組的索引位置&#xff0c;支持高效的插入、查找和刪除操作。其核心原理如下&#xff1a; 哈希函數&#xff1a;將鍵轉換為數組索引。理想情況下&#xff0c;不同鍵應映射到不同索引&#xf…

vue3學習之防抖和節流

? 在前端開發中&#xff0c;我們經常會遇到這樣的情況&#xff1a;某些事件&#xff08;如滾動、輸入、點擊等&#xff09;會頻繁觸發&#xff0c;如果不加以控制&#xff0c;可能會導致性能問題。Vue3 中的防抖&#xff08;Debounce&#xff09;和節流&#xff08;Throttle&a…

4.2.2 MySQL索引原理以及SQL優化

文章目錄 4.2.2 MySQL索引原理以及SQL優化1. 索引與約束1. 索引是什么2. 索引的目的3. 幾種索引4. 約束1.外鍵2. 約束 vs 索引的區別 5. 索引實現1. 索引存儲2. 頁3. B樹4. B樹層高問題5. 自增id6. 聚集索引7. 輔助索引 8. innnodb體系結構1. buffer pool2. change buffer 9. 最…

【學習筆記】文件包含漏洞--本地遠程包含、偽協議、加密編碼

一、文件包含漏洞 和SQL等攻擊方式一樣&#xff0c;文件包含漏洞也是一種注入型漏洞&#xff0c;其本質就是輸入一段用戶能夠控制的腳本或者代碼&#xff0c;并讓服務端執行。 什么叫包含呢&#xff1f;以PHP為例&#xff0c;我們常常把可重復使用的函數寫入到單個文件中&…

藍橋杯 2021年模擬賽 掃雷問題

題目&#xff1a; 在一個 n 行 m 列的方格圖上有一些位置有地雷&#xff0c;另外一些位置為空。 請為每個空位置標一個整數&#xff0c;表示周圍八個相鄰的方格中有多少個地雷。 輸入描述 輸入的第一行包含兩個整數 n,m。 第 22行到第n1 行每行包含 m 個整數&#xff0c;相…

寫windows服務日志-.net4.5.2-定時修改數據庫中某些參數

環境&#xff1a; windows 11 Visual Studio 2015 .net 4.5.2 SQL Server 目的&#xff1a; 定時修改數據庫中某些參數的值 定時修改24小時內&#xff0c;SQL數據庫中&#xff0c;表JD_Reports 內&#xff0c;如果部門是‘體檢科&#xff0c;設置打印類型為 1 可以打印。步驟&a…

madvise MADV_FREE對文件頁統計的影響及原理

一、背景 madvise系統調用是一個與性能優化強相關的一個系統調用。madvise系統調用包括使用madvise函數&#xff0c;也包含使用posix_fadvise函數。如我們可以使用posix_fadvise傳入POSIX_FADV_DONTNEED來清除文件頁的page cache以減少內存壓力。 這篇博客里&#xff0c;我們…

于鍵值(KV)的表

基于鍵值&#xff08;KV&#xff09;的表 將行編碼為鍵值&#xff08;KVs&#xff09; 索引查詢&#xff1a;點查詢和范圍查詢 在關系型數據庫中&#xff0c;數據被建模為由行和列組成的二維表。用戶通過SQL表達他們的意圖&#xff0c;而數據庫則神奇地提供結果。不那么神奇的…

2025年邵陽市工程技術研究中心申報流程、條件、獎補

一、邵陽市工程技術研究中心申報條件 &#xff08;一&#xff09;工程技術研究中心主要依托科技型企業組建&#xff0c;依托單位應具有以下條件&#xff1a; 1.?具有較強技術創新意識的領導班子和技術水平高、工程化實踐經驗豐富的工程技術研發隊伍&#xff0c;其中固定人員…