[MIA 2025]CLIP in medical imaging: A survey

論文網址:CLIP in medical imaging: A survey - ScienceDirect

項目頁面:github.com

英文是純手打的!論文原文的summarizing and paraphrasing。可能會出現難以避免的拼寫錯誤和語法錯誤,若有發現歡迎評論指正!文章偏向于筆記,謹慎食用

目錄

1. 心得

2. 論文逐段精讀

2.1.?Abstract

2.2.?Introduction

2.3.?Background

2.3.1.?Contrastive language-image pre-training

2.3.2.?Variants of CLIP

2.3.3.?Medical image–text dataset

2.4.?CLIP in medical image–text pre-training

2.4.1.?Challenges of CLIP pre-training

2.4.2.?Multi-scale contrast

2.4.3.?Data-efficient contrast

2.4.4.?Explicit knowledge enhancement

2.4.5.?Others

2.4.6.?Summary

2.5.?CLIP-driven applications

2.5.1.?Classification

2.5.2.?Dense prediction

2.5.3.?Cross-modal tasks

2.5.4.?Summary

2.6.?Comparative analysis

2.7.?Discussions and future directions

2.8.?Conclusion

1. 心得

(1)我這可能只記錄這篇文章比較不同的地方,基礎CLIP和醫學影像就不記錄了,可以參考原文。主要是太長了沒必要全搬運

(2)怎么全文畫圖風格還不一樣,每個人畫一張拼的?

(3)偏記錄一點,介紹了不同的特別多模型

2. 論文逐段精讀

2.1.?Abstract

? ? ? ? ①就說CLIP在醫學成像領域有意義然后要探索一下

2.2.?Introduction

? ? ? ? ①Limitations: poor performance on?out-of-distribution performance

? ? ? ? ②The trend of CLIP relevant papers (left) and medical image contained in thosed papers (right):

? ? ? ? ③How CLIP be used:

2.3.?Background

2.3.1.?Contrastive language-image pre-training

? ? ? ? ①How CLIP works(如果沒看過可以去找CLIP原文,很清晰易懂的):

? ? ? ? ②Performance of CLIP in medical field:

2.3.2.?Variants of CLIP

? ? ? ? ①介紹了一些變體,但因為沒畫圖很難記住或者一眼知道有啥區別

2.3.3.?Medical image–text dataset

? ? ? ? ①Open medical dataset:

2.4.?CLIP in medical image–text pre-training

? ? ? ? ①Representative CILP based medical models:

2.4.1.?Challenges of CLIP pre-training

? ? ? ? ①Challenges of CLIP in medical image field:?

Modality-influenced, local and global image/text analysis needed

Scarse data(不是說零樣本泛化性都很好了嗎為什么又說數據稀缺

Need professional kownledge

2.4.2.?Multi-scale contrast

? ? ? ? ①GLoRIA matches text with subgraph:

? ? ? ? ②LoVT further assigns different weights on different sentence

2.4.3.?Data-efficient contrast

? ? ? ? ①Blindly push all negative pairs away might reduce the relevance of similar disease:

? ? ? ? ②Add description or shuffle sentences

? ? ? ? ③Using medical image video

2.4.4.?Explicit knowledge enhancement

? ? ? ? ①Combined with graph or kownledge graph(KG):

2.4.5.?Others

? ? ? ? ~

2.4.6.?Summary

? ? ? ? ~

2.5.?CLIP-driven applications

2.5.1.?Classification

? ? ? ? ①CLIP based models on image classification:

(1)Zero-shot classification

? ? ? ? ①Diagnosis example(我靠還能這樣,,做二分類):

? ? ? ? ②How Xplainer works(我靠牛唄啊CLIP現在都醬紫玩的):

(2)Context optimization

? ? ? ? ①Example of context optimization:

這沒什么解釋,不能讓人快速上手啊哈哈

2.5.2.?Dense prediction

? ? ? ? ①Methods:

(1)Detection

? ? ? ? ①Lists relevant models

(2)2D medical image segmentation

? ? ? ? ①fine tune CLIP to 2D medical image dataset

(3)3D medical image segmentation

? ? ? ? ①Examples:

(4)Others

2.5.3.?Cross-modal tasks

? ? ? ? ①Repesentitive models:

(1)Generation

? ? ? ? ①Automatically generate medical report or medical image

(2)Medical visual question answering

? ? ? ? ①Example(這構造奇奇怪怪的):

(3)Image–text retrieval

? ? ? ? ①Current models focus on global image feature

? ? ? ? ②X-TRA:

2.5.4.?Summary

? ? ? ? ~

2.6.?Comparative analysis

? ? ? ? ①How?Multi-modality Large Language Model (MLLM) different from CLIP:

? ? ? ? ②Performance of CLIP on different image sets:

2.7.?Discussions and future directions

? ? ? ? ①Inter-disease similarity:

? ? ? ? ②Challenges:?inconsistency between pre-training and application,?incomprehensive evaluation of refined pre-training,?challenges of volumetric imaging,?limited scope of refined CLIP pre-training,?debiasing in CLIP Models,?enhancing adversarial robustness of CLIP,?exploring the potential of metadata,?incorporation of high-order correlations,?beyond image–text alignment

2.8.?Conclusion

? ? ? ? ~

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/87138.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/87138.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/87138.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Python通訊錄系統實戰教程

具體介紹見 通訊錄管理系統設計與實現(C)-CSDN博客 class Person:def __init__(self, name"", sex0, age0, phone"", addr""):self.m_name name # 姓名self.m_Sex sex # 性別(1-男,2-女…

蝦米壁紙分類頁面代碼

<template> <view class"wallpaper-category"> <custom-nav-bar title"分類列表"></custom-nav-bar> <!-- 分類展示 --> <scroll-view scroll-y class"category-scroll-view"> <view cl…

K8s-pod 調度基礎

目錄 Replication Controller&#xff08;RC&#xff09; 概念 關鍵字段 Replica Set&#xff08;RS&#xff09; 概念 關鍵字段 RC 與 RS 的區別 無狀態應用管理Deployment 無狀態應用&#xff08;Stateless Application&#xff09; 什么是無狀態&#xff1f; 無狀…

Vue + RuoYi 前后端分離入門手冊

Vue RuoYi 前后端分離技術棧是一個非常流行且成熟的企業級后臺管理系統開發方案&#xff0c;尤其在國內 Java 開發社區中廣泛應用。它結合了現代化的前端框架 Vue.js 和基于 Spring Boot 的后端框架 RuoYi&#xff0c;提供了開箱即用的權限管理、代碼生成、監控等功能&#xf…

JSON 安裝使用教程

一、JSON 簡介 JSON&#xff08;JavaScript Object Notation&#xff09;是一種輕量級的數據交換格式&#xff0c;易于人閱讀和編寫&#xff0c;同時也易于機器解析和生成。它廣泛應用于前后端數據通信、配置文件、API 傳輸等場景。 二、JSON 是否需要安裝&#xff1f; 不需要…

十大網絡協議

十大網絡協議 標題1. HTTP&#xff08;HyperText Transfer Protocol&#xff0c;超文本傳輸協議&#xff09;標題2. HTTPS&#xff08;Secure Hypertext Transfer Protocol&#xff0c;安全超文本傳輸協議&#xff09;標題3. HTTP/3標題4. TCP&#xff08;Transmission Control…

【語音告警】博靈智能語音報警燈Modbus TCP觸發告警實例-語音報警燈|聲光報警器|網絡信號燈

功能說明 本文將以Python代碼為例&#xff0c;講解如何通過Python代碼調用博靈語音通知終端A4實現聲光語音告警。 本代碼實現Python觸發Modbus寫多寄存器和寫單寄存器實現調用通知終端模板播報功能&#xff08;通知終端內置TTS語音合成技術&#xff0c;本案例不講解如何文本轉…

攝像頭 rtsp數據量 和正常數據流有什么區別

攝像頭RTSP數據流和正常數據流&#xff08;如HTTP傳輸的普通文件或網頁數據&#xff09;在多個方面存在顯著差異&#xff0c;主要體現在協議特性、數據量、實時性、應用場景等方面。以下是具體對比&#xff1a; 1. 協議與傳輸方式 RTSP流&#xff1a; 實時流協議&#xff08;R…

深入理解裝飾器模式:動態擴展對象功能的靈活設計模式

深入理解裝飾器模式&#xff1a;動態擴展對象功能的靈活設計模式 &#x1f31f; 嗨&#xff0c;我是IRpickstars&#xff01; &#x1f30c; 總有一行代碼&#xff0c;能點亮萬千星辰。 &#x1f50d; 在技術的宇宙中&#xff0c;我愿做永不停歇的探索者。 ? 用代碼丈量世界…

141.在 Vue 3 中使用 OpenLayers Link 交互:把地圖中心點 / 縮放級別 / 旋轉角度實時寫進 URL,并同步解析顯示

本文分享一個前端小技巧&#xff1a;借助 OpenLayers 的 Link 交互 在瀏覽器地址欄實時記錄地圖狀態&#xff0c;同時把這些參數解析出來展示在頁面上。 ? 雙向同步&#xff1a;拖動、縮放、旋轉地圖時&#xff0c;URL 自動更新&#xff1b;手動修改 URL 或后退 / 前進&#x…

數字人的形象與內容,虛擬形象背后的權益暗戰

&#xff08;首席數據官高鵬律師數字經濟團隊創作&#xff0c;AI輔助&#xff09; 當某科技公司的虛擬偶像在直播間收獲百萬打賞時&#xff0c;當某品牌的數字代言人形象被篡改成表情包全網傳播時&#xff0c;當網紅博主的AI分身開始替代真人直播帶貨時&#xff0c;一場關于數…

【python】pdf拆成圖片,加中文,再合成pdf

前期搞了個pdf加頁腳&#xff0c;但是搞了半天中文加不了&#xff0c;就換了個思路。 直接說結論&#xff0c;pdf拆成圖片&#xff0c;加中文&#xff0c;再合成pdf&#xff0c;會導致pdf模糊。 import os import fitz # PyMuPDF from PIL import Image, ImageDraw, ImageFon…

分布式爬蟲數據存儲開發實戰

分布式爬蟲存儲的核心矛盾在于&#xff1a;既要高吞吐又要強一致性&#xff0c;還要避免重復。比如Kafka雖然吞吐高但無法去重&#xff0c;Redis去重快但容量有限。所以我們可能低估了狀態同步的復雜度——比如暫停爬蟲時如何保證內存中的URL狀態不丟失。 分布式爬蟲的數據存儲…

探秘阿里云Alibaba Cloud Linux:云時代的操作系統新寵

引言&#xff1a;云時代的操作系統變革 在云計算技術蓬勃發展的當下&#xff0c;企業的數字化轉型進程被極大地加速&#xff0c;而作為云計算底層支撐的操作系統&#xff0c;也迎來了前所未有的變革與挑戰。傳統操作系統在應對云計算環境中的大規模資源調度、高彈性擴展以及安…

使用pyflink進行kafka實時數據消費

目錄 背景 代碼demo 踩坑記錄 1、kafka連接器&#xff0c;kafka客戶端jar包找不到 2、java模塊系統訪問限制 3、執行demo任務&#xff0c;一直報錯連接kafka topic超時 總結 背景 實際項目中經常遇到source是kafka&#xff0c;需要實時消費kafka某個topic中的數據&#x…

軟件測試理論框架與發展:分類、原則與質量保障策略

第一章 一、計算機軟件的發展分類 早期軟件開發的特點&#xff1a; 軟件規模小、復雜程度低、開發過程不規范 測試的情況&#xff1a; 測試等同于調試 目的糾正軟件的已經知道的故障 投入少&#xff0c;介入晚 成為一種發現軟件的活動&#xff08;1957&#xff09; 測試不等于…

未知威脅攻擊原理和架構

大家讀完覺得有幫助記得關注和點贊&#xff01;&#xff01;&#xff01; 未知威脅&#xff08;Unknown Threats&#xff09;指利用零日漏洞、合法工具濫用、高級逃逸技術等**繞過傳統特征檢測**的攻擊&#xff0c;其核心在于**動態對抗防御體系的認知盲區**。以下從攻擊原理、…

基于Netty-WebSocket構建高性能實時通信服務

引言&#xff1a;WebSocket在現代應用中的重要性 在當今實時交互應用盛行的時代&#xff0c;WebSocket協議已成為實現雙向通信的核心技術。相比傳統的HTTP輪詢&#xff0c;WebSocket提供了&#xff1a; 真正的全雙工通信極低的延遲&#xff08;毫秒級&#xff09;高效的連接管…

咸蝦米項目總結1--const用法

在 UniApp&#xff08;或 Vue 3&#xff09;中&#xff0c;聲明一個空對象可使用下面這2種寫法&#xff1a; // 寫法1 const a ref(null);// 寫法2 const a ref({}); 在UniApp中&#xff0c;const a ref()用法概述&#xff1a; 用途&#xff1a; 創建一個響應式引用&#x…

在mac下手動編譯遷移的android版webrtc組件

我原先使用的android版webrtc是在linux下編譯的&#xff0c;現在因為某些原因需要把整個庫遷移到mac下編譯。 把代碼遷移完后&#xff0c;正常是需要通過gclient sync 重新構建編譯環境&#xff0c;但是由于網絡限制等方面原因&#xff0c;會導致完成的比較慢。 在摸索一陣后…