Eyecare-100K:首個覆蓋多模態、多任務的高質量眼科視覺指令數據集

2025-04-18 , 由浙江大學、哈爾濱工業大學、郴州市第一人民醫院、新加坡國立大學等機構合作創建了 Eyecare-100K數據集,這是首個涵蓋多種模態、任務和疾病的高質量眼科視覺指令數據集,為眼科智能診斷領域提供了關鍵資源,推動了醫學視覺語言模型(Med-LVLMs)在眼科的精細化理解與應用。

一、研究背景

醫學大型視覺語言模型(Med-LVLMs)在醫療領域展現出巨大潛力,但在眼科智能診斷方面,由于依賴于一般醫療數據和粗粒度的全局視覺理解,其表現受到限制。

目前遇到困難和挑戰:

1、數據方面:缺乏深度標注、高質量、多模態的眼科視覺指令數據。

2、基準測試方面:缺少全面系統的基準測試,無法準確評估 Med-LVLMs 在眼科診斷任務上的表現。

3、模型方面:現有模型架構難以適應眼科病變識別所需的細粒度、區域特定的視覺理解。

數據集地址:Eyecare-100K|眼科圖像分析數據集|疾病診斷數據集

二、 讓我們一起來看一下Eyecare-100K數據集

Eyecare-100K 是一個包含約 10.2 萬對視覺問答(VQA)的高質量眼科視覺指令數據集,覆蓋 8 種成像模態、15 種以上解剖結構和 100 多種眼病。

Eyecare-100K 集成了來自 13 個公共數據集、3 家醫院和 3 個公共醫學案例庫的 58485 張眼科圖像。它涵蓋了熒光素血管造影(FA)、吲哚青綠血管造影(ICGA)、光學相干斷層掃描(OCT)、眼底攝影、超聲生物顯微鏡(UBM)、裂隙燈、熒光素染色成像和計算機斷層掃描(CT)等 8 種成像模態,跨越 15 種解剖結構和 100 多種眼科疾病及罕見病癥,極大地增強了數據集的多樣性和全面性。

數據集構建:

構建過程中,開發了一個多智能體數據引擎,用于從大規模原始數據中提取、清理、標準化信息,并進行專家審核。該引擎包含信息提取器、醫療案例收集器、數據清洗器、問答模板庫、問答生成器和基于人類偏好的審核器等 6 個組件,最終將數據組織成封閉問答(多項選擇題)、開放問答(簡答題)和報告生成(長文本回答)三種類型的 VQA 任務。

數據集特點:

1、多模態:涵蓋多種成像模態,如 FA、ICGA、OCT 等。

2、多任務:支持封閉問答、開放問答和報告生成等多種任務。

3、高質量標注:經過專家審核,確保標注的準確性和標準化。

4、大規模:包含約 10.2 萬對視覺問答,數據量豐富。

基準測試:

基于 Eyecare-100K 構建的 Eyecare-Bench 基準測試,包含約 1.5 萬個測試樣本,覆蓋多種任務、模態和疾病類別。在該基準測試中,EyecareGPT 模型取得了平均準確率 84.56% 的最佳性能,顯著優于其他模型,驗證了數據集的有效性和模型的優越性。

Eyecare-100K 概述。Eyecare-100K 匯集了來自 8 個模態、15 個以上解剖結構和 100 個以上眼科疾病的真實世界眼科數據,支持多模態報告生成和精細視覺問答任務。

Eyecare-100K 數據統計

多智能體數據引擎框架

十項評估框架

EyecareGPT 的模型架構

基于 GPT-4 在報告生成任務中評估結果,包括(a)FA,(b)UBM 和(c)CT 模態。

在 Eyecare-100K 上進行微調后的結果。

醫生對生成的報告(a)和 EyeEval 可靠性(b、c)的偏好

三、展望Eyecare-100K數據集

以前,醫生診斷糖尿病視網膜病變主要依靠人工檢查眼底照片。這個過程非常耗時,因為醫生需要仔細觀察每一張照片,尋找微血管瘤、出血、滲出物等病變特征。而且,由于人眼的局限性,有時候一些細微的病變可能被遺漏,導致診斷不夠準確。對于大規模的篩查項目來說,這種方式效率低下,很難快速處理大量患者的數據。

現在借助 Eyecare-100K 數據集,那可就不一樣了

這個數據集包含了大量高質量、多模態的眼科圖像以及深度標注信息,涵蓋了多種眼病,包括糖尿病視網膜病變。研究人員利用這個數據集訓練出了更精準的醫學視覺語言模型(如 EyecareGPT),這些模型能夠自動識別眼底照片中的病變特征。

診斷效率大幅提升:模型可以在短時間內處理大量圖像,快速篩查出高風險患者,大大節省了醫生的時間。比如,在一些眼科智能診療中心,患者可以在更近的醫療機構完成眼底檢查,智能系統能夠快速給出初步診斷結果,縮短了患者的等待時間。

診斷準確性提高:由于數據集的標注非常詳細,模型學習到了更豐富的病變特征和診斷知識,能夠更準確地識別病變。這有助于早期發現糖尿病視網膜病變,及時進行干預,減少因延誤治療導致的視力損害。

個性化醫療體驗:基于 Eyecare-100K 訓練的模型還可以生成詳細的診斷報告,為醫生提供更全面的參考信息,幫助制定個性化的治療方案。

更多免費的數據集,請打開:遇見數據集

遇見數據集-讓每個數據集都被發現,讓每一次遇見都有價值。遇見數據集,領先的千萬級數據集搜索引擎,實時追蹤全球數據集,助力把握數據要素市場。https://www.selectdataset.com/

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/80162.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/80162.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/80162.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

CoT-Drive:利用 LLM 和思維鏈提示實現自動駕駛的高效運動預測

25年3月來自澳門大學和 MIT 的論文“CoT-Drive: Efficient Motion Forecasting for Autonomous Driving with LLMs and Chain-of-Thought Prompting”。 準確的運動預測對于安全的自動駕駛 (AD) 至關重要。本研究提出 CoT-Drive,這是一種利用大語言模型 (LLM) 和思…

[FPGA基礎] RAM篇

Xilinx FPGA RAM 使用指南 1. 引言 隨機存取存儲器(RAM)是 Xilinx FPGA 設計中用于存儲和快速訪問數據的重要資源。Xilinx FPGA 提供多種 RAM 類型,包括塊 RAM(Block RAM)和分布式 RAM(Distributed RAM&a…

Elasticsearch內核探秘:從Shard分配到網絡通信的深度實踐指南

#作者:孫德新 文章目錄 一、底層模塊深入解析之shard allocation1、shard allocation的介紹2、cluster level shard allocation介紹3、disk-based shard allocation介紹4、shard allocation awareness5、shard allocation filtering6、node下線時的shard延遲分配7、…

SQL Server 2022 常見問題解答:從安裝到優化的全場景指南

SQL Server 2022 作為微軟最新的數據庫管理系統,在性能、安全性和云集成方面帶來了多項革新。然而,用戶在實際使用中仍可能遇到各類問題。本文將圍繞安裝配置、性能優化、備份恢復、安全設置、高可用性方案、兼容性問題及錯誤代碼解析等核心場景&#xf…

57、Spring Boot 最佳實踐

Spring Boot 最佳實踐 一. 開發規范與代碼風格 編寫高質量的代碼不僅需要功能的實現,還需要遵循一定的規范和代碼風格,以提高代碼的可讀性、可維護性和協作效率。以下是 Spring Boot 開發中的一些關鍵規范和代碼風格建議。 1. 代碼命名規范 在編寫代碼時,命名是非常重要的…

??OSPF核心機制精要:選路、防環與設計原理?

一、OSPF選路規則解析 OSPF作為經典的鏈路狀態路由協議,其選路規則采用層次化優先級機制,不同路由類型遵循嚴格比較順序: 1. 路由類型優先級 優先級路由類型描述1域內路由通過1類、2類LSA生成2域間路由通過3類LSA生成3域外路由通過5類/7類…

1.1軟考系統架構設計師:系統架構的定義與作用 - 超簡記憶要點、知識體系全解、考點深度解析、真題訓練附答案及解析

超簡記憶要點 定義:結構決策 | 抽象概念 | 多視圖模型(邏輯/物理/動態)作用:解耦復雜需求 | 集成擴展 | 指導開發(藍圖)要素:構件(原子/復合) | 連接件(API/…

網絡socks 代理

在系統/終端中設了這樣的環境變量,而沒有在代碼中覆蓋,HTTPX 就會啟用該 socks 代理。 env | grep proxy https_proxyhttps://proxyhk.zte.com.cn:80 http_proxyhttp://proxyhk.zte.com.cn:80 no_proxylocalhost,127.0.0.0/8,::1,zte.com.cn,zte.intra,…

PCB規則

PCB封裝 原理圖繪制完成需要檢查 DRC 菜單欄——>設計——>檢查 DRC 底部側邊欄——>DRC——>檢查 DRC 常見問題: 1)某個導線/網絡標簽是一個單網絡 網絡標簽名稱不一樣 網絡標簽只有一個 引腳沒有使用,但是放置了導線 2&#xf…

圖像預處理-圖像邊緣檢測(流程)

一.高斯濾波 因為圖像邊緣檢測就是把像素值有差異的地方提取出來,所以噪聲會有很大影響,因此需要對圖像進行平滑處理,高斯濾波是流程中常用的方法。 二.計算圖像的梯度與方向 過程中通常使用sobel算子進行梯度計算,在OpenCV中&am…

ChatBEV:一種理解 BEV 地圖的可視化語言模型

25年3月來自上海交大、上海AI實驗室、同濟大學和MAGIC的論文“ChatBEV: A Visual Language Model that Understands BEV Maps”。 交通場景理解對于智能交通系統和自動駕駛至關重要,可確保車輛安全高效地運行。雖然 VLM 的最新進展已顯示出整體場景理解的前景&…

武裝Burp Suite工具:xia SQL自動化測試_插件

武裝Burp Suite工具:xia SQL自動化測試_插件 插件作者介紹:本插件僅只插入單引號,沒有其他盲注啥的,且返回的結果需要人工介入去判斷是否存在注入,如果需要所有注入都測試,請把burp的流量轉發到xray。 目錄…

線段樹講解(小進階)

目錄 前言 一、線段樹知識回顧 線段樹區間加減 區間修改維護: 區間修改的操作: 區間修改update: 線段樹的區間查詢 區間查詢: 區間查詢的操作: 遞歸查詢過程: 區間查詢query: 代碼&…

neo4j中節點內的名稱顯示不全解決辦法(如何讓label在節點上自動換行)

因為節點過多而且想讓節點中所有文字都顯示出來而放大節點尺寸 從neo4j中導出png,再轉成PDF來查看時,要看清節點里面的文字就得放大5倍才行 在網上看了很多讓里面文字換行的辦法都不行 然后找到一個比較靠譜的辦法是在要顯示的標簽內加換行符 但是我的節點上顯示的是…

SQL進階知識:五、存儲過程和函數

今天介紹下關于存儲過程和函數的詳細介紹,并結合MySQL數據庫提供實際例子。 在MySQL中,存儲過程(Stored Procedures)和函數(Functions)是數據庫編程的重要組成部分,它們可以封裝SQL語句&#xf…

CONDA:用于 Co-Salient 目標檢測的壓縮深度關聯學習(總結)

摘要 一 介紹 二 有關工作 三 提出的方法 圖2:我們的凝聚式深度關聯(CONDA)模型的整體流程圖。具體來說,凝聚式深度關聯(CONDA)模型首先利用圖像特征來計算超關聯。然后,全像素超關聯由對應誘…

node.js 實戰——(path模塊 知識點學習)

path 模塊 提供了操作路徑的功能 說明path. resolve拼接規范的絕對路徑path. sep獲取操作系統的路徑分隔符path. parse解析路徑并返回對象path. basename獲取路徑的基礎名稱path. dirname獲取路徑的目錄名path. extname獲得路徑的擴展名 resolve 拼接規范的絕對路徑 const…

Kimi做內容社區,劍指小紅書?

原創科技新知AI新科技組作者丨櫻木編輯丨江蘺 主編丨九黎 對于當前融資形勢并不明朗的大模型六小龍來說,該如何生存下去,似乎成了各家急需解決的問題。 根據PitchBook數據,今年一季度風險投資機構在中國AI領域共完成144筆交易,投…

opencv--圖像濾波

圖像濾波 含義 方法 噪聲是怎么產生的 線性濾波 概念 利用窗口對圖像中的像素進行加權求和的濾波方式。 圖像來源于小虎教程。 圖像的濾波是二維濾波的過程。 濾波器窗口: 濾波器窗口(也稱為卷積核或模板)是一個小的矩陣(通常為…

Java 實現SpringContextUtils工具類,手動獲取Bean

SpringContextUtils 工具類實現 下面是一個完整的 Spring 上下文工具類實現,用于從 Spring 容器中獲取 Bean。這個工具類考慮了線程安全、性能優化和易用性,并提供了多種獲取 Bean 的方式。 完整實現代碼 import org.springframework.beans.BeansExce…