中科院1區|IF10+:加大醫學系團隊利用GPT-4+電子病歷分析,革新肝硬化并發癥隊列識別

圖片

中科院1區|IF10+:加大醫學系團隊利用GPT-4+電子病歷分析,革新肝硬化并發癥隊列識別

在當下的科研領域,人工智能尤其是大語言模型的迅猛發展,正為各個學科帶來前所未有的機遇與變革。在醫學范疇,從疾病的早期精準篩查,如AI預測系統可提前數年察覺阿爾茨海默病等千余種疾病風險,到影像診斷中顯著降低骨折漏診率,AI的應用已逐步滲透。在生物醫學研究方面,單細胞RNA測序技術結合人工智能,為深入解析細胞異質性開拓了新思路。于此同時,大語言模型在醫學知識問答、臨床報告生成等場景中也嶄露頭角。在這樣充滿活力與創新的大背景下,一篇發表于知名期刊Hepatology的論文,另辟蹊徑,巧妙運用生物信息方法及其他手段,在肝病研究領域取得了令人矚目的成果,接下來就讓我們深入探究這篇論文的精妙之處。?

https://doi.org/10.1097/HEP.0000000000001115

圖片

正式介紹


基本信息

  • 論文標題:利用GPT-4評估基于編碼的肝硬化及其并發癥識別的陽性預測值

  • 發表期刊:Hepatology,中科院醫學大類分區1區,IF=12.9002

  • 發表日期:2025年6月1日在線發表


研究背景

臨床需求矛盾:肝硬化及并發癥的隊列識別依賴診斷編碼(如 ICD 碼),但編碼準確性低(既往研究 PPV 僅 43%-91%),且無法區分“活動性”與“歷史性”病情;手動 chart review 雖為金標準,卻耗時耗力,難以規模化。技術機遇:大語言模型(LLM)如 GPT-4 具備非結構化文本解析能力,可高效處理電子健康記錄(EHR),為解決上述問題提供可能。


研究思路

數據提取:從 UCSF 醫療中心提取2013-2022 年 3788 份肝硬化相關出院小結,基于OMOP 編碼分為肝硬化、肝性腦病、腹水等 5 類隊列。雙軌驗證設計: 金標準:隨機抽取 5%-10% 病例進行手動 chart review,由資深醫生校正。LLM 方法:使用GPT-4-turbo-128k 設計零-shot 提示,識別出院小結中“活動性”病情,對比手動 review 計算準確性(Accuracy、PPV 等)。規模化評估編碼性能:以 LLM 分類為“銀標準”,計算傳統 OMOP 編碼在全部 3788 份小結中的 PPV,評估編碼可靠性。

圖片


研究亮點

方法學突破:首次在肝病領域將 GPT-4 作為“銀標準”規模化評估診斷編碼性能,替代部分手動 review。臨床價值:證明 LLM 可準確區分肝硬化并發癥的“活動性”(Accuracy 87.8%-98.8%),為 EHR 數據的高效利用提供技術支撐。成本效益:LLM 單例分析成本僅 0.05 美元,顯著低于手動 review,為大規模隊列研究提供經濟可行的方案。


數據來源和生物信息方法

1、數據來源

數據來源:UCSF 醫療中心 2013-2022 年肝硬化患者的電子健康記錄(EHR),包含 3788 份出院小結,涉及 2747 例患者。

2、生物信息方法

GPT-4 部署:通過 UCSF 合規的 Versa API 調用 GPT-4-turbo-128k,使用零-shot 提示工程,溫度參數調優至 0.0 和 0.7。提示工程:設計 5 組針對性提示,識別肝硬化及 4 種并發癥的活動性,如“請判斷該患者在住院期間是否存在活動性肝性腦病,并說明臨床管理措施”。統計分析。


主要結果

1、傳統編碼vs手動chart review(金標準)

肝硬化識別 PPV 為 82.2%;并發癥中腹水 PPV 最高(72.8%),肝性腦病最低(41.7%)。小結:傳統編碼對肝硬化本身識別尚可,但對并發癥(尤其是肝性腦病)準確性差,提示編碼無法可靠反映“活動性”病情。

2、GPT-4vs手動chart review(金標準)

肝硬化識別Accuracy 最高達 98.8%(溫度 0.0),PPV 98.9%;肝性腦病 Accuracy 96.3%(溫度 0.7),腹水 PPV 達 100%(溫度 0.0 和 0.7);胃腸道出血與自發性細菌性腹膜炎 Accuracy 分別為 87.8% 和 90.7%。小結:GPT-4 對肝硬化及并發癥的“活動性”識別準確性顯著高于傳統編碼,尤其在腹水等場景中接近完美(PPV 100%)。

3、傳統編碼 vs GPT-4(銀標準)

肝硬化PPV 79.8%;并發癥PPV 53.9%-67.6%,其中肝性腦病(53.9%)和腹水(55.3%)仍較低。小結:以LLM為銀標準,傳統編碼局限性進一步凸顯,提示需結合NLP技術優化隊列識別。

4、LLM 成本與效率分析

單例分析成本0.05 美元,總 token 消耗隨病例數增加而線性增長(如肝硬化 3788 例消耗 1881 萬tokens,成本 188.18 美元)。小結:LLM 方法兼具高效性與經濟性,適合大規模隊列研究。


研究結論

GPT-4等LLM可準確識別肝硬化及并發癥的“活動性”(Accuracy 87.8%-98.8%),性能顯著優于傳統診斷編碼。以LLM作為“銀標準”可規模化評估編碼性能,發現傳統方法對并發癥識別的不足。LLM方法成本低、可擴展,有望替代部分手動chart review,成為臨床研究隊列識別的新標準。


研究的局限性和未來方向

局限性:手動review存在9.2%的校正率,本身可能引入誤差;數據依賴OMOP編碼提取,可能存在信息丟失;GPT-4的通用性有待外部隊列驗證。

未來方向:在不同醫療機構使用Llama 3、Claude等模型驗證結果;應用LLM區分肝硬化病因;開發基于LLM的實時EHR數據標注工具。

感謝您的閱讀,歡迎關注“生信學術縱覽”。謝謝您的分享、點贊+在看!

圖片

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/87069.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/87069.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/87069.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Python學習小結

bg:記錄一下,怕忘了;先寫一點,后面再補充。 1、沒有方法重載 2、字段都是公共字段 3、都是類似C#中頂級語句的寫法 4、對類的定義直接: class Student: 創建對象不需要new關鍵字,直接stu Student() 5、方…

QCustomPlot 中實現拖動區域放大?與恢復

1、拖動區域放大? 在 QCustomPlot 中實現 ?拖動區域放大?(即通過鼠標左鍵拖動繪制矩形框選區域進行放大)的核心方法是設置 SelectionRectMode。具體操作步驟: 1?)禁用拖動模式? 確保先關閉默認的圖表拖動功能(否…

如何將文件從 iPhone 傳輸到閃存驅動器

您想將文件從 iPhone 或 iPad 傳輸到閃存盤進行備份嗎?這是一個很好的決定,但您需要先了解一些實用的方法。雖然 Apple 生態系統在很大程度上是封閉的,但您可以使用一些實用工具將文件從 iPhone 或 iPad 傳輸到閃存盤。下文提供了這些行之有效…

互聯網大廠Java求職面試:云原生架構與微服務設計中的復雜挑戰

互聯網大廠Java求職面試:云原生架構與微服務設計中的復雜挑戰 面試官開場白 面試官(嚴肅模式開啟):鄭薪苦,歡迎來到我們的技術面試環節。我是本次面試的技術總監,接下來我們將圍繞云原生架構、微服務設計、…

leetcode-hot-100 (鏈表)

1. 相交鏈表 題目鏈接:相交鏈表 題目描述:給你兩個單鏈表的頭節點 headA 和 headB ,請你找出并返回兩個單鏈表相交的起始節點。如果兩個鏈表不存在相交節點,返回 null 。 解答: 其實這道題目我一開始沒太看懂題目給…

Web前端基礎之HTML

一、瀏覽器 火狐瀏覽器、谷歌瀏覽器(推薦)、IE瀏覽器 推薦谷歌瀏覽器原因: 1、簡潔大方,打開速度快 2、開發者調試工具(右鍵空白處->檢查,打開調試模式) 二、開發工具 核心IDE工具 Visual Studio Code (VS Code)? 微軟開發…

11.TCP三次握手

TCP連接建立與傳輸 1.主機 A 與主機 B 使用 TCP 傳輸數據,A 是 TCP 客戶,B 是 TCP 服務器。假設有512B 的數據要傳輸給 B,B 僅給 A 發送確認;A 的發送窗口 swnd 的尺寸為 100B,而 TCP 數據報文段每次也攜帶…

Python 爬蟲入門 Day 3 - 實現爬蟲多頁抓取與翻頁邏輯

Python 第二階段 - 爬蟲入門 🎯 今日目標 掌握網頁分頁的原理和定位“下一頁”的鏈接能編寫循環邏輯自動翻頁抓取內容將多頁抓取整合到爬蟲系統中 📘 學習內容詳解 🔁 網頁分頁邏輯介紹 以 quotes.toscrape.com 為例: 首頁鏈…

分布式定時任務系列12:XXL-job的任務觸發為什么是死循環?

傳送門 分布式定時任務系列1:XXL-job安裝 分布式定時任務系列2:XXL-job使用 分布式定時任務系列3:任務執行引擎設計 分布式定時任務系列4:任務執行引擎設計續 分布式定時任務系列5:XXL-job中blockingQueue的應用 …

位運算詳解之異或運算的奇妙操作

位運算詳解之異或運算的奇妙操作 一、異或運算的本質與核心性質1.1 異或運算的定義與邏輯規則1.2 異或運算的核心代數性質(1)自反性:a ^ a 0(2)恒等性:a ^ 0 a(3)交換律&#xff1…

Element Plus 去除下拉菜單周黑邊

問題: 如上圖所示,當鼠標移入(hover)和點擊時就會圍繞一圈黑色邊框,但通過本文的方案 100% 完美解決。 解決方案: :deep(:focus-visible) {outline: none; } 備用方案 :deep(.el-tooltip__trigger:focus-visible) …

React Native 項目實戰 —— 記賬本應用開發指南

React Native 項目實戰 —— 記賬本應用開發指南 項目概述:本文將指導您使用 React Native 開發一個簡單的記賬本應用,幫助用戶記錄收入和支出。核心內容:我們將分析功能模塊、設計接口、劃分組件結構、管理數據流、實現頁面跳轉&#xff0c…

從 PPO、DPO 到 GRPO:大語言模型策略優化算法解析

從 PPO、DPO 到 GRPO:大語言模型策略優化算法解析 背景與簡介 大語言模型(LLM)的訓練通常分為預訓練和后訓練兩個階段。預訓練階段,模型在海量文本上學習下一詞預測的能力;后訓練階段,我們希望進一步對齊…

React中使用Day.js指南

文章目錄 引言什么是Day.js?Day.js的核心特性 安裝和基礎配置安裝Day.js基礎導入和使用 在React中的基礎使用1. 顯示格式化日期2. 實時時鐘組件 常用插件配置1. 相對時間插件2. 高級格式化插件3. 時區處理插件 實戰案例:博客文章時間組件高級應用場景1. …

【系統設計【1】】系統設計面試方法論:從0到百萬用戶的需求到架構的推演

文章目錄 一、系統設計面試的底層邏輯:從需求到架構的推演(一)需求澄清:界定問題邊界(二)分層設計:從單節點到分布式的演進1. Web層:無狀態化與負載均衡2. 數據層:數據庫…

京津冀城市群13城市空間權重0-1矩陣

京津冀城市群13城市空間權重0-1矩陣 1、數據說明:京津冀13個城市:北京市、保定市、滄州市、承德市、邯鄲市、衡水市、廊坊市、秦皇島市、石家莊市、唐山市、邢臺市、張家口市、天津市、 2、指標解釋:空間權重矩陣是一種用于表征空間表達式的…

七大技術路線解析:自動駕駛如何被數據重新定義

自動駕駛技術從實驗室的算法驗證走向大規模量產應用,是一場充滿挑戰的征程。這段征程的核心驅動力,不僅是芯片和傳感器的升級,更是一場關于數據的“喂養”競賽——從簡單的像素標注到多模態大模型的理解,數據需求的演變悄然推動著…

計網復習知識(16)傳輸層及其協議功能

目錄 考研大綱 1.傳輸層概述 端口號 有連接/無連接傳輸 可靠/不可靠傳輸 2.UDP協議 2.1 udp數據報 2.2 udp檢驗 3.TCP協議 3.1 TCP協議的框架梳理 3.2 TCP報文段**** 3.3 三次握手與四次揮手 三次握手 四次揮手 3.4 可靠傳輸與流量控制 流量控制:滑動…

每天一個前端小知識 Day 1

語義化 HTML&#xff08;Semantic HTML&#xff09; 1. 什么是語義化 HTML&#xff1f; 語義化 HTML 指的是使用符合內容含義的標簽&#xff0c;而不僅僅為了布局或樣式。例如&#xff1a; <article>…</article> <nav>…</nav> <header>…&l…

在docker中部署mysql

部署 MySQL&#xff08;端口 9006&#xff09; 1. 創建數據目錄 mkdir -p ~/qihuang/mysql/data2. 啟動 MySQL 容器 docker run -d \--name mysql-qihuang \-p 9006:3306 \-v ~/qihuang/mysql/data:/var/lib/mysql \-e MYSQL_ROOT_PASSWORDroot \-e MYSQL_DATABASEqihuangdb…