我的兩個醫學數據分析技術思路

我的兩個醫學數據分析技術思路

從臨床上獲得的或者公共數據庫數據這種屬于觀察性研究,是對臨床診療過程中自然產生的數據進行分析而獲得疾病發生發展的規律等研究成果。再細分,可以分為獨立危險因素鑒定和預測模型構建兩種。

獨立危險因素鑒定是一直以來的研究內容,目的是研究疾病預后的影響因素或者開發診斷指標,早期是通過統計學和邏輯回歸模型等方法進行研究;而預測模型構建是后來出現的,把多個獨立危險因素集中起來共同對疾病結局進行預測或者診斷疾病,達到更好地診斷和治療疾病的目的。

數據分析技術新的發展也給以上兩部分內容帶來了新的面貌,這里總結個人在這兩方面的分析技術思路,供大家借鑒。

機器學習算法主導的獨立危險因素鑒定

這里的機器學習主要是指xgboost等非線性模型,傳統的是使用多因素邏輯回歸作為獨立危險因素鑒定的最終結果,線性模型事先假定變量之間的關系是線性的被認為可能造成了分析結果的不準確,所以現在用xgboost等非線性模型來克服這個缺點,但是非線性模型就沒有象OR值這樣能反映變量間關聯強度的指標,等到SHAP分析這樣可以解釋模型的工具出現之后,機器學習算法主導的獨立危險因素鑒定才形成套路。
技術思路:

  1. 變量信息表(傳統的表1),展示變量的分布信息(平均值和標準差等)

  2. Boruta算法篩選變量,這是近年才流行的方法,微小的關聯也能篩選出來,所以不擔心遺漏有意義的變量。
    在這里插入圖片描述

  3. 構建xgboost等非線性模型并展示模型效能,這里良好的模型性能代表所選擇的變量與結局變量之間有良好的相關性,在這個前提下,后續的分析才是有價值的。
    在這里插入圖片描述

  4. SHAP分析展示變量的整體貢獻,可以選擇排名靠前的變量或者所有的變量進行后續的分析;
    在這里插入圖片描述

  5. SHAP分析展示單個變量隨變量值變化其對結局變量貢獻(某變量的SHAP值)的變化,結合立方樣條曲線擬合確定關鍵的點(SHAP值為0時對應的點和shap值大于0的曲線上的拐點)
    在這里插入圖片描述

  6. SHAP分析展示變量間的交互作用,展示變量間的交互作用。
    在這里插入圖片描述

  7. 其它,可以加入傳統的線性模型的分析方法以從不同方面展示獨立危險因素;如果收集了同類變量,還可以比較同類變量之間與結局變量相關性的差異;如果得到的獨立危險因素夠多,可以進行預測模型的構建,否則也可以獨立成文。

臨床預測模型構建(從數據到應用)

臨床預測模型在這里不多介紹。
技術思路:

  1. 變量的展示(表1)

  2. Boruta,Lasso等方法選擇變量,傳統的通過單因素分析p值的半自動方法應該淘汰了。
    在這里插入圖片描述

  3. 模型構建和評價,評價包括內部評價和外部評價,ROC曲線和校準曲線等我們已經耳熟能詳的指標。這里可以是單個模型,也可以是相似結局的一組模型。
    在這里插入圖片描述

  4. SHAP分析等解釋模型,這里以匯總結果為主,從整體評價變量對模型的貢獻;
    在這里插入圖片描述

  5. DCA分析,比較模型間的凈收益以選擇模型,或者變量間的凈收益來評價變量;
    在這里插入圖片描述

  6. 構建列線圖或者預測模型APP,如果是APP,推薦融入SHAP分析的個體評價,對單個預測結果進行解釋,可以展示變量當前值對預測結果的貢獻,在臨床實踐中可以解析為當前患者的病因是什么;
    在這里插入圖片描述

  7. 后續,確定后續的臨床措施(預測模型陽性采取的檢驗或者治療措施)并進行預測模型臨床影響力評價(一般是隨機對照試驗)。

最后

當拿到一份數據,可以先做預分析,如果得到的相關變量較多,就可以做預測模型,如果不夠多,就可以考慮獨立危險因素分析。

個人感覺,數據分析類的研究關鍵在于數據,大樣本,自己收集的,有特點的數據更容易做出有意義的研究。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/897101.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/897101.shtml
英文地址,請注明出處:http://en.pswp.cn/news/897101.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【YOLOv12改進trick】StarBlock引入YOLOv12,創新漲點優化,含創新點Python代碼,方便發論文

??改進模塊??:StarBlock ??解決問題??:采用StarBlock將輸入數據映射到一個極高維的非線性特征空間,生成豐富的特征表示,使得模型在處理復雜數據時更加有效。 ??改進優勢??:簡單粗暴的星型乘法漲點卻很明顯 ??適用場景??:目標檢測、語義分割、自然語言處理…

pyside6學習專欄(九):在PySide6中使用PySide6.QtCharts繪制6種不同的圖表的示例代碼

PySide6的QtCharts類支持繪制各種型狀的圖表,如面積區域圖、餅狀圖、折線圖、直方圖、線條曲線圖、離散點圖等,下面的代碼是采用示例數據繪制這6種圖表的示例代碼,并可實現動畫顯示效果,實際使用時參照代碼中示例數據的格式將實際數據替換即可…

《今日AI-人工智能-編程日報》

1. 字節跳動發布AI編程工具Trae國內版 發布背景:字節跳動于2025年3月3日正式推出國內版AI編程工具Trae,這是國內首個AI原生集成開發環境(AI IDE),旨在提升開發者的編程效率與智能化體驗。 核心功能: 搭載d…

doris: MySQL

Doris JDBC Catalog 支持通過標準 JDBC 接口連接 MySQL 數據庫。本文檔介紹如何配置 MySQL 數據庫連接。 使用須知? 要連接到 MySQL 數據庫,您需要 MySQL 5.7, 8.0 或更高版本 MySQL 數據庫的 JDBC 驅動程序,您可以從 Maven 倉庫下載最新或指定版本的…

【LangChain】存儲與管理對話歷史

0. 代碼演示 from langchain_community.chat_message_histories import SQLChatMessageHistorydef get_session_history(session_id):# 通過 session_id 區分對話歷史,并存儲在 sqlite 數據庫中return SQLChatMessageHistory(session_id, "sqlite:///memory.d…

從0開始的操作系統手搓教程21:進程子系統的一個核心功能——簡單的進程切換

目錄 具體說說我們的簡單RR調度 處理時鐘中斷處理函數 調度器 schedule switch_to 我們下面,就要開始真正的進程切換了。在那之前,筆者想要說的是——我們實現的進程切換簡單的無法再簡單了——也就是實現一個超級簡單的輪詢調度器。 每一個進程按照…

mysql新手常見問題解決方法總結

1. 安裝與配置問題 1.1 無法安裝MySQL Server MySQL Server安裝失敗是新手常見的問題之一,以下是具體原因及解決方案: 系統要求不滿足:MySQL對操作系統有最低版本要求,如Windows 7 SP1及以上、macOS 10.13及以上。若系統版本過…

數字組合(信息學奧賽一本通-1291)

【題目描述】 有n個正整數,找出其中和為t(t也是正整數)的可能的組合方式。如:n5,5個數分別為1,2,3,4,5,t5;那么可能的組合有514和523和55三種組合方式。 【輸入】 輸入的第一行是兩個正整數n和t,用空格隔開&#xff0c…

搜索引擎(基于java在線文檔)

背景: 基于java文檔的搜索引擎,可以輸入搜索詞,然后就可以查詢出與搜索詞相關的文檔。該項目的最主要的工作是要構建索引,就是正排和倒排索引。正排索引:根據文檔id獲取到文檔;倒排索引:根據搜…

【每日學點HarmonyOS Next知識】web滾動、事件回調、selectable屬性、監聽H5內部router、Grid嵌套時高度設置

【每日學點HarmonyOS Next知識】web滾動、事件回調、selectable屬性、監聽H5內部router、Grid嵌套時高度設置 1、HarmonyOS WebView加載url無法滾動? scroll 里面嵌套webView,demo參考: // xxx.ets import web_webview from ohos.web.webv…

Flink性能指標詳解MetricsAnalysis

文章目錄 Flink 組成1.JobManager2.TaskManager3.ResourceManager4.Dispatcher5.Client6. Env JobManager MetricsTaskManager Metrics Flink 組成 1.JobManager 管理任務 作業調度:負責接收和調度作業,分配任務到 TaskManager。資源管理:…

Flutter底層實現

1. Dart 語言 Dart 是 Flutter 的主要編程語言。Dart 設計之初就是為了與 JavaScript 兼容,并且可以編譯為機器代碼運行。Dart 提供了一些特性,如異步支持(通過 async 和 await),這使得編寫高效的網絡請求和復雜動畫變…

< 自用文兒 > CertBot 申請 SSL 證書 使用 challenge 模式 避開防火墻的阻擋

環境: 騰訊 VPS 騰訊會向你銷售 SSL , 這個本是免費的。CertBot 默認申請證書要用到 80 端口,會蹭邊什么什么條款,備案法律來阻止80端口的通訊,沒有網站也一樣被阻攔。 通過騰訊買的域名: bestherbs.cn …

【AI】【Unity】關于Unity接入DeepseekAPI遇到的坑

前言 由于deepseek網頁端在白天日常抽風,無法正常的使用,所以調用API就成了目前最好的選擇,尤其是Deepseek的API價格低得可怕,這不是和白送的一樣嗎!然后使用過很多本地部署接入API的方式,例如Chatbox、Pa…

【微知】Mellanox驅動中to是什么?有哪些超時時間?(time out,心跳2s,reset 1分鐘)

to是tout縮寫,tout是time out 單位是毫秒。 static const u32 tout_def_sw_val[MAX_TIMEOUT_TYPES] {[MLX5_TO_FW_PRE_INIT_TIMEOUT_MS] 120000, # 2min。預初始化的總超時時間[MLX5_TO_FW_PRE_INIT_ON_RECOVERY_TIMEOUT_MS] 7200000, #設備恢復過程中的固件預初…

linux | Vim 命令快捷操作

注:本文為過去的 “vim 使用筆記”。 跳轉命令 跳轉命令 #:向前查找光標當前所在單詞,并跳轉到該單詞的上一個出現位置。*:向后查找光標當前所在單詞,并跳轉到該單詞的下一個出現位置。 行內跳轉 0:跳轉…

樹莓派3B+的初步使用

樹莓派3B的初步使用 一、安裝使用樹莓派系統1.將系統寫入SD卡2.登錄樹莓派系統3.用C和Python編譯運行hello world 一、安裝使用樹莓派系統 1.將系統寫入SD卡 首先,準備至少16GB大小的SD卡以便裝入樹莓派系統,將SD卡插入讀卡器后連接電腦準備給SD卡寫入…

基于Windows11的DockerDesktop安裝和布署方法簡介

基于Windows11的DockerDesktop安裝和布署方法簡介 一、下載安裝Docker docker 下載地址 https://www.docker.com/ Download Docker Desktop 選擇Download for Winodws AMD64下載Docker Desktop Installer.exe 雙點擊 Docker Desktop Installer.exe 進行安裝 測試Docker安裝是…

文檔處理控件Aspose.Total教程:使用 C# 將 Obsidian Markdown 轉換為 OneNote

Obsidian 是一款廣泛使用的基于 Markdown 的筆記應用程序。它提供了一種強大而有效的方式來構建和組織想法。用戶可以無縫地連接他們的想法,提高清晰度和工作效率。另一方面,OneNote 是 Microsoft 的一款功能強大的筆記應用程序。它還可以幫助用戶組織他…

第5章:vuex

第5章:vuex 1 求和案例 純vue版2 vuex工作原理圖3 vuex案例3.1 搭建vuex環境錯誤寫法正確寫法 3.2 求和案例vuex版細節分析源代碼 4 getters配置項4.1 細節4.2 源代碼 5 mapState與mapGetters5.1 總結5.2 細節分析5.3 源代碼 6 mapActions與mapMutations6.1 總結6.2…