一區思路!挑戰5天一篇NHANES預測模型 DAY1-5

挑戰5天一篇預測模型NHANES

Day1!

近期美國關閉seer數據庫的信息在互聯網上廣泛傳播,大家都在擔心數據庫挖掘是否還能做。這個問題其實是有答案的,數據庫挖掘肯定能做,做沒被關的數據庫即可,同時留意一些國產數據庫~

因此我在這個時間段挑戰做一篇nhanes數據挖掘庫挖掘,堅定大家的信念。只有擁有SCI,才有碩士選擇更好的權利,才有讀到博士的機會,一定堅定信念,數據庫那么多,總有我們能做的~

為了提高挑戰的難度和成稿文章的接收率,挑我決定挑戰5天利用NHANES數據庫完成一篇預測模型SCI!

第一天的主要任務就是熟悉數據庫+明確選題+確定目標期刊和目標文獻

由于我們之前發起過很多期NHANES的挑戰,對NHANES的官網還是非常熟悉的,這里就大大縮短了熟悉網站的時間。

簡單來說,NHANES數據庫是一個 涉及心血管、內分泌、營養、感染、婦產等多個領域的,無需申請或倫理審批,數據完全免費的公共數據庫。數據量特別的大,涉及的相關指標很多,可以適合各個不同的科室的朋友來挖掘寫作~

之前的挑戰大多研究的是A變量與B疾病之間的關聯,這次想做點不一樣的,利用同樣的數據庫來做臨床預測模型~

我用“NHANES + nomogram”進行了初步的檢索,發現發的文章數量不多,正是發文的好時機!

我想建立一個我的目標疾病的人群全因死亡率的列線圖,所以又去檢索了“NHANES and nomogram and 目標疾病”,目前還沒有人發過,那就這么定啦!接著在pubmed上根據我的目的選擇了一個目標雜志,目標期刊:Front Pharmacol 標題Development and validation of a nomogram for predicting all-cause mortality in American adult hypertensive populations,隨后去深入了解了這個雜志,不是水刊,發文量和被引數都還可以,那就他啦

堅定信念,讓我們一起沖沖沖!!!

Day 2!

雖然最近醫院很忙,但挑戰不能停~

第2天主要任務:提取數據前的準備

具體需要干的就是:

  1. 閱讀5-10篇NHANES預測模型的文章
  2. 根據文章確定自己需要的變量
  3. 整理變量的具體信息
  4. 整理需要的數據

公開數據庫有很多,如MIMIC、eICU數據庫等,但是相較而言NHANES數據庫的數據獲取比較簡單,而且我們已經將所有的數據都下載到了本地,大大縮短了我們提取數據的時間,對我們這些“臨床打工人”來說是非常友好的!

今天最主要的一步就是整理變量的信息,在動手前,我一般會花幾十分鐘時間,整體瀏覽一下這個數據庫,對于什么樣的數據在demo里,什么樣的數據是在問卷里做到心中有數,有些實在找不到的變量,也可以去試試首頁上的search variables。

變量信息整理好后,其實就完成了大半,接下來要做的就是把需要的xpt文件整理好就好啦~我們前期花了一些時間,把所有的周期的所有數據全部下載到本地啦,所以整理數據幾分鐘就能完成~

好啦,今天的分享就到這里啦!

Day 3!

Day3任務:數據提取與清洗。

前期我已經把所有的數據都下載好啦,現在主要的目標就是進行數據的提取清洗,我們用R將所需要的數據提取出來。在第二天我們已經把所需要的數據的具體信息都整理好啦,這個表格對我們的數據提取至關重要~

因為我做的是目標疾病的死亡率的預測模型,所以要考慮的主要有三個方面:

  1. 目標疾病
  2. 死亡的信息
  3. 需要考慮的變量

因為之前以及熟悉過這個代碼啦,所以提數據的時候很easy~用代碼提啊提,很快就搞完了。需要花一點時間的地方就是數據的清洗,做預測模型和普通的NHANES在數據清洗部是一樣的,比如說高血壓看起來只有是和否,但實際上需要依靠多個數據一起來定義:

  1. 目前正在口服降壓藥 2)血壓大于140/90mmHg(取平均值) 3)被醫生告知有高血壓

工程還是很浩大滴!

但做多了也就熟練啦~猛猛一頓篩選就搞定!

整理好了數據以后,后面的分析實際上是非常簡單的,選題才是最重要、最費時間的,也是最容易浮躁滴,靜下來,方向對了,就一定能出成果。

一起加油呀~

Day 4!

Day4任務:跑出結果+完成中文稿

前期花了3天時間已經將數據都整理好啦,現在的任務就是跑出圖片和表格~

在第2天我們已經大量閱讀了相關的文獻啦,模仿文獻一步一步來就好了,常規NHANES預測模型的文章需要下面這些Table和Figure,我進行了提取和總結

Figure 1:流程圖---數據來源過程及分析步驟

Table 1:基線特征---訓練集和驗證集的基線特征

Table 2:回歸分析---單變量和多變量回歸分析

Figure 2:LASSO 回歸--選擇風險因素

Figure 3:Nomogram--列線圖的構建

Figure 4-6:預測模型的驗證--ROC曲線、校準曲線、DCA曲線

這就是NHANES預測模型文章的主要結果啦,跑完數據后,我又根據我們的寫作法把初稿整完啦,今天又是熬夜肝文章的一天~

因為前期已經整理好了數據,后面的分析實際上是非常簡單的,選題和整理數據才是最費時間的,靜下來,一步步踏實完成。

今日份挑戰成功~

Day?5!

Day5任務:完成文章寫作+投稿

昨天已經將圖片、表格和初稿都已經整完啦,后面就是翻譯潤色和投稿哩!寫作其實是最簡單的哈哈哈~有我們的《框架寫作法》理清思路,我昨天在跑完結果后才能快速寫完初稿哈哈哈~

今天的任務比較輕松,只需要補充模塊化寫作部分,然后翻譯潤色,根據目標期刊改格式就好啦!改完以后再發給導師看一眼就可以準備投稿咯~~

挑戰5天完成一篇NHANES預測模型,挑戰成功!!!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/79173.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/79173.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/79173.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

centos7安裝NVIDIA顯卡

裝備工作 我的系統版本 cat /etc/centos-releaseCentOS Linux release 7.9.2009 (Core) 內核版本 rpm -q kernel或者 rpm -qa|grep kernelkernel-3.10.0-1160.el7.x86_64 注意以上輸出內核版本,按照我下面的操作步驟,不會出問題。否則重裝系統都有可…

Web應用開發指南

一、引言 隨著互聯網的迅猛發展,Web應用已深度融入日常生活的各個方面。為滿足用戶對性能、交互與可維護性的日益增長的需求,開發者需要一整套高效、系統化的解決方案。在此背景下,前端框架應運而生。不同于僅提供UI組件的工具庫&#xff0c…

Java @Transactional事物隔離級別和默認值詳解

在 Java 開發中,Transactional 注解是 Spring 框架中用于管理事務的重要工具。它提供了多種配置選項,其中事務隔離級別是一個關鍵屬性。本文將深入探討 Transactional 注解的隔離級別默認值,并通過具體代碼示例幫助你更好地理解和應用事務隔離…

車輛檢測新突破:VFM-Det 如何用大模型提升識別精度

目錄 ?編輯 一、摘要 二、引言 三、相關工作 四、Coovally AI模型訓練與應用平臺 五、方法 概述 綜述:基于區域建議的檢測 基于VehicleMAE的感知器 六、實驗分析 數據集與評估指標 實現細節 屬性預測模塊預訓練 與SOTA檢測器的對比實驗 消融實驗 V…

微格式:為Web內容賦予語義的力量

一、什么是微格式? 微格式是一種建立在已有 Web 標準基礎上的簡單、開放的數據格式。它的核心思想是通過在 HTML 標簽中添加特定的屬性和類名,為網頁內容添加語義注解,從而兼顧 HTML 文檔的人機可讀性。 簡單來說,微格式就是一套約定俗成的 HTML 標記方式,讓我們能夠在不…

偏移成像中,原始地震采集數據的數據規則化(Data Regularization)

在油氣地震資料處理中,柯希霍夫(Kirchhoff)積分法偏移成像對數據采集分布的均勻性較為敏感。當原始地震道數據存在空間分布不均勻時,會導致偏移噪聲、假頻或成像失真。數據規則化(Data Regularization)通過…

米殼AI:跨境電商圖片翻譯的“隱形革命”:當AI技術遇上全球化生意

一、行業觀察:跨境賣家的“語言圍城” 在亞馬遜西班牙站,某家居品牌因產品圖西班牙語翻譯錯誤導致整批貨物滯留港口;TikTok東南亞直播間里,美妝主播因馬來語字幕錯位引發消費者投訴……這些真實案例折射出跨境電商的集體困境&…

人工智能:如何將數據輸入到神經網絡中

文章目錄 引言數據輸入神經網絡的重要性及示例以識別美女圖片為例講解數據輸入不同應用的數據輸入方式結語 人工智能是引領未來的前沿技術領域。通過這個系統性學習計劃,我們將逐步深入如何將數據輸入到神經網絡中。無論你是初學者還是有一定基礎的開發者&#xff0…

數據庫12(游標)

游標語法 declare c1 cursor for select title from titles --定義一個游標c1,確定游標對應的列是titles表的title列,游標可以對應多個列 declare bname varchar(50) --聲明變量 open c1 --初始化,開始使用游標 fetch next from c1 in…

第四部分:賦予網頁健壯的靈魂 —— TypeScript(中)

目錄 4 類與面向對象:構建復雜的組件4.1 類的定義與成員4.2 繼承 (Inheritance)4.3 接口實現 (Implements)4.4 抽象類 (Abstract Class)4.5 靜態成員 (Static Members) 5 更高級的類型:讓類型系統更靈活5.1 聯合類型 (|)5.2 交叉類型 (&)5.3 字面量類…

Vue3源碼學習-提交限制

文章目錄 前言? 1. ESLint 限制🔧 配置位置:? 啟用了哪些規則(核心):📦 使用的插件和標準: ? 2. TSC 編譯限制關鍵選項: ? 3. Git Hook 校驗工具鏈配置例子(package.…

Arthas 使用攻略

目錄 背景 Arthas是什么? 安裝 使用arthas-boot(推薦) 啟動 常用命令 一鍵生成arthas命令的插件(強烈推薦) watch 一、命令語法結構 二、核心參數詳解 三、實戰場景 1. 基礎觀測 - 查看入參和返回值 2. 條件過濾 - 只關注特定參…

冥想類短視頻批量剪輯自動混剪技術實踐:從素材處理到智能合成全解析

一、引言:工業化內容生產的技術突圍 在心理健康類內容爆發的當下,冥想類短視頻憑借「低制作成本 高用戶粘性」的特性成為熱門賽道。本文結合實戰經驗,解析如何通過模塊化素材處理、參數化合成引擎、自動化質量控制等技術手段,構…

【自定義控件實現最大高度和最大寬度實現】

背景 開發中偶爾遇到控件寬度或者高度在自適應的情況下,有個邊界值,也就是最大值。 比如高度自適應的情況下最大高度300dp這種場景。 實現 關鍵節點代碼: Overrideprotected void onMeasure(int widthMeasureSpec, int heightMeasureSpec)…

綜合練習三

使用到的知識點:xml文件,初始化file數據,提取file文件數據 題目:水文檢測系統 備注:可以把序號作為該條數據的唯一標識(即UUID),而不是第一條第二條數據這樣的類型。代碼是后者&…

Microsoft Entra ID 詳解:現代身份與訪問管理的核心

Microsoft Entra ID(原名為 Azure Active Directory,簡稱 Azure AD)是微軟推出的云端身份和訪問管理服務,專為現代混合環境設計,支持企業安全地管理用戶身份、控制資源訪問,并集成多種應用與服務。以下從核心功能到最佳實踐全面解析 Entra ID。 1. Entra ID 的核心定位 …

從技術角度看Facebook的隱私保護機制

在數字化時代,隱私保護成為了公眾關注的焦點。作為全球最大的社交網絡平臺之一,Facebook 在隱私保護方面采取了一系列技術措施。本文將從技術角度探討 Facebook 的隱私保護機制,揭示它是如何在提供個性化服務的同時,確保用戶隱私信…

基于策略模式實現靈活可擴展的短信服務架構

基于策略模式實現靈活可擴展的短信服務架構 引言 在企業級應用開發中,短信服務是不可或缺的基礎功能之一。隨著業務發展,我們可能需要接入多個短信服務提供商(如阿里云、騰訊云、第三方短信網關等),并能夠在不修改核…

Vue 3 單文件組件中 VCA 語法糖及核心特性詳解

在 Vue.js 的開發世界里,單文件組件(Single File Components,簡稱 SFC)是構建復雜應用的基石。它將 HTML、CSS 和 JavaScript 代碼封裝在一個.vue文件中,極大地提高了代碼的可維護性和復用性。 本文將深入探討單文件組…

【Unity C#從零到精通】項目深化:構建核心游戲循環、UI與動態敵人系統

Langchain系列文章目錄 01-玩轉LangChain:從模型調用到Prompt模板與輸出解析的完整指南 02-玩轉 LangChain Memory 模塊:四種記憶類型詳解及應用場景全覆蓋 03-全面掌握 LangChain:從核心鏈條構建到動態任務分配的實戰指南 04-玩轉 LangChai…