mimic數據統計

是否能聯通

psql -h 127.0.0.1 -U Shinelon-d mimic --password

pgadmin建庫

psql -d mimiciv -f mimic-iv/buildmimic/postgres/create.sql

也可以pgadmin直接運行create.sql

導入csv.gz數據

psql -d mimic -v ON_ERROR_STOP=1 -v mimic_data_dir=H:/mimic-iv-2.2 -f C:\Users\Shinelon\Downloads\mimic-code-main\mimic-iv\buildmimic\postgres\load_gz.sql

醫院表

表名功能描述
admissions患者入院信息(入院時間、出院時間、入院類型、科室等)
d_hcpcsHCPCS 編碼字典(解釋 HCPCS 代碼對應的醫療服務 / 物品含義)
d_icd_diagnosesICD-9 診斷編碼字典(關聯diagnoses_icd,提供診斷名稱、縮寫等)
d_icd_proceduresICD-9 手術編碼字典(關聯procedures_icd,解釋手術編碼含義)
d_labitems實驗室檢測項字典(關聯labevents,解釋itemid對應的檢測名稱、單位等)
diagnoses_icd患者診斷記錄(存儲 ICD-9 編碼,關聯subject_idhadm_id
drgcodesDRG 分組信息(患者的診斷相關分組,用于醫保付費等)
emar電子用藥醫囑(用藥醫囑概要,如藥品、時間)
emar_detail電子用藥醫囑詳情(劑量、頻率、給藥途徑等)
hcpcs_eventsHCPCS 服務記錄(患者接受的 HCPCS 編碼對應的醫療服務)
labevents實驗室檢測結果(患者的檢驗數據,關聯d_labitemsitemid
microbiologyevents微生物檢測結果(細菌培養、藥敏試驗等)
omr門診病歷記錄(Outpatient Medical Records,門診相關數據)
patients患者基本信息(性別、出生日期、唯一標識subject_id等)
pharmacy藥房信息(藥品庫存、調配記錄等)
poe醫囑錄入(Provider Order Entry,醫囑錄入的基本信息)
poe_detail醫囑詳情(poe的補充信息,如醫囑具體參數)
prescriptions處方記錄(患者的處方信息,含藥品、劑量、開方時間等)
procedures_icd手術記錄(存儲 ICD-9 手術編碼,關聯subject_idhadm_id
provider醫護人員信息(ID、姓名、科室等)
services院內服務記錄(患者所在服務單元,如 ICU、普通病房等)
transfers轉科記錄(患者在院內的科室轉移時間、去向等)

卒中icd數據和提取

  • ICD-9 和 ICD-10 中 “卒中(stroke)” 的核心編碼范圍如下:

    ICD-9-CM(MIMIC-III 常用)

    卒中編碼集中在 430–438(循環系統疾病類目),關鍵亞類包括:

    • 430:蛛網膜下腔出血
    • 431:腦內出血(非創傷性)
    • 434:腦動脈閉塞(如腦血栓形成、腦栓塞)
    • 436:急性難分類腦血管病
    • 排除:435(短暫性腦缺血發作,TIA)通常不被視為卒中

    ICD-10-CM(MIMIC-IV 常用)

    卒中編碼對應 I60–I69(腦血管疾患類目),關鍵亞類包括:

    • I60:非創傷性蛛網膜下腔出血
    • I61:非創傷性腦內出血
    • I63:腦梗死(缺血性卒中)
    • I64:未特指為出血或梗死的卒中
    • I69:腦血管病后遺癥(如卒中后偏癱)

    應用場景(如 MIMIC 數據庫)

    • 若使用 MIMIC-III(ICD-9),可通過 diagnoses_icd.icd_code and diagnoses_icd.icd_version=9 BETWEEN '430' AND '438' 篩選卒中病例;
    • 若使用 MIMIC-IV(ICD-10),則通過 diagnoses_icd10.icd_code BETWEEN 'I60' AND 'I69' 篩選。

提取所有ICD-9編碼為434(缺血性卒中)的患者唯一ID(subject_id)

SELECT DISTINCT di.subject_id
FROM MIMICIV_HOSP.diagnoses_icd di – ICD-9診斷表
WHERE di.icd_code like ‘434%’ and di.icd_version=9 – 注意ICD編碼是字符串類型,需加單引號
or di.icd_code like ‘163%’ and di.icd_version=10 – 注意ICD編碼是字符串類型,需加單引號

提取AD的患者

G301 G309 G308 G300 3310

SELECT DISTINCT di.subject_id FROM MIMICIV_HOSP.diagnoses_icd di
WHERE (di.icd_version = 9 AND di.icd_code = ‘3310’) OR
(di.icd_version = 10 AND (di.icd_code IN (‘G301’, ‘G309’, ‘G308’, ‘G300’)) );

診斷排序

SELECT
icd_code,
count(icd_code) AS item_count – 每個itemid的出現次數
FROM MIMICIV_HOSP.diagnoses_icd
GROUP BY icd_code-- 按icd項目分組
ORDER BY desc item_count ; – 按itemid排序

匹配icd title

`import pandas as pd

# 讀取診斷數據

all_diagnosis_df = pd.read_csv(r’H:\mimic-iv-2.2\all_diagnosis.csv’)

# 讀取ICD字典數據

d_icd_df = pd.read_csv(r’H:\mimic-iv-2.2\hosp\csv\d_icd_diagnoses.csv’)

# 去除icd_code中的所有空格(包括中間和首尾的空格)

# 為原始數據添加處理后的icd_code列,用于匹配

all_diagnosis_df[‘icd_code_clean’] = all_diagnosis_df[‘icd_code’].astype(str).str.replace(r’\s+', ‘’, regex=True)

d_icd_df[‘icd_code_clean’] = d_icd_df[‘icd_code’].astype(str).str.replace(r’\s+', ‘’, regex=True)

# 提取ICD字典中處理后的所有icd_code并轉為集合(提高查找效率)

icd_codes_in_dict = set(d_icd_df[‘icd_code_clean’].unique())

# 提取待匹配的所有處理后的icd_code(去重)

all_icd_codes = all_diagnosis_df[‘icd_code_clean’].unique()

# 同時保留原始icd_code用于顯示

original_icd_mapping = dict(zip(all_diagnosis_df[‘icd_code_clean’], all_diagnosis_df[‘icd_code’]))

# 存儲未找到匹配的icd_code(原始值和處理后的值)

not_found_codes = []

# 逐個匹配并檢查

print(“開始匹配ICD代碼(已自動去除空格)…”)

for clean_code in all_icd_codes:

? original_code = original_icd_mapping[clean_code]

? if clean_code not in icd_codes_in_dict:

? not_found_codes.append({

? ‘原始代碼’: original_code,

? ‘處理后代碼’: clean_code

? })

? print(f"未找到匹配: 原始代碼=‘{original_code}’,處理后代碼=‘{clean_code}’")

# 打印總結信息

print(f"\n匹配完成。共檢查 {len(all_icd_codes)} 個唯一ICD代碼,其中 {len(not_found_codes)} 個未找到匹配。")

# 執行合并操作(使用處理后的代碼進行匹配)

merged_df = pd.merge(

? all_diagnosis_df,

? d_icd_df[[‘icd_code_clean’, ‘icd_version’, ‘long_title’, ‘icd_code’]], # 保留原始icd_code

? on=‘icd_code_clean’,

? how=‘left’,

? suffixes=(‘’, ‘_dict’) # 區分原始和字典中的icd_code

)

# 調整列順序,移除臨時的clean列

merged_df = merged_df.drop(columns=[‘icd_code_clean’])

# 可選:如果需要可以將字典中的原始icd_code重命名

# merged_df = merged_df.rename(columns={‘icd_code_dict’: ‘icd_code_from_dict’})

# 保存結果文件

csv_path = r’H:\mimic-iv-2.2\all_diagnosis_filled.csv’

merged_df.to_csv(csv_path, index=False)

print(f"\n合并結果已保存至: {csv_path}")

# 可選:將未找到的代碼保存到文件

if not_found_codes:

? not_found_df = pd.DataFrame(not_found_codes)

? not_found_path = r’H:\mimic-iv-2.2\icd_codes_not_found.csv’

? not_found_df.to_csv(not_found_path, index=False)

? print(f"未找到的ICD代碼已保存至: {not_found_path}")

? `

前20的診斷

一般診斷數越多病例越多越好出文章

icd_codeitem_counticd_versionlong_title
4019973619Unspecified essential hypertension
2724638759Other and unspecified hyperlipidemia
I105170610Essential (primary) hypertension
E7854858110Hyperlipidemia, unspecified
53081462389Esophageal reflux
25000410299Diabetes mellitus without mention of complication, type II or unspecified type, not stated as uncontrolled
Z878913889310Personal history of nicotine dependence
42731351809Atrial fibrillation
311346329Depressive disorder, not elsewhere classified
4280345979Congestive heart failure, unspecified
41401342379Coronary atherosclerosis of native coronary artery
K2193373710Gastro-esophageal reflux disease without esophagitis
V1582301979Personal history of tobacco use
F3292878710Major depressive disorder, single episode, unspecified
5849276419Acute kidney failure, unspecified
2449270659Unspecified acquired hypothyroidism
I25102539810Atherosclerotic heart disease of native coronary artery without angina pectoris
3051245429Tobacco use disorder
2859232889Anemia, unspecified

實驗室檢查分析統計

統計每個itemid的記錄數,并按itemid排列

SELECT
itemid,
count(itemid) AS item_count – 每個itemid的出現次數
FROM MIMICIV_HOSP.labevents
GROUP BY itemid – 按檢測項目分組
ORDER BY itemid desc; – 按itemid排序(此時排序有效)

依舊是匹配之后出前20的實驗室指標

itemiditem_countlabelfluidcategory
512213325700HematocritBloodHematology
509123282278CreatinineBloodChemistry
512653216656Platelet CountBloodHematology
510063189474Urea NitrogenBloodChemistry
512223188835HemoglobinBloodHematology
513013171798White Blood CellsBloodHematology
512493167190MCHCBloodHematology
512793167075Red Blood CellsBloodHematology
512503167074MCVBloodHematology
512483167073MCHBloodHematology
512773166860RDWBloodHematology
509713150261PotassiumBloodChemistry
509833119778SodiumBloodChemistry
509023083705ChlorideBloodChemistry
508822972827BicarbonateBloodChemistry
508682965452Anion GapBloodChemistry
509312749562GlucoseBloodChemistry
508932190816Calcium, TotalBloodChemistry
509602154209MagnesiumBloodChemistry

醫囑procedure分析

SELECT
itemid,
count(itemid) AS item_count – 每個itemid的出現次數
FROM MIMICIV_HOSP.procedures_icd
GROUP BY itemid – 按檢測項目分組
ORDER BY itemid desc; – 按itemid排序(此時排序有效)

前20procedure

icd_codeitem_counticd_versionlong_titleicd_code_dict
3893139289Venous catheterization, not elsewhere classified3893
02HV33Z1006110Insertion of Infusion Device into Superior Vena Cava, Percutaneous Approach02HV33Z
8938100419Other nonoperative respiratory measurements8938
389798439Central venous catheter placement with guidance3897
885690439Coronary arteriography using two catheters8856
96678119Enteral infusion of concentrated nutritional substances966
399573749Hemodialysis3995
004071589Procedure on single vessel0040
967170369Continuous invasive mechanical ventilation for less than 96 consecutive hours9671
895265069Electrocardiogram8952
549162459Percutaneous abdominal drainage5491
960462039Insertion of endotracheal tube9604
372257889Left heart cardiac catheterization3722
874454829Routine chest x-ray, so described8744
451354709Other endoscopy of small intestine4513
006651009Percutaneous transluminal coronary angioplasty [PTCA]0066
992550069Injection or infusion of cancer chemotherapeutic substance9925
3E0G76Z487110Introduction of Nutritional Substance into Upper GI, Via Natural or Artificial Opening3E0G76Z
396148339Extracorporeal circulation auxiliary to open heart surgery3961
389947129Other puncture of vein3899

HCPC分析

HCPC 全稱為 Healthcare Common Procedure Coding System(醫療通用程序編碼系統),是美國用于標準化描述醫療服務、醫療程序、醫療用品(如器械、藥品)的編碼體系,由美國醫療保險和醫療補助服務中心(CMS)與美國醫學會(AMA)共同維護,核心作用是統一醫療服務的標識,支撐醫保結算、醫療數據統計和服務費用核算。

核心組成與用途

  1. 主要編碼類型
    • Level I(CPT 編碼):對應醫生提供的診療服務(如手術、檢查、門診治療),由 AMA 制定,編碼為 5 位數字(如 99213 代表常規門診隨訪)。
    • Level II:對應醫療用品、設備、特殊服務(如輪椅、假肢、家庭醫療服務),編碼以字母開頭 + 4 位數字(如 E0100 代表標準輪椅)。
  2. 核心用途
    • 醫保報銷:作為美國醫保(如 Medicare/Medicaid)判斷服務是否覆蓋、計算報銷金額的依據;
    • 數據標準化:統一不同醫療機構的服務記錄,便于醫療質量分析、疾病與治療關聯研究;
    • 費用核算:明確醫療服務的具體編碼,對應收費標準。

SELECT
hcpcs_cd,
count(hcpcs_cd) AS item_count – 每個itemid的出現次數
FROM MIMICIV_HOSP.hcpcsevents
GROUP BY hcpcs_cd – 按檢測項目分組
ORDER BY hcpcs_cd desc; – 按itemid排序(此時排序有效)

前20hcpc

hcpcs_cditem_countcodeshort_descriptionlong_description
G037853184G0378Hospital observation per hrHospital observation service, per hour
992194440199219Hospital observation services
992181022299218Hospital observation services
99220977599220Hospital observation services
4326296043262Digestive system
9345492393454Cardiovascular
4497092144970Digestive system
4326483943264Digestive system
4323971943239Digestive system
4756271747562Digestive system
C9600627C9600Perc drug-el cor stent singPercutaneous transcatheter placement of drug eluting intracoronary stent(s), with coronary angioplasty when performed; single major coronary artery or branch
4323544143235Digestive system
6444739864447Nervous system
4538038245380Digestive system
9345837393458Cardiovascular
6441534764415Nervous system
9298032892980Cardiovascular
4327432343274Digestive system
3624631136246Cardiovascular system

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/93953.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/93953.shtml
英文地址,請注明出處:http://en.pswp.cn/web/93953.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

孟德爾隨機化小試 從軟件安裝數據下載到多種檢驗

孟德爾隨機化(Mendelian Randomization, MR)作為一種利用基因數據推斷因果關系的強大工具,在流行病學研究中應用廣泛。本文將詳細講解MR的核心原理、完整分析流程,并附上關鍵代碼實現,幫助你從零開始完成一次MR分析。1…

記一次:postman請求下載文件的使用方法

前言:筆者的后端接口是swagger,遇到像文件導出下載的功能就實現不了。然后使用postman工具就可以了。注:postman工具使用send下拉選項中有請求下載,如圖完美解決。后續有其它方法在補充。

快速搭建項目(若依)

RuoYi-Vue 是一個 Java EE 企業級快速開發平臺,低代碼的框架。 1.環境要求: 其中MySQL和Redis放在服務器上或者本機上。 2.代碼搭建: 代碼下載地址:https://gitee.com/y_project/RuoYi-Vue,在官方文檔里面可下載若依…

iOS開發之UICollectionView為什么需要配合UICollectionViewFlowLayout使用

1. UICollectionView 的職責分離UICollectionView 本質上只是一個容器,用來展示一系列的 cell(單元格)。 它本身 不關心 cell 的擺放方式,只負責:Cell 的復用(避免性能浪費)Cell 的增刪改查滾動…

一、部署LNMP

一、準備環境操作系統:CentOS 7.x(最少 2 核 CPU 2GB 內存 20GB 磁盤)網絡:能訪問公網(用于下載包)軟件版本:Nginx 1.20MySQL 5.7/8.0PHP 7.4WordPress 6.x(商城插件 WooCommerce&…

【時時三省】vectorCAST 便捷使用技巧

山不在高,有仙則名。水不在深,有龍則靈。 ----CSDN 時時三省 目錄 1,工程的共享 2,工程的關鍵文件保存 2,工作環境目錄下,各個文件夾的作用 1,build 和 environment 的區別 2,vcm的作用 3,tst 文件的妙用 4,配置文件的妙用 5,復制測試環境 6,vectorCAST…

TOPSIS 優劣解距離法總結

TOPSIS 優劣解距離法總結 1. 基本思想 TOPSIS(Technique for Order Preference by Similarity to Ideal Solution)方法通過計算方案與正理想解(最優值)和負理想解(最劣值)的距離,來評價方案的優…

機器學習筆試題

人工智能與機器學習單選題(50道)1. 機器學習的核心目標是:A. 通過硬編碼規則解決問題 B. 從數據中自動學習模式 C. 提高計算機硬件性能 D. 優化數據庫查詢速度2. 以下屬于監督學習任務的是:A. 聚類分析 B. 圖像分類 C. 異常檢測 D…

CISP-PTE之路--10文

1.TCP/UDP 工作在 OSI 哪個層? 應用層 傳輸層 數據鏈路層 表示層 答案:傳輸層 解析:TCP(傳輸控制協議)和 UDP(用戶數據報協議)是 OSI 模型中傳輸層的核心協議,負責端到端的數據傳輸管理,如可靠性(TCP)、實時性(UDP)等。 2.下列哪種設備可以隔離 ARP 廣播幀? …

接口性能測試工具 - JMeter

1. 下載和運行JMeter 是由 Java 語言編寫的, 因此 JMeter 的使用依賴于 Java 環境 - JRE.前往 oracle 官網下載 JMeter 壓縮包.Mac 用戶解壓完成后, 在包內的 bin 目錄下運行 sh jmeter:Windows 用戶直接運行 bin 目錄下的 jmeter.bat:即可進入 JMeter 主頁面:1.1 添加環境變量…

Go語言實戰案例-數據庫事務處理

在實際業務中,很多操作需要保證 要么全部成功,要么全部失敗,否則可能造成數據不一致。比如:? 用戶轉賬(A 賬戶扣款,B 賬戶加款)? 下單支付(生成訂單、扣減庫存、記錄支付&#xff…

為何vivo做了頭顯,小米卻選擇AI眼鏡

在押注下一代智能終端這件事上,手機廠商為何步調不一致?文|游勇編|周路平在手機銷量和創新都陷入停滯的背景下,主流手機廠商正在探索下一代交互終端,試圖尋找新的增長點。今年6月,小米發布了AI眼…

Day24 目錄遍歷、雙向鏈表、棧

day24 目錄遍歷、雙向鏈表、棧顯示指定目錄下的所有 .h 文件 功能描述 遍歷指定目錄(遞歸進入子目錄),查找所有以 .h 為后綴的頭文件,將其完整路徑(路徑 文件名)存儲到雙向鏈表中,并正向或反向…

JupyterLab 安裝(python3.10)

目錄 一、環境 二、安裝 三、啟動Jupyterlab 四、通過chrome瀏覽器進行訪問 五、打開Jupyter Notebook 六、pandas驗證 JupyterLab 是一個基于 Web 的交互式開發環境,是經典 Jupyter Notebook 的下一代版本。它支持多種編程語言(如 Python、R、Juli…

【neo4j】安裝使用教程

一、安裝 1.0 前置條件 安裝配置好jdk17及以上 注意我使用的是neo4j 5.26.10版本,匹配java17剛好 Java Archive Downloads - Java SE 17.0.12 and earlier 無腦安裝即可 配置以下環境變量 1.1 安裝程序 Neo4j Deployment Center - Graph Database & Anal…

AECS(國標ECALL GB 45672-2025)

車載緊急呼叫功能作為車輛遇險時的響應機制,為司機和乘客的安全營救提供通信支持。為了能夠降低通信延遲,提高響應速度,基于4G/5G的下一代緊急呼叫技術(NG eCall)將在歐盟于2027年起成為強制標準,中國也已經…

week3-[循環嵌套]好數

week3-[循環嵌套]好數 題目描述 如果一個正整數 xxx 只有最左邊一位不是 000,其余都是 000,那么稱其為好數。例如 400040004000 和 222 都是好數,但是 120120120 不是。 給定正整數 nnn,在 111 到 nnn 間有多少個數是好數&#xf…

智能制造加速器:某新能源車智慧工廠無線網絡優化提升方案

隨著工業4.0和智能制造的快速發展,傳統制造工廠的網絡架構正面臨前所未有的挑戰。為了滿足柔性生產、實時數據驅動以及高可靠運營的需求,某新能源車智慧工廠啟動了一項無線網絡優化提升項目。本項目通過部署智能組網設備,構建高效、穩定、智能…

nginx-自制證書實現

nginx-自制證書實現一、 確認nginx是支持https功能的二、生成私鑰三、 根據ca.key生成nginx web服務器使用的證書簽名請求文件nginx.csr四、使用ca.key給nginx.csr進行簽名,生成公鑰證書nginx.crt五、將證書與域名綁定六、添加域名解析并訪問一、 確認nginx是支持ht…

FreeRTOS,事件標注組創建,xEventGroupCreate、xEventGroupCreateStatic

1. xEventGroupCreate ():動態創建(臨時借內存) 作用: 向系統(FreeRTOS 的堆內存)“臨時申請” 一塊內存來存放事件組,不需要我們自己提前準備內存。 例子(基于你的代碼修改&#xf…