競賽選題 醫學大數據分析 - 心血管疾病分析

文章目錄

  • 1 前言
  • 1 課題背景
  • 2 數據處理
  • 3 數據可視化
  • 4 最后

1 前言

🔥 優質競賽項目系列,今天要分享的是

🚩 基于大數據的心血管疾病分析

該項目較為新穎,適合作為競賽課題方向,學長非常推薦!

🥇學長這里給一個題目綜合評分(每項滿分5分)

  • 難度系數:3分
  • 工作量:3分
  • 創新點:4分

🧿 更多資料, 項目分享:

https://gitee.com/dancheng-senior/postgraduate

1 課題背景

本項目的任務是利用患者的檢查結果預測心血管疾病(CVD)的存在與否。

2 數據處理

數據集包括年齡、性別、收縮壓、舒張壓等12個特征的患者數據記錄7萬份。

當患者有心血管疾病時,目標類“cardio”等于1,如果患者健康,則為0。

數據描述

有三種類型的輸入特征:

  • Objective: 客觀事實;
  • Examination: 體檢檢查結果;
  • Subjective: 病人提供的信息

在這里插入圖片描述
數據信息概覽

?

import numpy as npimport pandas as pdimport seaborn as snsfrom matplotlib import pyplot as pltimport osdf.head()

在這里插入圖片描述
變量分析

?

df.info()

在這里插入圖片描述
所有特征都是數字,12個整數和1個小數(權值)。第二列告訴我們數據集有多大,每個字段有多少非空值。
我們可以使用’ describe() ‘來顯示每個屬性的樣本統計信息,比如’ min ‘、’ max ‘、’ mean ‘、’ std ':

評論

?

df.describe()

在這里插入圖片描述
年齡以天為單位,身高以厘米為單位。
讓我們看看數值變量以及它們是如何在目標類中分布的。
例如,什么年齡患有心血管疾病的人數超過沒有心血管疾病的人數?

3 數據可視化

?

from matplotlib import rcParams
rcParams['figure.figsize'] = 11, 8
df['years'] = (df['age'] / 365).round().astype('int')
sns.countplot(x='years', hue='cardio', data = df, palette="Set2");

在這里插入圖片描述
可以觀察到55歲以上的人更容易得心血管疾病的。
從上面的表格中,我們可以看到ap_hi, ap_lo, weight 和height中有異常值。我們以后再處理。

讓我們看看數據集中的分類變量及其分布:

?

df_categorical = df.loc[:,['cholesterol','gluc', 'smoke', 'alco', 'active']]
sns.countplot(x="variable", hue="value",data= pd.melt(df_categorical));

?

在這里插入圖片描述

?

df_long = pd.melt(df, id_vars=['cardio'], value_vars=['cholesterol','gluc', 'smoke', 'alco', 'active'])
sns.catplot(x="variable", hue="value", col="cardio",data=df_long, kind="count");

在這里插入圖片描述
可以清楚地看到,CVD患者的膽固醇和血糖水平較高。而且一般來說不太活躍,運動少。

為了計算“1”在性別欄中代表女性還是男性,讓我們計算每個性別的身高平均值。我們假設男人平均比女人高。

?

corr = df.corr()
cmap = sns.diverging_palette(220, 10, as_cmap=True)
mask = np.zeros_like(corr, dtype=np.bool)
mask[np.triu_indices_from(mask)] = True# 設置matplotlib圖
f, ax = plt.subplots(figsize=(11, 9))
# 畫出熱圖,并校正長寬比
sns.heatmap(corr, mask=mask, cmap=cmap, vmax=.3, center=0,annot = True,square=True, linewidths=.5, cbar_kws={"shrink": .5});

在這里插入圖片描述
我們可以看到年齡和膽固醇有顯著的影響,但與目標階層的相關性不是很高。

.
讓我們創建violinplot來顯示不同性別的身高分布。

查看每個性別特征值的身高和體重的平均值可能不足以決定1是男性還是女性。

?

import warnings
warnings.filterwarnings("ignore")
df_melt = pd.melt(frame=df, value_vars=['height'], id_vars=['gender'])
plt.figure(figsize=(12, 10))
ax = sns.violinplot(x='variable', y='value', hue='gender', split=True, data=df_melt, scale='count',scale_hue=False,palette="Set2");

在這里插入圖片描述
讓我們創造一個新的特征-身體質量指數(BMI):

在這里插入圖片描述
比較健康人的平均BMI和病人的平均BMI。正常的BMI值在18.5到25之間。

?

df['BMI'] = df['weight']/((df['height']/100)**2)
sns.catplot(x="gender", y="BMI", hue="alco", col="cardio", data=df, color = "yellow",kind="box", height=10, aspect=.7);

在這里插入圖片描述
根據女性的BMI,喝酒的女性比喝酒的男性有更高的心血管疾病風險。

4 最后

🧿 更多資料, 項目分享:

https://gitee.com/dancheng-senior/postgraduate

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/40384.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/40384.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/40384.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

AI繪畫Stable Diffusion 解鎖精美壁紙創作:利用SD與LLM定制你的專屬壁紙,AI副業變現指南!

大家好,我是畫畫的小強 今天給大家分享一下用AI繪畫Stable Diffusion 制作精美手機壁紙,這也可能是當前最快AIGC變現的一種途徑。雖然本文的主題為手機壁紙,當調整不同的比例的分辨率寬高比例,就可以直接復用到手機、電腦和平板、…

旋轉和鏡像的關系

旋轉矩陣行列式與 在E(3)三維空間中,旋轉矩陣的行列式可以用來判斷該旋轉是否包含鏡像變換。 行列式為正: 表示純旋轉,不包含鏡像。 旋轉矩陣保持向量的長度和角度不變,只是改變向量的方向。 行列式為負: 表示旋轉…

機器學習原理之 -- 支持向量機分類:由來及原理詳解

支持向量機(Support Vector Machine, SVM)是統計學習理論的一個重要成果,廣泛應用于分類和回歸問題。SVM以其高效的分類性能和良好的泛化能力在機器學習領域中占據重要地位。本文將詳細介紹支持向量機的由來、基本原理、構建過程及其優缺點。…

LVS負載均衡群集部署之——DR模式的介紹及搭建步驟

一、LVS-DR集群介紹1.1 LVS-DR 工作原理1.2 數據包流向分析1.3 LVS-DR 模式的特點1.4 LVS-DR中的ARP問題1.4.1 問題一1.4.2 問題二二、構建LVS-DR集群2.1 構建LVS-DR集群的步驟(理論)1.配置負載調度器(192.168.80.30)(…

5分鐘教你用AI把老照片動起來,別再去花49塊9的冤枉錢了

文章目錄 需要的工具 最近,AI視頻在各大平臺上,又火了。 只是火的形式,變成了將老照片動起來,打情感牌,或者做很多經典電視劇的再整活。 直接把可靈的生成時間,從以前的4分鐘,生生的干成了20分鐘…

鴻蒙應用筆記

安裝就跳過了,一直點點就可以了 配置跳過,就自動下了點東西。 鴻蒙那個下載要12g個內存,大的有點嚇人。 里面跟idea沒區別 模擬器或者真機運行 真機要鴻蒙4.0,就可以實機調試 直接在手機里面跑,這個牛逼&#xf…

國標GB/T 28181詳解:國標GBT28181-2022 SIP服務器發起廣播的命令流程

目錄 一、定義 二、作用 1、實現信息的集中管理和分發 (1)信息集中 (2)信息分發 2、提高信息傳輸的可靠性和效率 (1)可靠性 (2)提高效率 3、支持多種設備和系統的互通 &am…

mongdb學習與使用

1. 基礎概念 MongoDB簡介: MongoDB是一個基于文檔的NoSQL數據庫,具有高性能、高可用性和易擴展性。數據存儲在類似JSON的BSON格式中。 基本術語: Database(數據庫): 集合的容器。Collection(集合…

國產強大免費WAF, 社區版雷池動態防護介紹

雷池WAF,基于智能語義分析的下一代 Web 應用防火墻 使用情況 我司于2023年4月23日對雷池進行測試,測試一個月后,于2023年5月24日對雷池進行正式切換,此時版本為1.5.1。 里程碑紀念 后續一直跟隨雷池進行版本升級,當前…

QT_GUI

1、QT安裝 一個跨平臺的應用程序和用戶界面框架,用于開發圖形用戶界面(GUI)應用程序以及命令行工具。QT有商業版額免費開源版,一般使用免費開源版即可,下面安裝的是QT5,因為出來較早,使用較多&…

Python特征工程 — 1.4 特征歸一化方法詳解

目錄 1 Min-Max歸一化 方法1:自定義的Min-Max歸一化封裝函數 方法2: scikit-learn庫中的MinMaxScaler 2 Z-score歸一化 方法1:自定義的Z-score歸一化封裝函數 方法2: scikit-learn庫中的StandardScaler 3 最大值歸一化 4 L…

考研生活day1--王道課后習題2.2.1、2.2.2、2.2.3

2.2.1 題目描述: 解題思路: 這是最基礎的操作,思路大家應該都有,缺少的應該是如何下筆,很多同學都是有思路但是不知道如何下筆,這時候看思路的意義不大,可以直接看答案怎么寫,最好…

Java項目:基于SSM框架實現的游戲攻略網站系統分前后臺【ssm+B/S架構+源碼+數據庫+畢業論文+任務書】

一、項目簡介 本項目是一套基于SSM框架實現的游戲攻略網站系統 包含:項目源碼、數據庫腳本等,該項目附帶全部源碼可作為畢設使用。 項目都經過嚴格調試,eclipse或者idea 確保可以運行! 該系統功能完善、界面美觀、操作簡單、功能…

redhat7.x 升級openssh至openssh-9.8p1

1.環境準備: OS系統:redhat 7.4 2.備份配置文件: cp -rf /etc/ssh /etc/ssh.bak cp -rf /usr/bin/openssl /usr/bin/openssl.bak cp -rf /etc/pam.d /etc/pam.d.bak cp -rf /usr/lib/systemd/system /usr/lib/systemd/system.bak 3.安裝…

UB9A0全系統全頻高精度板卡性能指標

UB9A0 板卡是基于和芯星通自主研發的新一代射頻基帶及高精度算法一體化 GNSS SoC 芯片—Nebulas Ⅳ開發的全系統全頻點高精 OEM 板卡 ,支持 BDS,GPS, GLONASS,Galileo,QZSS,NavIC,SBAS&#xff…

linux c 應用編程定時器函數

在 Linux C 應用編程中,對于多線程編程中的定時器函數使用,通常可以借助 pthread 庫和系統提供的定時器相關的函數來實現。 首先,常見的定時器函數有 setitimer() 和 alarm() 。setitimer() 函數可以更精確地設置定時器,它可以設…

JAVA學習-練習試用Java實現“螺旋矩陣 II”

問題: 給定一個正整數 n ,生成一個包含 1 到 n2 所有元素,且元素按順時針順序螺旋排列的 n x n 正方形矩陣 matrix 。 示例 1: 輸入:n 3 輸出:[[1,2,3],[8,9,4],[7,6,5]] 示例 2: 輸入&…

C++標準模板(STL)- 迭代器庫 - 流迭代器- 寫入 std::basic_streambuf 的輸出迭代器(二)

迭代器庫-流迭代器 迭代器庫提供了五種迭代器的定義,同時還提供了迭代器特征、適配器及相關的工具函數。 迭代器分類 迭代器共有五 (C17 前)六 (C17 起)種:遺留輸入迭代器 (LegacyInputIterator) 、遺留輸出迭代器 (LegacyOutputIterator) 、遺留向前迭代…

MySQL環境搭配

下載版本37滴 下載第二個 之后進行安裝 進入安裝界面 next 選擇默認的 進行下一步 安裝成功后,進行一系列配置,成功界面如下: 配置 MySQL8.0 環境變量 如果不配置 MySQL 環境變量,就不能在命令行直接輸入 MySQL 登錄命令。 步…

強烈推薦!12 組超驚艷的 Midjourney 風格提示詞!

前言 Midjourney 的 --sref random 隨機風格功能推出之后,出現了很多對不同代碼生成效果的探索。今天就為大家推薦 12 組我覺得非常驚艷的風格代碼,將它們添加在提示詞中,不需要寫復雜的關鍵詞就能得到高質量的指定風格,并且效果…