大創項目推薦 醫學大數據分析 - 心血管疾病分析

文章目錄

  • 1 前言
  • 1 課題背景
  • 2 數據處理
  • 3 數據可視化
  • 4 最后

1 前言

🔥 優質競賽項目系列,今天要分享的是

🚩 基于大數據的心血管疾病分析

該項目較為新穎,適合作為競賽課題方向,學長非常推薦!

🥇學長這里給一個題目綜合評分(每項滿分5分)

  • 難度系數:3分
  • 工作量:3分
  • 創新點:4分

🧿 更多資料, 項目分享:

https://gitee.com/dancheng-senior/postgraduate

1 課題背景

本項目的任務是利用患者的檢查結果預測心血管疾病(CVD)的存在與否。

2 數據處理

數據集包括年齡、性別、收縮壓、舒張壓等12個特征的患者數據記錄7萬份。

當患者有心血管疾病時,目標類“cardio”等于1,如果患者健康,則為0。

數據描述

有三種類型的輸入特征:

  • Objective: 客觀事實;
  • Examination: 體檢檢查結果;
  • Subjective: 病人提供的信息

在這里插入圖片描述
數據信息概覽

?

import numpy as npimport pandas as pdimport seaborn as snsfrom matplotlib import pyplot as pltimport osdf.head()

在這里插入圖片描述
變量分析

?

df.info()

在這里插入圖片描述
所有特征都是數字,12個整數和1個小數(權值)。第二列告訴我們數據集有多大,每個字段有多少非空值。
我們可以使用’ describe() ‘來顯示每個屬性的樣本統計信息,比如’ min ‘、’ max ‘、’ mean ‘、’ std ':

評論

?

df.describe()

在這里插入圖片描述
年齡以天為單位,身高以厘米為單位。
讓我們看看數值變量以及它們是如何在目標類中分布的。
例如,什么年齡患有心血管疾病的人數超過沒有心血管疾病的人數?

3 數據可視化

?

from matplotlib import rcParams
rcParams['figure.figsize'] = 11, 8
df['years'] = (df['age'] / 365).round().astype('int')
sns.countplot(x='years', hue='cardio', data = df, palette="Set2");

在這里插入圖片描述
可以觀察到55歲以上的人更容易得心血管疾病的。
從上面的表格中,我們可以看到ap_hi, ap_lo, weight 和height中有異常值。我們以后再處理。

讓我們看看數據集中的分類變量及其分布:

?

df_categorical = df.loc[:,['cholesterol','gluc', 'smoke', 'alco', 'active']]
sns.countplot(x="variable", hue="value",data= pd.melt(df_categorical));

?

在這里插入圖片描述

?

df_long = pd.melt(df, id_vars=['cardio'], value_vars=['cholesterol','gluc', 'smoke', 'alco', 'active'])
sns.catplot(x="variable", hue="value", col="cardio",data=df_long, kind="count");

在這里插入圖片描述
可以清楚地看到,CVD患者的膽固醇和血糖水平較高。而且一般來說不太活躍,運動少。

為了計算“1”在性別欄中代表女性還是男性,讓我們計算每個性別的身高平均值。我們假設男人平均比女人高。

?

corr = df.corr()
cmap = sns.diverging_palette(220, 10, as_cmap=True)
mask = np.zeros_like(corr, dtype=np.bool)
mask[np.triu_indices_from(mask)] = True# 設置matplotlib圖
f, ax = plt.subplots(figsize=(11, 9))
# 畫出熱圖,并校正長寬比
sns.heatmap(corr, mask=mask, cmap=cmap, vmax=.3, center=0,annot = True,square=True, linewidths=.5, cbar_kws={"shrink": .5});

在這里插入圖片描述
我們可以看到年齡和膽固醇有顯著的影響,但與目標階層的相關性不是很高。

.
讓我們創建violinplot來顯示不同性別的身高分布。

查看每個性別特征值的身高和體重的平均值可能不足以決定1是男性還是女性。

?

import warnings
warnings.filterwarnings("ignore")
df_melt = pd.melt(frame=df, value_vars=['height'], id_vars=['gender'])
plt.figure(figsize=(12, 10))
ax = sns.violinplot(x='variable', y='value', hue='gender', split=True, data=df_melt, scale='count',scale_hue=False,palette="Set2");

在這里插入圖片描述
讓我們創造一個新的特征-身體質量指數(BMI):

在這里插入圖片描述
比較健康人的平均BMI和病人的平均BMI。正常的BMI值在18.5到25之間。

?

df['BMI'] = df['weight']/((df['height']/100)**2)
sns.catplot(x="gender", y="BMI", hue="alco", col="cardio", data=df, color = "yellow",kind="box", height=10, aspect=.7);

在這里插入圖片描述
根據女性的BMI,喝酒的女性比喝酒的男性有更高的心血管疾病風險。

4 最后

🧿 更多資料, 項目分享:

https://gitee.com/dancheng-senior/postgraduate

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/207572.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/207572.shtml
英文地址,請注明出處:http://en.pswp.cn/news/207572.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

給Flask加上百度翻譯功能,這樣可以用中文進行搜索了

上一篇博客:Flask之手搓bootstrap翻頁-CSDN博客 里,對 OMDb API - The Open Movie Database 的搜索,只能使用英文,才能搜索出電影信息,如果使用中文,是搜索不到結果的。這里就需要使用翻譯,把中…

剪映最新版的4.9,主要更新的功能(于2023年12月2日發布)

新增“多軌道音頻”功能:用戶可以將多個音頻軌道疊加在一起,并對每個音頻軌道進行單獨的編輯。這使得用戶可以更靈活地控制視頻的音頻效果。新增“音頻調音”功能:用戶可以使用音頻調音功能對視頻的音頻進行調節,包括音量、音調、…

QString::arg()函數用法(數字前補零)

QString中的arg方法類似于 (1)“C中的printf中使用的格式輸出符”和 (2)“C中string的append方法”的結合體。 常用的兩種格式如下: 1. 用于填充字符串中的%1,%2…為給定的參數。 //原型: QString QString::arg(const QString & a1) &#xff08…

多功能智能遙測終端機 5G/4G+北斗多信道 視頻采集傳輸

計訊物聯多功能智能遙測終端機,全網通5G/4G無線通信、弱信號地區北斗通信,多信道自動切換保障通信聯通,豐富網絡接口及行業應用接口,支持水利、環保、工業傳感器、控制終端、智能終端接入,模擬量/數字量/信號量采集&am…

camera2對攝像頭編碼h264

MediaCodec編碼攝像頭數據 前置:保存的一些成員變量 // 攝像頭開啟的 handler private Handler cameraHandler; // Camera session 會話 handler private Handler sessionHandler; //這里是個Context都行 private AppCompatActivity mActivity; // 這個攝像頭所有需…

深入理解 Python 中的 eval 函數

更多資料獲取 📚 個人網站:ipengtao.com eval 是 Python 中一個強大而靈活的函數,它允許將字符串作為代碼執行。然而,由于其潛在的安全風險,使用時需要謹慎。本文將深入探討 eval 函數的各個方面,包括基本…

delphi/python 實現小紅書xhs用戶作品列表和圖片/視頻無水印解析

技術學習,請勿用與非法用途!!! 成品圖用戶作品列表接口 /api/sns/web/v1/user_posted?num30&cursor&user_id642bf0850000000011022c4e&image_scenes http Get方式,請求頭需要帶上x-s x-t簽名驗證筆記明細…

直流負載箱的技術發展趨勢和創新有哪些?

直流負載箱廣泛應用于電子、通信、航空航天等領域,隨著科技的不斷發展,直流負載箱也在不斷創新和改進,直流負載箱在負載電流和電壓的測量方面要求高精度和高穩定性。未來的發展趨勢是提高負載箱的測量精度和穩定性,以滿足更高要求…

記錄一些好的文章

高效編寫可維護代碼: 如何高效編寫可維護代碼? | 菜鳥教程 (runoob.com)

計算平均分并輸出低于平均分的學生成績

從鍵盤上輸入若干&#xff08;<20&#xff09;個學生的成績&#xff0c;統計計算出平均成績&#xff0c;并輸出低于平均分的學生成績&#xff0c;用輸入負數結束輸入。 輸入格式: 在一行中輸入若干&#xff08;<20&#xff09;個學生的實型成績&#xff0c;用輸入負數結…

uniapp 使用 $emit和$on——$on中無法為data中的變量賦值

問題在于this的指向&#xff0c; 解決辦法是使用變量保存$on&#xff0c;其次再為data中的值賦值 以下是具體代碼&#xff1a; 1、html代碼&#xff1a; <view class"form_picker" click"selePositionFun()"><view class""><inp…

Git

第1章 Git 概述 Git 是一個免費的、開源的分布式版本控制系統&#xff0c;可以快速高效地處理從小型到大型的各種項目。 Git 易于學習&#xff0c;占地面積小&#xff0c;性能極快。 它具有廉價的本地庫&#xff0c;方便的暫存區域和多個工作流分支等特性。其性能優于 Subversi…

系統設計之數據庫

為您的項目選擇正確的數據庫是一項復雜的任務。許多數據庫選項都適合不同的用例&#xff0c;很快就會導致決策疲勞。 我們希望這份備忘單提供高級指導&#xff0c;以找到符合您項目需求的正確服務并避免潛在的陷阱。 注意&#xff1a;Google 關于其數據庫用例的文檔有限。盡管…

軟件測試卷王的自述,我難道真的很卷?

前言 前段時間去面試了一個公司&#xff0c;成功拿到了offer&#xff0c;薪資也從12k漲到了18k&#xff0c;對于工作都還沒兩年的我來說&#xff0c;還是比較滿意的&#xff0c;畢竟一些工作3、4年的可能還沒我高。 我可能就是大家說的卷王&#xff0c;感覺自己年輕&#xff…

北郵22級信通院數電:Verilog-FPGA(12)第十二周實驗(2)彩虹呼吸燈(bug已解決 更新至3.0)

北郵22信通一枚~ 跟隨課程進度更新北郵信通院數字系統設計的筆記、代碼和文章 持續關注作者 迎接數電實驗學習~ 獲取更多文章&#xff0c;請訪問專欄&#xff1a; 北郵22級信通院數電實驗_青山如墨雨如畫的博客-CSDN博客 目錄 一.代碼部分 1.1一些更新和講解 1.2改正后的…

解密HubSpot CMS Hub:構建引人入勝的企業網站!

在數字化時代&#xff0c;網站是企業與客戶互動的重要窗口。為了在競爭激烈的市場中脫穎而出&#xff0c;企業需要一個現代化、用戶友好且高度可定制的網站。而HubSpot CMS Hub作為一款領先的內容管理系統&#xff0c;為企業提供了獨特的優勢&#xff0c;讓網站建設變得更加輕松…

Private Set Intersection from Pseudorandom CorrelationGenerators 最快PSI!導覽解讀

目錄 一、概述 二、相關介紹 三、性能對比 四、技術細節 1.KKRT 2.Pseudorandom Correlation Generators 3.A New sVOLE-Based BaRK-OPRF 4.BaRK-OPRF 五、總結 參考文獻 一、概述 這篇文章的主要脈絡和核心思想是探討如何利用偽隨機相關生成器&#xff08;PCG&#…

【AI】以大廠PaaS為例,看人工智能技術方案服務能力的方向(2/2)

目錄 三、解決方案 3.1 人臉身份驗證 3.2 圖像審核&#xff08;暴恐、色情等&#xff09; 3.3 人臉會場簽到 3.4 機器人視覺 3.5 視頻審核 3.6 電商圖文詳情生成 3.7 智能客服 接上回&#xff1a; 【AI】以大廠PaaS為例&#xff0c;看人工智能技術方案服務能力的方向&…

Mybatis實用教程之XML實現動態sql

系列文章目錄 1、mybatis簡介及數據庫連接池 2、mybatis中selectOne的使用 3、mybatis簡單使用 4、mybatis中resultMap結果集的使用 Mybatis實用教程之XML實現動態sql 系列文章目錄前言1. 動態條件查詢2. 動態更新語句3. 動態插入語句4、其他標簽的使用 前言 當編寫 MyBatis 中…

力扣labuladong——一刷day67

提示&#xff1a;文章寫完后&#xff0c;目錄可以自動生成&#xff0c;如何生成可參考右邊的幫助文檔 文章目錄 前言一、力扣582.殺掉進程二、力扣536.從字符串生成二叉樹 前言 二叉樹的遞歸分為「遍歷」和「分解問題」兩種思維模式&#xff0c;這道題需要用到「遍歷」的思維模…