2025年泰迪杯數據挖掘競賽B題論文首發+問題一二三四代碼分享

圖片

基于穿戴裝備的身體活動監測

摘要

隨著科技的進步,加速度計,能夠實時、準確地捕捉人體的動態變化,成為醫學應用中的一個重要工具。本文將基于題目收集數據進行相關研究。

針對題目給出的數據集,我們首先進行數據清洗工作。首先利用df[df.isna().any(axis=1)]篩選含缺失值的行,并對所在行進行刪除處理。對于處理后的結果,我們利用通過文獻查詢的理論存在極值,設定閾值進行異常值判定并刪除其所在行。

針對問題一,單一利用時間差計算持續時間消耗資源太大,這里通過分析數據可以看出數據的采樣率為100 Hz。因此,我們對最后MET值中不同類型進行計頻處理。根據頻數推算持續各狀態的持續時間。

針對問題二,將處理后的數據集,進行合并為一個完整的數據集作為訓練數據集,性別?(Sex)和年齡(Age)為類別變量,加速度計數據作為輸入數據,MET值作為輸出數據,引入隨機森林回歸器、隨機森林、支持向量機、多層感知機、GBDT進行訓練模型,并利用RMSE對模型精度進行評估。則取精度最高的模型進行預測。基于得到的結果利用問題二中頻數方式計算持續時長。

對于問題三,基于可穿戴設備采集的加速度計數據,旨在對個體睡眠狀態進行階段性識別。將所有數據進行匯總,并從中篩選出MET<1.0的數值,保證選取的數據集中包含與睡眠相關的測量。聚類模型對個體睡眠階段進行智能識別,利用肘部法則自動尋優。構建智能識別模型,并進行應用。

針對問題四,基于加速度計數據的久坐行為健康預警方法。以附件2中志愿者加速度計數據作為輸入,其中每條記錄包含時間戳和經預測得到的MET值(MET_Pred)。通過計算相鄰記錄預測值的變化量來劃分“段”(segment)。設置為排除短時的靜止狀態,僅考慮持續超過30分鐘的行為段;久坐狀態對應的MET值區間設定為[1.0,1.6]。并提取時域特征對于每個志愿者數據集,依照上述分段和久坐判定規則,識別出所有符合條件的連續久坐段。

關鍵詞:近地小行星軌道預測、開普勒定律、最小二乘法、

5.1?數據預處理

針對題目給出的數據集,我們首先進行數據清洗工作。首先利用df[df.isna().any(axis=1)]篩選含缺失值的行,并對所在行進行刪除處理。對于處理后的結果,我們利用通過文獻查詢的理論存在極值,設定閾值進行異常值判定并刪除其所在行。


5.1.1?描述性分析

首先,我們利用給出的數據,進行給出數據特征的初步選擇。

圖片

從圖表來看,X、Y和Z軸的波動程度有所不同,這可能與志愿者在該時段進行的不同活動類型相關。例如,較大的波動通常意味著較為劇烈的運動,而較小的波動則可能表明志愿者處于較為靜止的狀態。

5.1.2?缺失值處理

在本研究中,我們利用可穿戴設備采集的加速度計數據,旨在實現對個體運動狀態的實時監測和后續健康行為分析。原始數據存儲于CSV格式文件中,其中記錄了時間戳和對應的三軸加速度值(X,Y,Z軸),這些數據反映了個體在空間中各個方向上的加速度信息。為保證數據處理的準確性和后續模型的魯棒性,首先對數據進行預處理。預處理主要包括:

1.缺失值檢查與清洗
由于實際采集過程中可能存在數據丟失或異常情況,通過統計每個變量(time,?)的缺失值個數,確定數據中存在缺失的記錄。對于出現缺失值的行,采用剔除策略確保分析數據均為有效觀測值。數學上,經過缺失值處理的數據集記為

圖片

2.數據采樣
考慮到連續采集的數據樣本量巨大,為了降低可視化繪圖與后續數據分析的計算成本,在保證數據整體趨勢不丟失的前提下,采取均勻采樣策略。具體方法為每隔固定步長(例如每100個樣本取一個數據點),構造采樣數據集:

圖片

5.1.3?異常值處理

閾值處理:查閱文獻,找到理論存在X Y Z方向加速度最大值,將該值設定為閾值超過該數據的認定為異常數據,方便起見直接刪除處理。

傳感器量程

最大可記錄加速度(每軸)

±2g

約?±2 × 9.8 = ±19.6 m/s2

±4g

約?±4 × 9.8 = ±39.2 m/s2

±8g

約?±8 × 9.8 = ±78.4 m/s2

±16g

約?±16 × 9.8 = ±156.8 m/s2

理論上,根據牛頓第二定律以及地球重力加速度的參考值,常見的加速度值應落于合理范圍內。在本研究中,將?
?作為加速度的理論上界(約為?2 倍標準重力加速度,即?),以此為閾值檢測異常數據。對于任一數據點,當任一方向上的加速度滿足:

5.2?統計分析模型

對于問題一,單一利用時間差計算持續時間消耗資源太大,這里通過分析數據可以看出數據的采樣率為100 Hz。因此,我們對最后MET值中不同類型進行計頻處理。根據頻數推算持續各狀態的持續時間。

5.2.1?活動時長計量

針對每個志愿者(標識為P001至P100)的數據文件,本研究首先利用數據讀取工具導入CSV數據,其中至少包含一個描述活動類型的"annotation"列。借助正則表達式提取每條記錄中的MET數值,確保后續分類操作的準確性。

在分析過程中,將每個活動注解的出現頻次視為該活動持續的時間片段。假定數據的采樣率為?100 Hz ,即每 100 個連續記錄視為 1 秒內的采樣(或換算后為固定的時間長度),從而每個活動類型的頻次累計可用于估算總持續時間。用數學表達式表示,若設對某一特定活動類型?
?的出現次數為?
?,則活動持續時間(單位為秒)為:

圖片

類型名稱

出現次數

7030 sleeping;MET 0.95

3810002?次

home activity;eating;13030 eating sitting alone or with someone;MET 1.5

74004?次

home activity;household chores;preparing meals/cooking/washing dishes;5035 kitchen activity general cooking/washing/dishes/cleaning up;MET 3.3

954511?次

home activity;miscellaneous;sitting;11580 office work such as writing and typing (with or without eating at the same time);MET 1.5

144105?次

home activity;miscellaneous;sitting;9055 sitting/lying talking in person/using a mobile phone/smartphone/tablet or talking on the phone/computer (skype chatting);MET 1.5

308709?次

home activity;miscellaneous;sitting;9060 sitting/lying reading or without observable/identifiable activities;MET 1.3

338112?次

home activity;miscellaneous;standing;9050 standing talking in person on the phone/computer (skype chatting) or using a mobileo phone/smartphone/tablet;MET 1.8

7501?次

home activity;miscellaneous;standing;9050 standing talking in person/on the phone/computer (skype chatting) or using a mobile phone/smartphone/tablet;MET 1.8

49103?次

ID

TotalTime

SleepTime

HighIntensityTime

ModerateIntensityTime

LowIntensityTime

StaticActivityTime

P001

24.7159

10.5833

0

3.7303

3.0009

7.4013

P002

16.1406

6.25

0.3567

1.1702

1.8108

6.5529

P003

20.5242

6.6667

0

6.7723

2.7376

4.3476

P004

18.9362

6.5

0

2.5809

3.1359

6.7194

P005

17.0661

4.3333

0

1.8884

3.9005

6.9439

圖片

可以直觀地看出各個受試者或各個時間段之間的MET差異。下方的柱狀圖則展示了不同強度運動時長的對比情況,橙色、紅色、藍色等不同顏色柱狀分別代表高強度、中強度、低強度、靜態或睡眠等類別,由此可以觀察每個受試者或不同時間段內各活動類型所占用的時間比例,

5.3?MET?值估計模型

將處理后的數據集,進行合并為一個完整的數據集作為訓練數據集,性別?(Sex)和年齡(Age)為類別變量,加速度計數據作為輸入數據,MET值作為輸出數據,引入隨機森林回歸器、隨機森林、支持向量機、多層感知機、GBDT進行訓練模型,并利用RMSE對模型精度進行評估。則取精度最高的模型進行預測。基于得到的結果利用問題二中頻數方式計算持續時長。

圖片

圖片

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/77203.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/77203.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/77203.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

國內AI搜索平臺與ChatGPT橫向對比分析

一、核心技術差異 1、?百度文小言? 基于文心大模型4.0升級&#xff0c;主打“新搜索”能力&#xff0c;支持多模態輸入&#xff08;語音、圖片、視頻&#xff09;和富媒體搜索結果?。 獨有的“記憶個性化”功能可結合用戶歷史行為優化回答&#xff0c;并在醫療、教育等垂直…

安卓環境搭建開發工具下載Gradle下載

1.安裝jdk(使用java語言開發安卓app) 核心庫 java.lang java.util java.sq; java.io 2.安裝開發工具(IDE)android studio https://r3---sn-2x3elnel.gvt1-cn.com/edgedl/android/studio/install/2023.3.1.18/android-studio-2023.3.1.18-windows.exe下載完成后一步一步安裝即…

Python 趣味學習 -數據類型脫口秀速記公式 [特殊字符]

&#x1f3a4; Python數據類型脫口秀速記公式 &#x1f40d; 1?? 四大金剛登場 "Set叔(無序潔癖)、Tuple爺(頑固老頭)、List姐(百變女王)、Dict哥(萬能鑰匙)"2?? 特性對比RAP &#x1f3b6; 內存/作用域&#xff1a; 全局變量 → 函數內修改 → 可變(mutable)會…

單片機 | 基于51單片機的傾角測量系統設計

以下是一個基于51單片機的傾角測量系統設計詳解,包含原理、公式和完整代碼: 一、系統原理 核心器件:MPU6050(集成3軸加速度計+陀螺儀) 主控芯片:STC89C52RC(51單片機) 顯示模塊:LCD1602液晶 工作原理: 通過MPU6050采集XYZ三軸加速度數據,利用重力加速度分量計算俯仰…

2025年4月16日華為留學生筆試第二題200分

?? 點擊直達筆試專欄 ??《大廠筆試突圍》 ?? 春秋招筆試突圍在線OJ ?? 筆試突圍OJ 02. 圖書館借閱管理系統 問題描述 盧小姐是一家大學圖書館的管理員,她需要開發一個簡單的圖書借閱管理系統來處理日常的圖書流通操作。系統需要支持以下四種操作: in s:表示一本…

Linux通用一鍵換源腳本.sh - ubuntu、centos全自動更換國內源 - LinuxMirrors神器

效果 腳本 bash <(curl -sSL https://linuxmirrors.cn/main.sh) 來自 https://linuxmirrors.cn/ 截圖 ending...

【Unity】JSON數據的存取

這段代碼的結構是為了實現 數據的封裝和管理&#xff0c;特別是在 Unity 中保存和加載玩家數據時。以下是對代碼設計的逐步解釋&#xff1a; 1. PlayerCoin 類 PlayerCoin 是一個簡單的數據類&#xff0c;用于表示單個玩家的硬幣信息。它包含以下字段&#xff1a; count&…

python實現音視頻下載器

一、環境準備 確保當前系統已安裝了wxPython 、 yt-dlp 和FFmpeg。當前主要支持下載youtube音視頻 1、安裝wxPython pip install wxPython2、安裝yt-dp pip install wxPython yt-dlp3、安裝FFmpeg 在Windows 10上通過命令行安裝FFmpeg&#xff0c;最簡便的方式是使用包管理…

使用 vxe-table 來格式化任意的金額格式,支持導出與復制單元格格式到 excel

使用 vxe-table 來格式化任意的金額格式&#xff0c;支持導出與復制單元格格式到 excel 查看官網&#xff1a;https://vxetable.cn gitbub&#xff1a;https://github.com/x-extends/vxe-table gitee&#xff1a;https://gitee.com/x-extends/vxe-table 安裝 npm install vx…

知識圖譜 數據準備

任何類型的數據格式都可以用于構建知識圖譜&#xff0c;只要能夠從中提取出實體&#xff08;Entities&#xff09;、關系&#xff08;Relationships&#xff09;和屬性&#xff08;Attributes&#xff09;。但實際操作中&#xff0c;不同數據格式的處理難度、工具支持和效率差異…

Docker 設置鏡像源后仍無法拉取鏡像問題排查

#記錄工作 Windows系統 在使用 Docker 的過程中&#xff0c;許多用戶會碰到設置了國內鏡像源后&#xff0c;依舊無法拉取鏡像的情況。接下來&#xff0c;記錄了操作要點以及問題排查方法&#xff0c;幫助我們順利解決這類問題。 Microsoft Windows [Version 10.0.27823.1000…

如何對Flutter應用程序進行單元測試

Flutter單元測試完全指南&#xff1a;從基礎到高級實踐 面試求職資源 面試試題小程序&#xff1a;涵蓋測試基礎、Linux操作系統、MySQL數據庫、Web功能測試、接口測試、APPium移動端測試、Python知識、Selenium自動化測試相關、性能測試、計算機網絡知識、Jmeter、HR面試等內…

go中我遇到的問題總結

go問題總結 1 - go中的nil等于java中的null嗎 在 Go 和 Java 中,nil 和 null 都用于表示“空值”,但它們的實現和使用方式有所不同。 以下是 Go 中的 nil 和 Java 中的 null 之間的對比: 1. Go 中的 nil 在 Go 中,nil 是一個預定義的常量,表示零值。它的行為根據數據類…

【android telecom 框架分析 01】【基本介紹 2】【BluetoothPhoneService為何沒有源碼實現】

1. 背景 我們會在很多資料上看到 BluetoothPhoneService 類&#xff0c;但是我們在實際 aosp 中確找不到具體的實現&#xff0c; 這是為何&#xff1f; 這是一個很好的問題&#xff01;雖然在車載藍牙電話場景中我們經常提到類似 BluetoothPhoneService 的概念&#xff0c;但…

微機控制電液伺服汽車減震器動態試驗系統

微機控制電液伺服汽車減震器動態試驗系統&#xff0c;用于對汽車筒式減震器、減震器臺架、駕駛室減震裝置、發動機懸置軟墊總成、發動機前置楔形支撐總成等的示功圖試驗、速度特性試驗。 主要的技術參數&#xff1a; 1、最大試驗力&#xff1a;5kN&#xff1b; 2、試驗力測量精…

STM32+dht11+rc522+jq8400的簡單使用

1.dht11的使用 硬件&#xff1a;3v3&#xff0c;gnd&#xff0c;data數據線接一個gpio&#xff0c;三根線即可 軟件&#xff1a; ①dht11.c #include "dht11.h" #include "delay.h" #include "stdbool.h"static STRUCT_DHT11_TYPEDEF dht11;…

AOSP的Doze模式-DeepIdle 初識

前言 從Android 6.0開始&#xff0c;谷歌引入了Doze模式(打盹模式)的省電技術延長電池使用時間。如果用戶長時間未使用設備&#xff0c;低電耗模式會延遲應用后臺 CPU 和網絡活動&#xff0c;從而延長電池續航時間。根據第三方測試顯示&#xff0c;兩臺同樣的Nexus 5&#xff…

用Python Pandas高效操作數據庫:從查詢到寫入的完整指南

一、環境準備與數據庫連接 1.1 安裝依賴庫 pip install pandas sqlalchemy psycopg2 # PostgreSQL # 或 pip install pandas sqlalchemy pymysql # MySQL # 或 pip install pandas sqlalchemy # SQLite 1.2 創建數據庫引擎 通過SQLAlchemy創建統一接口&#xff1a…

每日一題(小白)暴力娛樂篇31

首先分析一下題意&#xff0c;需要求出2024的因子&#xff0c;因為我們要求與2024互質的數字&#xff0c;為什么呢&#xff1f;因為我們要求互質說直白點就是我和你兩個人沒有中間人&#xff0c;我們是自然而然認識的&#xff0c;那我們怎么認識呢&#xff0c;就是直接見面對吧…

電控---printf重定向輸出

在嵌入式系統開發中&#xff0c;printf 重定向輸出是將標準輸出&#xff08;stdout&#xff09;從默認設備&#xff08;如主機終端&#xff09;重新映射到嵌入式設備的特定硬件接口&#xff08;如串口、LCD、USB等&#xff09;的過程。 一、核心原理&#xff1a;標準IO庫的底層…