中國老年健康調查(CLHLS)數據挖掘教程(1)--CLHLS簡介和數據下載

北京大學“中國老年健康影響因素跟蹤調查(簡稱‘中國老年健康調查’;英文名稱為Chinese Longitudinal Healthy Longevity Survey (CLHLS))”及交叉學科研究由國家自然科學基金委主任基金應急項目、重大項目、重點項目及國際合作項目。1998-2018年在全國23個省/市/自治區隨機抽取大約一半縣市進行八次跟蹤調查,累計入戶訪問11.3萬人次,其中最需照料的80歲及以上高齡老人占總樣本67.4%,其余為較低齡老人和中年對照組;包括:2.01萬人次百歲老人,2.68萬人次90-99歲老人,2.93萬人次80-89歲老人,2.01萬人次65-79歲老人,1.12萬人次35-64歲中年人;同時訪問2.89萬位65+歲已死亡被訪老人的直接家庭成員,收集了老人死亡前健康狀況、生活質量與醫療和照料需求成本等詳細數據。

在這里插入圖片描述

1998-2018年八次老齡健康跟蹤調查累計入戶訪問11.3萬人次,其中最需照料的80歲及以上高齡老人占總樣本67.4%,其余為較低齡老人和中年對照組;同時訪問2.89萬位65+歲已死亡被訪老人的直接家庭成員,收集了老人死亡前健康狀況、生活質量與醫療和照料需求成本等詳細數據。“中國老年健康調查”免費向學者們提供數據,跟蹤調查數據在刪除個人隱私信息后已向社會和學界免費開放,包括:存活老人生理心理健康、認知功能、社會參與、行為、飲食營養、生活習慣、社會經濟狀況、家庭結構、代際關系、老年家庭照料需求、照料提供和成本等非常豐富的個體微觀數據、以及65+歲已死亡老人死亡前健康狀況、照料成本與生活質量等豐富個體微觀數據,除了為國家健康老齡化科學決策應用研究服務外,已通過北京大學開放研究數據平臺(http://opendata.pku.edu.cn/)和中國人口與發展研究中心執行的“國家人口宏觀管理與決策信息系統(PADIS)”和“全民健康保障信息化工程”數據庫平臺向學界和社會開放免費使用。
據不完全統計,截至2021年10月15日,10327位學者(不包括他們的項目組其他成員)正式注冊免費使用1998-2018年“中國老年健康調查”數據; 這些學者們使用該調查數據已發表成果:專著17本;國際匿名評審SCI和SSCI學術刊物論文431篇; 國內期刊論文731篇; 通過答辯博士論文99篇和碩士論文678篇;遞交政策咨詢報告68篇。

在這里插入圖片描述
CLHLS數據下載的網址是:

https://opendata.pku.edu.cn/dataverse/CHADS?spm=5176.28103460.0.0.40f7451e1r7NtX

數據需要先通過申請才能下載,下載到電腦的數據如下圖

在這里插入圖片描述
數據每個年份是分開的,以sav格式保存。中國健康長壽縱向調查(CLHLS)的有前八波(1998、2000、2002、2005、2008、2011、2014和2018)。這些受訪者于1998年首次接受采訪,后面是對這些患者的跟蹤隨訪。

在編碼系統中,“寫入格式:F3”表示變量的代碼長度為3位數字,沒有小數點,而“寫入格式∶F8.6”表示變量代碼長度為8位數字,小數點后有6位數字。后一種格式(帶小數點)用于權重。

在這里插入圖片描述
數據集中,大多數變量都被視為“數字”變量,而其中一些變量則被視為字符串變量。年齡、年、月、人數和天數等變量被視為“規模”類型。剩余的大多數變量被視為“名義”變量,包括“是”或“否”二項式問題。B部分中的變量、E部分中與ADL、IADL功能能力相關的變量以及D部分中幸存的個人問卷中的一些變量被視為“順序”變量。死者死亡前的ADL功能也被視為“序數”變量。更詳細的信息可以在編碼系統的“測量級別”中找到。變量名稱中第一個字母為“r”的變量表示問題是由受訪者親自回答或者由代理人回答。

以“_0”、“_2”、“_5”、“_6”、”_11”、“_14”和“_18”為后綴的變量分別用于2000年、2002年、2005年、2008年、2011年、2014年和2018年仍然活著并再次接受采訪的人,而以“d0”、第二年、第五年、第八年、第十一年、第十四年和第十八年為前綴的變量則分別用于1998-2000年、2000-2002年、2002-2005年、2005-2008年、2008-2011年、2011-2014年和2014-2018年調查間隔內死亡的已故受訪者。

“-6”用于表示該變量僅用于在世人員,不適用于已故人員。“-7”表示該變量僅用于已故人員,不適用于幸存的受訪者。“-8”用于表示受訪者在早期浪潮中死亡或失訪,“-9”用于定義失訪。此數據集中使用“-1”表示問題不適用于受訪者的情況。“9”、“99”、“999”和“9999”通常用于表示不同變量中的缺失信息,而在大多數情況下(但不是所有情況下),“8”、“88”、“888”和“8888”用于表示受訪者不知道問題答案的情況。在進行分析之前,用戶需要估算由“8”、“88”、“888”、“8888”、”9”、“99”、“999”和“9999”表示的缺失值,特別是當“缺失”或“不知道”的比例大于5%時。目前沒有用估算值替換缺失數據的數據集。

在這里插入圖片描述
最后我總結一下,CLHLS的患者年齡偏大,基本大于80歲,包含有飲食數據和生活數據,數據提取方法也和chals類似,可以看作是chals數據的一個補充,可以發一些膳食/飲食指數之類數據的文章,后續將繼續進一步介紹CLHLS。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/909299.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/909299.shtml
英文地址,請注明出處:http://en.pswp.cn/news/909299.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

基本多線程編譯make命令

背景: 在ffmpeg源碼編譯的時候要等很久,快下班了,等不及。 解決方法: 使用多線程編譯。 make -j{n} 如: make -j8詳解:(沒時間看的可以返回了!) 在編譯 FFmpeg 時使用…

MNIST數據集上樸素貝葉斯分類器(MATLAB例)

MNIST數據集上樸素貝葉斯分類器 Naive Bayes Classification fitcnb Train multiclass naive Bayes model Syntax Mdl fitcnb(Tbl,ResponseVarName) Mdl fitcnb(Tbl,formula) Mdl fitcnb(Tbl,Y) Mdl fitcnb(X,Y) Mdl fitcnb(___,Name,Value) [Mdl,AggregateOptimization…

網站設計小技巧:利用交互設計提升用戶體驗

現在很多企業朋友都會感覺到,做網站設計掌握不好設計網頁的魂,換了很多設計方式可能效果都不理想。蒙特網站專注高端網站建設20多年,基于為華為、字節跳動、海康威視等頭部企業打造網站的經驗,今天將近期用戶比較喜歡的網頁設計方…

Github指南-Add .gitignore和Choose a license

Add .gitignore(添加忽略文件列表) 📌 作用: .gitignore 文件用于告訴 Git 哪些文件或文件夾**不要被上傳(版本控制)**,例如: 編譯生成的臨時文件(如 .exe, .o&#x…

如何打造沉浸式文件操作體驗

在操作系統長期運行后,本地文件系統往往會面臨一個常見卻棘手的問題:元數據管理效率下降,導致用戶在海量文件中檢索目標內容時出現顯著的延遲與操作成本。這種現象在未使用標簽化或語義化管理系統的情況下尤為明顯。 而 Oversis 的出現&…

企業AI深水區突圍:從星辰大海到腳下泥濘的進化論

一、業務價值旅程:從降本增效到價值躍遷 1.1 技術落地的"甜蜜陷阱" 企業在AI應用初期往往陷入"高配用不起,低配用不了"的困境。一臺8卡A100服務器每月電費超3萬元的成本,對制造業利潤形成巨大擠壓。即便跨過算力門檻&a…

PostgreSQL的擴展moddatetime

PostgreSQL的擴展moddatetime moddatetime 是 PostgreSQL 的一個內置擴展,用于自動維護表的最后修改時間字段。這個擴展可以自動更新指定字段為當前時間戳,非常適合需要跟蹤記錄最后修改時間的應用場景。 一、moddatetime 基本功能 核心特性 自動更新…

自己的電腦搭建外網訪問網站服務器的步驟

文章目錄 PC電腦做網站服務器的步驟1.前言2. 網站服務器系統的安裝2.1個人電腦安裝IIS(Windows7系統安裝IIS7.0)2.1.1:打開控制面板,給Windows安裝插件 2.2網站配置:2.2.1打開網站配置項:2.2.2開始配置&…

基于深度學習的智能語音合成系統:技術與實踐

前言 隨著人工智能技術的飛速發展,智能語音合成(Text-to-Speech, TTS)技術已經成為人機交互領域的重要組成部分。從智能助手到有聲讀物,語音合成技術正在改變我們與數字內容的交互方式。近年來,深度學習技術為語音合成…

鑄鐵平臺的制造工藝復雜而精細

鑄鐵平臺的制造工藝確實復雜而精細。首先,需要選擇合適的鑄鐵材料,通常是灰鑄鐵或球墨鑄鐵,以滿足平臺的強度和耐磨性要求。然后,根據設計要求,制作模具,并在高溫下將鐵液倒入模具中進行鑄造。在鑄造過程中…

ArcPy 與 ArcGIS .NET SDK 讀取 GDB 要素類坐標系失敗?GDAL 外掛方案詳解

ArcPy 與 ArcGIS .NET SDK 讀取 GDB 要素類坐標系失敗?GDAL 外掛方案詳解 在ArcGIS Pro中正常顯示的坐標系,為何通過ArcPy或.NET SDK卻無法正確讀取?本文將分享我在處理CGCS2000坐標系時的踩坑經歷,以及最終通過GDAL外掛方案解決問…

Zabbix 高可用架構部署方案(2最新版)

Zabbix 高可用架構部署方案(MySQL 雙 VIPHAProxyNginx) 前景提要:使用 MySQL 作為數據庫,兩個虛擬 IP(10.0.0.100 和 10.0.0.200),HAProxy 作為數據庫負載均衡,Nginx 作為 Web 訪問…

深入解析Linux分頁機制:從虛擬內存到物理地址的魔法轉換

目錄 引言:為什么需要分頁機制? 一、分頁機制基礎概念 1.1 虛擬地址與物理地址 1.2 頁與頁框 1.3 為什么是4KB? 二、多級頁表結構 2.1 為什么需要多級頁表? 2.2 x86_64的四級頁表結構 2.3 頁表項詳解 三、Linux分頁實現機…

使用python進行圖像處理—圖像變換(6)

圖像變換是指改變圖像的幾何形狀或空間位置的操作。常見的幾何變換包括平移、旋轉、縮放、剪切(shear)以及更復雜的仿射變換和透視變換。這些變換在圖像配準、圖像校正、創建特效等場景中非常有用。 6.1仿射變換(Affine Transformation) 仿射變換是一種…

NLP-數據集介紹(并不全,文本類介紹)

目錄 第一章 STS(語義文本相似度) (重點)一、SemEval STS 年度任務(2012-2017)1. SemEval-2012 STS2. SemEval-2013 STS3. SemEval-2014 STS4. SemEval-2015 STS5. SemEval-2016 STS6. SemEval-2017 STS 二…

JS進階 Day01

1.作用域和作用域鏈 let不可訪問 var可訪問,因為沒有塊作用域這一說法 2.JS垃圾回收機制以及算法 下圖如上圖同理 下圖這個三個相互引用的,根部找不到,就進行清除。 3.JS閉包 4.變量和函數提升(了解) 5.函數剩余參數和展開運算符 還有種寫法 …

詳解Python當中的pip常用命令

想象一下,如果建造房屋時,每一塊磚、每一根鋼筋都需要你自己親手燒制和打造,那會是怎樣一番景象?軟件開發也是如此。如果沒有現成的、高質量的、可復用的代碼庫,開發者們就不得不重復“發明輪子”,效率低下…

LangChain面試內容整理-知識點10:文本嵌入模型(Embeddings)使用

文本嵌入(Embeddings)是將文字轉換為向量(高維數值向量)的過程和結果。在LangChain中,Embeddings模塊負責調用各種嵌入模型,將文本轉化為向量表示,以便后續在向量空間執行相似度搜索、聚類等操作。這在實現語義搜索、RAG中非常關鍵,因為向量可以讓計算機“理解”文本語…

To be or Not to be, That‘s a Token——論文閱讀筆記——Beyond the 80/20 Rule和R2R

本周又在同一方向上刷到兩篇文章,可以說,……同學們確實卷啊,要不卷卷開放場域的推理呢? 這兩篇都在講:如何巧妙的利用帶有分支能力的token來提高推理性能或效率的。 第一篇叫 Beyond the 80/20 Rule: High-Entropy Mi…

bisheng系列(三)- 本地部署(后端 1.2版本)

一、導讀 環境:Ubuntu 24.04、open Euler 23.03、Windows 11、WSL 2、Python 3.10 、bisheng 1.2.0 背景:需要bisheng二開商用,故而此處進行本地部署,便于后期調試開發 時間:20250612 說明:bisheng的1.2…