全文鏈接:https://tecdat.cn/?p=40424
在空間數據分析領域,準確的模型和有效的工具對于研究人員至關重要。本文為區域數據的貝葉斯模型分析提供了一套完整的工作流程,基于Stan這一先進的貝葉斯建模平臺構建,幫助客戶為空間分析帶來了新的解決方案(點擊文末“閱讀原文”獲取完整代碼、數據、文檔)。
特性
(一)空間回歸與疾病映射
本文處理區域單元(如州、縣或普查區域)或網絡記錄的數據統計模型,其中包括空間計量經濟學模型。在疾病映射方面,可用于估計小區域(如縣)的疾病風險,分析健康結果與其他區域變量的協變關系。例如在公共衛生研究中,研究人員可以利用該功能探究不同地區疾病的分布情況,分析發病率與環境、人口密度等因素的關聯。
(二)空間分析工具
本文提供了可視化和測量空間自相關及地圖模式的工具,用于探索性分析和模型診斷。在進行空間數據分析時,這些工具可以幫助研究人員直觀地了解數據的空間分布特征,判斷數據是否存在自相關現象,為后續的建模和分析提供依據。
(三)觀測不確定性處理
本文可以將數據可靠性信息,比如社區調查估計的標準誤差,納入到任何模型中。這一特性使得模型能夠更好地處理數據的不確定性,提高模型的準確性和可靠性。在實際應用中,數據往往存在各種誤差和不確定性,這一功能能夠有效考慮這些因素,使分析結果更符合實際情況。
(四)缺失和審查觀測值處理
在生命統計和疾病監測系統中,會對低于閾值數量的病例數進行審查。能夠對存在審查觀測值或缺失觀測值的小區域疾病或死亡率風險進行建模。例如在分析某地區的死亡率數據時,可能存在部分數據因各種原因被審查或缺失,可以通過合適的模型對這些數據進行處理,從而得到更準確的死亡率估計。
(五)與RStan生態系統的交互
本文能與許多高質量的R語言貝葉斯建模包輕松交互,這為研究人員提供了更豐富的分析手段和更靈活的建模選擇。研究人員可以結合其他相關包的優勢,進行更復雜和深入的數據分析。
(六)自定義空間模型
本文提供了在Stan
中構建自定義空間或網絡模型的工具,滿足研究人員對于特定研究問題的個性化建模需求。例如在研究特定地理區域的交通流量網絡或生態系統中的物種分布時,研究人員可以根據實際情況構建自定義模型。
在公共衛生研究中,與surveil
這個R語言包形成互補,兩者結合可以從時空兩個維度全面分析公共衛生數據。
示例
(一)數據加載與初步分析
數據集包含了2014 - 2018年期間,55 - 64歲年齡段按性別劃分的縣人口和死亡率數據。由于公共訪問數據的常見情況,部分觀測值因疾病控制與預防中心為保護隱私而被審查,從而缺失。
對空間數據進行可視化總結,包括直方圖、莫蘭散點圖和地圖。莫蘭散點圖用于展示數據值與其相鄰值的匯總對比,回歸線的斜率可衡量自相關程度。
以下代碼用于創建鄰接矩陣,計算每10,000人的粗死亡率,并進行快速空間診斷:
#?快速空間診斷
diag(mortaate,?georgia,?w?=?adjacenix")
執行上述代碼后,得到的可視化結果如下:
點擊標題查閱往期內容
R語言和STAN,JAGS:用RSTAN,RJAG建立貝葉斯多元線性回歸預測選舉數據
左右滑動查看更多
01
02
03
04
(二)空間條件自回歸(CAR)模型擬合
由于縣的死亡率和其他健康統計數據在許多情況下是高度不穩定的估計值,不能直接用于公共建議或推斷(因為人口規模較小),因此需要使用模型從小區域數據中進行推斷。
以下代碼使用空間條件自回歸(CAR)模型對女性縣死亡率數據進行擬合:
#?對女性死亡率數據擬合模型
stacar(deaths.female?~?offse
將擬合好的模型傳遞給函數,可返回空間模型的一組診斷信息:
使用print
方法可以返回模型參數的概率分布摘要,以及來自Stan的馬爾可夫鏈蒙特卡羅(MCMC)診斷信息(均值的蒙特卡羅標準誤差se_mean
、有效樣本大小n_eff
和R-hat統計量Rhat
):
print(modefit)
執行sp_g(mode_i, grgia)
后,得到的診斷信息可視化結果如下:
(三)提取死亡率估計值與可視化
通過fitted
方法提取縣死亡率估計值,乘以10,000得到每10,000人的死亡率:
#?每10,000人的死亡率估計值
moraitystimtes?<-?ftted(de_fit)?*?10e3
將估計值放入分箱中用于地圖顏色顯示,創建地圖展示估計值:
oriial_magin?=?par(mar?=?rep(1,?4))
#?獲取邊界
geometry?<-?sf:st_eoetry(eorgia)
#?繪制地圖
plot(geomty,lwd?=?0.2,col?=?colors)
#?添加圖例
legbty?=?'n')
執行上述代碼后,繪制出的地圖如下:
利用可信區間,創建點區間圖:
#?按死亡率對縣進行排序
data?<-?mortality_estimates\[index,?\]
#?收集估計值和95%可信區間
estimate?<-?data$mean
lower?<-?data$\`2.5%\`
upper?<-?data$\`97.5%\`
y?<-?seq\_along(cony\_name)
x_limit?<-?(min(lo),?max(upper))?%>%?round()
#?設置邊距
originalarg?=?r(ma??c(3,?,?0)
#?繪制點
plot(esimte,y,pch?=?5,col?=?gray50',bty??'L,axes?=?FALSE,xlim?=?_limit,yl?=?A,xlab?=?NA)
#?繪制區間
segmens(x0?=?lower,?x1?=?upper,y0?=?y,y1??,col?=?olor\[index\])
#?添加x軸mit\[1\],?x_limit\[2\],?by?=?20))
執行上述代碼后,得到的點區間圖如下:
本文中分析的完整數據、代碼、文檔分享到會員群,掃描下面二維碼即可加群!?
資料獲取
在公眾號后臺回復“領資料”,可免費獲取數據分析、機器學習、深度學習等學習資料。
點擊文末“閱讀原文”
獲取完整代碼、數據、文檔。
本文選自《R語言Stan貝葉斯空間條件自回歸CAR模型分析死亡率多維度數據可視化》。
點擊標題查閱往期內容
R語言和STAN,JAGS:用RSTAN,RJAG建立貝葉斯多元線性回歸預測選舉數據
R語言中貝葉斯網絡(BN)、動態貝葉斯網絡、線性模型分析錯頜畸形數據
使用貝葉斯層次模型進行空間數據分析
MCMC的rstan貝葉斯回歸模型和標準線性回歸模型比較
python貝葉斯隨機過程:馬爾可夫鏈Markov-Chain,MC和Metropolis-Hastings,MH采樣算法可視化
Python貝葉斯推斷Metropolis-Hastings(M-H)MCMC采樣算法的實現
matlab貝葉斯隱馬爾可夫hmm模型實現
貝葉斯線性回歸和多元線性回歸構建工資預測模型
Metropolis Hastings采樣和貝葉斯泊松回歸Poisson模型
貝葉斯分位數回歸、lasso和自適應lasso貝葉斯分位數回歸分析免疫球蛋白、前列腺癌數據
R語言RSTAN MCMC:NUTS采樣算法用LASSO 構建貝葉斯線性回歸模型分析職業聲望數據
R語言STAN貝葉斯線性回歸模型分析氣候變化影響北半球海冰范圍和可視化檢查模型收斂性
PYTHON用戶流失數據挖掘:建立邏輯回歸、XGBOOST、隨機森林、決策樹、支持向量機、樸素貝葉斯和KMEANS聚類用戶畫像
貝葉斯分位數回歸、lasso和自適應lasso貝葉斯分位數回歸分析免疫球蛋白、前列腺癌數據
R語言JAGS貝葉斯回歸模型分析博士生延期畢業完成論文時間
R語言Metropolis Hastings采樣和貝葉斯泊松回歸Poisson模型
Python決策樹、隨機森林、樸素貝葉斯、KNN(K-最近鄰居)分類分析銀行拉新活動挖掘潛在貸款客戶
R語言貝葉斯MCMC:用rstan建立線性回歸模型分析汽車數據和可視化診斷
R語言貝葉斯MCMC:GLM邏輯回歸、Rstan線性回歸、Metropolis Hastings與Gibbs采樣算法實例
R語言貝葉斯Poisson泊松-正態分布模型分析職業足球比賽進球數
隨機森林優化貝葉斯預測分析汽車燃油經濟性
R語言邏輯回歸、Naive Bayes貝葉斯、決策樹、隨機森林算法預測心臟病
R語言用Rcpp加速Metropolis-Hastings抽樣估計貝葉斯邏輯回歸模型的參數
R語言中的block Gibbs吉布斯采樣貝葉斯多元線性回歸
Python貝葉斯回歸分析住房負擔能力數據集
R語言實現貝葉斯分位數回歸、lasso和自適應lasso貝葉斯分位數回歸分析
Python用PyMC3實現貝葉斯線性回歸模型
R語言用WinBUGS 軟件對學術能力測驗建立層次(分層)貝葉斯模型
R語言Gibbs抽樣的貝葉斯簡單線性回歸仿真分析
R語言和STAN,JAGS:用RSTAN,RJAG建立貝葉斯多元線性回歸預測選舉數據
R語言基于copula的貝葉斯分層混合模型的診斷準確性研究
R語言貝葉斯線性回歸和多元線性回歸構建工資預測模型
R語言貝葉斯推斷與MCMC:實現Metropolis-Hastings 采樣算法示例
R語言stan進行基于貝葉斯推斷的回歸模型
R語言中RStan貝葉斯層次模型分析示例
R語言使用Metropolis-Hastings采樣算法自適應貝葉斯估計與可視化
R語言隨機搜索變量選擇SSVS估計貝葉斯向量自回歸(BVAR)模型
WinBUGS對多元隨機波動率模型:貝葉斯估計與模型比較
R語言實現MCMC中的Metropolis–Hastings算法與吉布斯采樣
R語言貝葉斯推斷與MCMC:實現Metropolis-Hastings 采樣算法示例
R語言使用Metropolis-Hastings采樣算法自適應貝葉斯估計與可視化
視頻:R語言中的Stan概率編程MCMC采樣的貝葉斯模型
R語言MCMC:Metropolis-Hastings采樣用于回歸的貝葉斯估計