【R語言】校準曲線,繪制原理

predict的結果
在這里插入圖片描述

①獲取predict的結果,“prob.Case”這一列就是預測風險概率,“truth”列為實際發生結局的分組

②將prob.Case進行分桶(簡單理解為分組,一般分10組),常見的分桶方式有兩種:一是將prob.Case從大到小排序后,按照樣本數平均分為10組,每組樣本數相等

③計算10個分桶中prob.Case的桶內均值作為預測概率;

④計算10個分桶中實際患病者(truth = 1 | truth=Case)占該桶樣本數的頻率作為實際概率;

⑤將10對預測概率和實際概率分別作為橫坐標值和縱坐標值得到10個散點;

⑥將這些點連起來,即為校準曲線中的Apparent線。

R包的函數

function (df, outcome, positive, prediction, model, n_bins = 10, show_loess = FALSE, plot_title = "", ...) 
{if ((n_bins > 0 && show_loess == TRUE) || (n_bins == 0 && show_loess == FALSE)) {stop("You must either set n_bins > 0 and show_loess to FALSE or set n_bins to 0 and show_loess to TRUE. Both cannot be displayed.")}how_many_models = df[[model]] %>% unique() %>% length()df[[outcome]] = ifelse(positive == df[[outcome]], 1, 0)if (n_bins > 0) {df <- df %>% dplyr::group_by(!!rlang::parse_expr(model)) %>% dplyr::mutate(bin = dplyr::ntile(!!rlang::parse_expr(prediction), n_bins)) %>% dplyr::group_by(!!rlang::parse_expr(model), bin) %>% dplyr::mutate(n = dplyr::n(), bin_pred = mean(!!rlang::parse_expr(prediction), na.rm = TRUE), bin_prob = mean(as.numeric(as.character(!!rlang::parse_expr(outcome))), na.rm = TRUE), se = sqrt((bin_prob * (1 - bin_prob))/n), ul = bin_prob + 1.96 * se, ll = bin_prob - 1.96 * se) %>% dplyr::mutate_at(dplyr::vars(ul, ll), . %>% scales::oob_squish(range = c(0, 1))) %>% dplyr::ungroup()}g1 = ggplot2::ggplot(df) + ggplot2::scale_y_continuous(limits = c(0, 1), breaks = seq(0, 1, by = 0.1)) + ggplot2::scale_x_continuous(limits = c(0, 1), breaks = seq(0, 1, by = 0.1)) + ggplot2::geom_abline(linetype = "dashed")if (show_loess == TRUE) {g1 = g1 + ggplot2::stat_smooth(ggplot2::aes(x = !!rlang::parse_expr(prediction), y = as.numeric(!!rlang::parse_expr(outcome)), color = !!rlang::parse_expr(model), fill = !!rlang::parse_expr(model)), se = TRUE, method = "loess")}else {g1 = g1 + ggplot2::aes(x = bin_pred, y = bin_prob, color = !!rlang::parse_expr(model), fill = !!rlang::parse_expr(model)) + ggplot2::geom_ribbon(ggplot2::aes(ymin = ll, ymax = ul, ), alpha = 1/how_many_models) + ggplot2::geom_point(size = 2) + ggplot2::geom_line(size = 1, alpha = 1/how_many_models)}g1 = g1 + ggplot2::xlab("Predicted Probability") + ggplot2::ylab("Observed Risk") + ggplot2::scale_color_brewer(name = "Models", palette = "Set1") + ggplot2::scale_fill_brewer(name = "Models", palette = "Set1") + ggplot2::theme_minimal() + ggplot2::theme(aspect.ratio = 1) + ggplot2::ggtitle(plot_title)g2 <- ggplot2::ggplot(df, ggplot2::aes(x = !!rlang::parse_expr(prediction))) + ggplot2::geom_density(alpha = 1/how_many_models, ggplot2::aes(fill = !!rlang::parse_expr(model), color = !!rlang::parse_expr(model))) + ggplot2::scale_x_continuous(limits = c(0, 1), breaks = seq(0, 1, by = 0.1)) + ggplot2::coord_fixed() + ggplot2::xlab("") + ggplot2::ylab("") + ggplot2::scale_color_brewer(palette = "Set1") + ggplot2::scale_fill_brewer(palette = "Set1") + ggplot2::theme_minimal() + ggeasy::easy_remove_y_axis() + ggeasy::easy_remove_legend(fill, color) + ggplot2::theme_void() + ggplot2::theme(aspect.ratio = 0.1)layout = c(patchwork::area(t = 1, b = 10, l = 1, r = 10), patchwork::area(t = 11, b = 12, l = 1, r = 10))g1/g2
}

自己寫的函數

# 讀取數據
data <- prediction_all_rfget_cal <- function(data=prediction_all_rf){data <- data %>% mutate(bucket = ntile(prob.Case, 10))bucket_means <- data %>% group_by(bucket) %>% summarise(predicted_prob = mean(prob.Case))actual_probs <- data %>% group_by(bucket) %>% summarise(actual_prob = mean(truth == "Case"))calibration_data <- left_join(bucket_means, actual_probs, by = "bucket")calibration_data$type=data$type[1]return(calibration_data)
}cal_rf <- get_cal(data = prediction_all_rf)
cal_kkmm <- get_cal(data = prediction_all_kknn)
cal_SVM <- get_cal(data = prediction_all_SVM)
cal_xgb <- get_cal(data = prediction_all_xgb)calibration_data <- rbind(cal_rf,cal_kkmm,cal_SVM,cal_xgb)
# ⑥ 將這些點連起來,即為校準曲線中的Apparent線
ggplot(calibration_data, aes(x = predicted_prob, y = actual_prob,group = type,colour = type)) +geom_point() +geom_line() +labs(title = "Calibration Curve", x = "Predicted Probability", y = "Actual Probability") +theme_minimal()+ggplot2::scale_y_continuous(limits = c(0, 1), breaks = seq(0, 1, by = 0.1)) + ggplot2::scale_x_continuous(limits = c(0, 1), breaks = seq(0, 1, by = 0.1)) + ggplot2::geom_abline(linetype = "dashed")

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/64740.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/64740.shtml
英文地址,請注明出處:http://en.pswp.cn/web/64740.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

QTDemo:串口調試工具

項目簡介 本項目通過QT框架設計一款可以在Windows、Linux等平臺的跨平臺串口助手&#xff0c;串口功能能夠滿足基本的調試需求。 本項目采用的版本為&#xff1a;QT5.14 visual studio 2022 進行開發。 項目源碼&#xff1a;https://github.com/say-Hai/MyCOMDemo 項目頁面&am…

基于SpringBoot和OAuth2,實現通過Github授權登錄應用

基于SpringBoot和OAuth2&#xff0c;實現通過Github授權登錄應用 文章目錄 基于SpringBoot和OAuth2&#xff0c;實現通過Github授權登錄應用0. 引言1. 創建Github應用2. 創建SpringBoot測試項目2.1 初始化項目2.2 設置配置文件信息2.3 創建Controller層2.4 創建Html頁面 3. 啟動…

CMS漏洞靶場攻略

DeDeCMS 環境搭建 傻瓜式安裝 漏洞一&#xff1a;通過文件管理器上傳WebShel 步驟?:訪問目標靶場其思路為 dedecms 后臺可以直接上傳任意文件&#xff0c;可以通過?件管理器上傳php文件獲取webshell 登陸網站后臺 步驟二&#xff1a;登陸到后臺點擊 【核心】 --》 【文件式…

0xc0000020錯誤代碼怎么處理,Windows11、10壞圖像錯誤0xc0000020的修復辦法

“0xc0000020”是一種 Windows 應用程序錯誤代碼&#xff0c;通常表明某些文件缺失或損壞。這可能是由于系統文件損壞、應用程序安裝或卸載問題、惡意軟件感染、有問題的 Windows 更新等原因導致的。 比如&#xff0c;當運行軟件時&#xff0c;可能會出現類似“C:\xx\xxx.dll …

LabVIEW 中 NI Vision 模塊的IMAQ Create VI

IMAQ Create VI 是 LabVIEW 中 NI Vision 模塊&#xff08;NI Vision Development Module&#xff09;的一個常用 VI&#xff0c;用于創建一個圖像變量。該圖像變量可以存儲和操作圖像數據&#xff0c;是圖像處理任務的基礎。 ? 通過以上操作&#xff0c;IMAQ Create VI 是構建…

HTML5 標簽輸入框(Tag Input)詳解

HTML5 標簽輸入框&#xff08;Tag Input&#xff09;詳解 標簽輸入框&#xff08;Tag Input&#xff09;是一種用戶界面元素&#xff0c;允許用戶輸入多個標簽或關鍵詞&#xff0c;通常用于表單、搜索框或內容分類等場景。以下是實現標簽輸入框的詳細講解。 1. 任務概述 標…

使用位操作符實現加減乘除!

歡迎拜訪&#xff1a;霧里看山-CSDN博客 本篇主題&#xff1a;使用位操作符實現加減乘除 發布時間&#xff1a;2025.1.1 隸屬專欄&#xff1a;C語言 目錄 位操作實現加法運算&#xff08;&#xff09;原理代碼示例 位操作實現減法運算&#xff08;-&#xff09;原理代碼示例 位…

[Spring] Spring AOP

&#x1f338;個人主頁:https://blog.csdn.net/2301_80050796?spm1000.2115.3001.5343 &#x1f3f5;?熱門專欄: &#x1f9ca; Java基本語法(97平均質量分)https://blog.csdn.net/2301_80050796/category_12615970.html?spm1001.2014.3001.5482 &#x1f355; Collection與…

Java-數據結構-時間和空間復雜度

一、什么是時間和空間復雜度&#xff1f; &#x1f4da; 那么在了解時間復雜度和空間復雜度之前&#xff0c;我們先要知道為何有這兩者的概念&#xff1a; 首先我們要先了解"算法"&#xff0c;在之前我們學習過關于"一維前綴和與差分"&#xff0c;"…

商湯C++開發面試題及參考答案

C++11 有哪些新特性? C++11 帶來了眾多令人矚目的新特性,極大地豐富和增強了這門編程語言的功能與表現力。 首先是類型推導方面,引入了auto關鍵字。通過auto,編譯器能夠自動根據初始化表達式來推導出變量的類型,這在處理復雜的模板類型或者較長的類型聲明時非常方便,能讓…

Cesium 實戰 27 - 三維視頻融合(視頻投影)

Cesium 實戰 27 - 三維視頻融合(視頻投影) 核心代碼完整代碼在線示例在 Cesium 中有幾種展示視頻的方式,比如墻體使用視頻材質,還有地面多邊形使用視頻材質,都可以實現視頻功能。 但是隨著攝像頭和無人機的流行,需要視頻和場景深度融合,簡單的實現方式則不能滿足需求。…

U盤格式化工具合集:6個免費的U盤格式化工具

在日常使用中&#xff0c;U盤可能會因為文件系統不兼容、數據損壞或使用需求發生改變而需要進行格式化。一個合適的格式化工具不僅可以清理存儲空間&#xff0c;還能解決部分存儲問題。本文為大家精選了6款免費的U盤格式化工具&#xff0c;并詳細介紹它們的功能、使用方法、優缺…

如何使用AI工具cursor(內置ChatGPT 4o+claude-3.5)

??溫馨提示&#xff1a; 禁止商業用途&#xff0c;請支持正版&#xff0c;充值使用&#xff0c;尊重知識產權&#xff01; 免責聲明&#xff1a; 1、本教程僅用于學習和研究使用&#xff0c;不得用于商業或非法行為。 2、請遵守Cursor的服務條款以及相關法律法規。 3、本…

Spring Boot的開發工具(DevTools)模塊中的熱更新特性導致的問題

問題&#xff1a; java.lang.ClassCastException: class cn.best.scholarflow.framework.system.domain.entity.SysUser cannot be cast to class cn.best.scholarflow.framework.system.domain.entity.SysUser (cn.best.scholarflow.framework.system.domain.…

異常與中斷(上)

文章目錄 一、異常與中斷的概念引入與處理流程1.1 生活中的中斷1.2 母親如何處理中斷1.3 ARM系統中異常與中斷處理流程 二、ARM架構中異常與中斷的處理2.1 處理流程2.2 cortex M3/M42.2.1 M3/M4的向量表2.2.2 M3/M4的異常/中斷處理流程 2.3 cortex A72.3.1 A7的向量表2.3.2 A7的…

Zabbix 監控平臺 添加監控目標主機

Zabbix監控平臺是一個企業級開源解決方案&#xff0c;用于分布式系統監視和網絡監視。它由Zabbix Server和可選組件Zabbix Agent組成&#xff0c;通過C/S模式&#xff08;客戶端-服務器模型&#xff09;采集數據&#xff0c;并通過B/S模式&#xff08;瀏覽器-服務器模型&#x…

游戲關卡設計的常用模式

游戲關卡分為很多種&#xff0c;但常用的有固定套路&#xff0c;分為若干種類型。 關卡是主角與怪物、敵方戰斗的場所&#xff0c;包括裝飾物、通道。 單人游戲的關卡較小&#xff0c;偏線性&#xff1b; 聯機/MMO的關卡較大&#xff0c;通道多&#xff0c;自由度高&#xf…

【容器化技術 Docker 與微服務部署】詳解

容器化技術 Docker 與微服務部署 一、容器化技術概述 &#xff08;一&#xff09;概念 容器化技術是一種操作系統級別的虛擬化方法&#xff0c;它允許將應用程序及其依賴項&#xff08;如運行時環境、系統工具、庫等&#xff09;打包成一個獨立的、可移植的單元&#xff0c;這…

TypeScript 后端開發中的熱重載編譯處理

在一些除了nest框架外的一些其他nodejs框架中沒有提供對ts編譯和熱重載&#xff0c;如果使用typescript我們需要自己進行配置。 方法一&#xff08;推薦&#xff09; 使用bun運行環境&#xff08;快&#xff09;。注&#xff1a;一些不是使用js&#xff0c;ts代碼編寫的第三方…

QT集成IntelRealSense雙目攝像頭3,3D顯示

前兩篇文章&#xff0c;介紹了如何繼承intel realsense相機和opengl。 這里介紹如何給深度數據和色彩數據一塊顯示到opengl里面。 首先&#xff0c;需要了解深度數據和彩色數據是如何存儲的。先說彩色數據。彩色圖像一般都是RGB&#xff0c;也就是每個像素有三個字節&#xf…