【大廠AI課學習筆記NO.60】(13)模型泛化性的評價

我們學習了過擬合和欠擬合,具體見我的文章:https://giszz.blog.csdn.net/article/details/136440338

那么今天,我們來學習模型泛化性的評價。

泛化性的問題,我們也討論過了,那么如何評價模型的泛化性呢?

?

我們知道,過擬合(over-fitting),就是在訓練數據上表現良好,在未知數據上表現差。

欠擬合(under-fitting),就是在訓練數據和未知數據上表現都很差。

這里要記住!

過和欠都不好,訓練結合略微低于測試結果是組好的。?

?

這個圖特別有助于我們的理解。

延伸學習:


模型泛化性的評價方法主要包括留出驗證、交叉驗證、自助法等,下面詳細闡述留出驗證和交叉驗證這兩種常用的方法,以及它們的步驟和重要的工具,并給出具體的例子來說明。

一、留出驗證

留出驗證是將數據集劃分為訓練集、驗證集和測試集三個部分。訓練集用于訓練模型,驗證集用于調整模型參數和選擇最佳模型,測試集用于評估模型的泛化性能。

步驟:

  1. 將數據集按比例劃分為訓練集、驗證集和測試集,通常的比例是70%:15%:15%或60%:20%:20%等。
  2. 使用訓練集訓練模型,并使用驗證集進行模型選擇和參數調整。
  3. 選擇在驗證集上表現最好的模型,使用測試集評估其泛化性能。

工具:

Python中的scikit-learn庫提供了留出驗證的相關功能,如train_test_split函數可用于劃分數據集。

例子:

假設我們有一個包含1000個樣本的數據集,我們可以使用train_test_split函數將其劃分為訓練集、驗證集和測試集。例如,將70%的數據作為訓練集,剩余的30%再平均分為驗證集和測試集。

from sklearn.model_selection import train_test_split  X, y = # 數據集的特征和標簽  X_train, X_temp, y_train, y_temp = train_test_split(X, y, test_size=0.3, random_state=42)  
X_val, X_test, y_val, y_test = train_test_split(X_temp, y_temp, test_size=0.5, random_state=42)

二、交叉驗證

交叉驗證是一種將數據集分成多份,每次使用其中的一份作為驗證集,其余的作為訓練集的驗證方法。常見的交叉驗證方法有k折交叉驗證和留一交叉驗證。

步驟(以k折交叉驗證為例):

  1. 將數據集平均分成k份,每份稱為一個折(fold)。
  2. 每次使用其中的一個折作為驗證集,其余的k-1個折作為訓練集。
  3. 重復k次,每次選擇不同的折作為驗證集,確保每個折都被用作驗證集一次。
  4. 計算k次驗證結果的平均值作為模型的性能評估指標。

工具:

Python中的scikit-learn庫提供了交叉驗證的相關功能,如KFoldcross_val_score等。

例子:

假設我們有一個包含100個樣本的數據集,我們可以使用5折交叉驗證來評估模型的性能。這意味著我們將數據集分成5份,每份包含20個樣本。

from sklearn.model_selection import KFold, cross_val_score  
from sklearn.linear_model import LogisticRegression  X, y = # 數據集的特征和標簽  
model = LogisticRegression()  # 以邏輯回歸模型為例  kfold = KFold(n_splits=5, shuffle=True, random_state=42)  # 創建5折交叉驗證對象  
scores = cross_val_score(model, X, y, cv=kfold)  # 使用交叉驗證評估模型性能  print("交叉驗證結果:", scores)  # 輸出每次驗證的結果  
print("平均性能:", scores.mean())  # 輸出平均性能評估指標

需要注意的是,在實際應用中,我們通常會結合多種評估方法和工具來全面評估模型的泛化性能。此外,還需要注意數據集的劃分比例、隨機性等因素對評估結果的影響。

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/718968.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/718968.shtml
英文地址,請注明出處:http://en.pswp.cn/news/718968.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

激光SLAM技術助力富唯智能復合機器人的應用場景無限拓展

隨著科技的不斷進步,智能機器人已成為現代工業、服務、醫療等多個領域的重要角色。而在這一變革中,激光SLAM技術發揮著至關重要的作用。特別是對于富唯智能復合機器人來說,激光SLAM技術不僅提升了其智能化水平,更使其應用場景變得…

esp3455235

在這里插入代碼片gdasgdsfgdfh dfahahdfh

【促銷定價】背后的算法技術3-數據挖掘分析

【促銷定價】背后的算法技術3-數據挖掘分析 01 整體分析1)整體概覽2)類別型特征概覽3)數值型特征概覽 02 聚合分析1)天維度2)品維度3)價格維度4)數量維度 03 相關分析1)1級品類2&…

無公網ip環境使用DS file軟件遠程訪問內網群暉NAS中儲存的文件

文章目錄 1. 群暉安裝Cpolar2. 創建TCP公網地址3. 遠程訪問群暉文件4. 固定TCP公網地址5. 固定TCP地址連接 DS file 是一個由群暉公司開發的文件管理應用程序,主要用于瀏覽、訪問和管理存儲在群暉NAS(網絡附加存儲)中的文件。這個應用程序具有…

echarts如何實現3D餅圖(環形圖)?

一、實現的效果 二、具體步驟 1.安裝依賴 npm install echarts 2.引入echarts import * as echarts from echarts; 注意:這里需要用到echarts-gl,必須單獨引入才可以 import echarts-gl; 3.echarts部分代碼 我知道這部分內容很多,但只要cv…

社情民意調查的內容

本文由群狼調研(長沙社情民意調查)出品,歡迎轉載,請注明出處。社情民意調查的內容通常包括以下幾個方面: 1.社會熱點問題:針對當前社會熱點問題進行調查,收集公眾對該問題的態度和看法&#xf…

羊大師揭秘羊奶與健康,美味的保健佳品

羊大師揭秘羊奶與健康,美味的保健佳品 羊奶確實是一種美味且健康的保健佳品,其獨特的營養成分和風味使其成為許多人的健康選擇。以下是一些羊奶與健康的關系: 營養豐富:羊奶含有豐富的蛋白質、脂肪、礦物質和維生素,…

ruoyi-nbcio-plus的Vue3前端升級組件后出現的問題(一)

更多ruoyi-nbcio功能請看演示系統 gitee源代碼地址 前后端代碼: https://gitee.com/nbacheng/ruoyi-nbcio 演示地址: http://122.227.135.243:9666 更多nbcio-boot功能請看演示系統 gitee源代碼地址 后端代碼: https://gitee.com/nbach…

大模型ChatGLM-6B實現本地部署

大模型ChatGLM-6B實現本地部署 一、寫在前面:二、ChatGLM-6B下載:三、項目所需要的環境配置:四、項目運行:五、遇到的主要問題及解決 一、寫在前面: 1、 確保你的電腦中已安裝git,git lfs。 2、確保你的電…

淺析前端的堆棧原理以及深淺拷貝原理

淺析前端的堆棧原理以及深淺拷貝原理 首先來看一個案例 const obj {name:hzw,age:18 } let objName2 obj objName2.age 12 console.log(obj,objName2) // {name: hzw, age: 12} {name: hzw, age: 12}這里是不是很奇怪,為什么,為什么我改變objName2的…

Hierarchical Text-ConditionalImage Generation with CLIP Latents筆記

1 Title Hierarchical Text-Conditional Image Generation with CLIP Latents(Aditya Ramesh、Prafulla Dhariwal、Alex Nichol、Casey Chu、Mark Chen) 2 Conclusion Contrastive models like CLIP have been shown to learn robust representations …

read()函數

read() 函數用于從文件描述符&#xff08;通常是套接字、文件等&#xff09;讀取數據。 #include <unistd.h>ssize_t read(int fd, void *buf, size_t count);fd&#xff1a; 是文件描述符&#xff0c;可以是套接字、文件等。 buf&#xff1a; 是一個指向要讀取數據的緩…

AirPods Pro 2 耳機推送新固件,蘋果Find My功能助力產品成長

蘋果公司面向 AirPods Pro 2&#xff08;包括 USB-C 和 Lightning 版本&#xff09;&#xff0c;推出了全新的測試版固件更新&#xff0c;版本號為 6E188&#xff0c;高于 12 月份發布的 6B34 固件。 蘋果和往常一樣&#xff0c;并沒有提供詳細的更新日志或者說明&#xff0c…

算法刷題day20:二分

目錄 引言概念一、借教室二、分巧克力三、管道四、技能升級五、冶煉金屬六、數的范圍七、最佳牛圍欄 引言 這幾天一直在做二分的題&#xff0c;都是上了難度的題目&#xff0c;本來以為自己的二分水平已經非常熟悉了&#xff0c;沒想到還是糊涂了一兩天才重新想清楚&#xff0…

力扣區間題:合并區間、插入區間

我們可以將區間按照左端點升序排列&#xff0c;然后遍歷區間進行合并操作。 我們先將第一個區間加入答案&#xff0c;然后依次考慮之后的每個區間&#xff1a; 如果答案數組中最后一個區間的右端點小于當前考慮區間的左端點&#xff0c;說明兩個區間不會重合&#xff0c;因此…

Java基于springboot的課程作業管理系統

摘 要 隨著科學技術的飛速發展&#xff0c;社會的方方面面、各行各業都在努力與現代的先進技術接軌&#xff0c;通過科技手段來提高自身的優勢&#xff0c;課程作業管理系統當然也不能排除在外。課程作業管理系統是以實際運用為開發背景&#xff0c;運用軟件工程原理和開發方法…

js跳出循環

只有for可以自己跳出循環 break可以退出多重循環&#xff0c;可以自行選擇退出哪一層 label: for (let i 0; i < arr.length; i) {if (arr[i].content) {break label}console.log(i) } label1: for (let i 0; i < arr.length; i) {label2: for (let j 0; j < arr.l…

Linux常見命令總結

1.創建文件夾 mkdir 目錄名 mkdir 文件夾名 創建單個文件夾 mkdir 文件夾1 文件夾2 文件夾3 創建多個文件夾 mkdir -p parent/child 創建多級文件夾 2.創建文件 touch 文件名 touch的主要功能有兩個,如果要創建的文件的名稱存在,將文件的創建時間修改到當前的系統時間(也…

五種常用的可視化項目管理工具

傳統的項目管理通常依賴于文本文檔&#xff0c;容易造成誤解和混亂。在快節奏的商業環境中&#xff0c;沒有哪個項目經理愿意處理繁重的文檔流程。 另一方面&#xff0c;可視化項目管理通常使用圖表和視覺板來展示復雜的項目信息。因此&#xff0c;項目經理能快速了解關鍵信息…

基于 rk3566 的 uboot 分析 - dts 加載和 dm 模型的本質

文章目錄 一、設備樹加載使用1、概述2、第一階段1) fdtdec_setup2) 總結 3、第二階段1) kernle dtb 編譯打包2) 加載流程2.1) board_init2.2) init_kernel_dtb2.3) rockchip_read_dtb_file2.4) rockchip_read_resource_dtb 3) 總結 二、dm 模型1、樹的創建1) device_bind_commo…