深度學習篇---模型訓練評估參數


文章目錄

  • 前言
  • 一、Precision(精確率)
    • 1.1定義
    • 1.2意義
    • 1.3數值接近1
    • 1.4數值再0.5左右
    • 1.5數值接近0
  • 二、Recall(召回率)
    • 2.1定義
    • 2.2意義
    • 2.3數值接近1
    • 2.4數值在0.5左右
    • 2.5數值接近0
  • 三、Accuracy(準確率)
    • 3.1定義
    • 3.2意義
    • 3.3數值接近1
    • 3.4數值接近0.5左右
    • 3.5數值接近0
  • 四、F1 值
    • 4.1定義
    • 4.2意義
    • 4.3數值接近1
    • 4.4數值0.5左右
    • 4.5數值接近0
  • 五、ROC 曲線與 AUC
    • 5.1ROC曲線
    • 5.2AUC
    • 5.3AUC接近1
    • 5.4AUC接近0.5
    • 5.5AUC小于0.5
  • 六、平均絕對誤差(MAE)
    • 6.1定義
    • 6.2意義
    • 6.3數值接近0
    • 6.4數值較大
  • 七、均方誤差(MSE)
    • 7.1定義
    • 7.2意義
    • 7.3數值接近0
    • 7.4數值較大


前言

本文簡單介紹了深度學習中模型訓練好壞的評估參數。


一、Precision(精確率)

1.1定義

定義:預測為正例的樣本中,真正為正例的比例。計算公式為:
Precision= TP/(TP+FP)
其中TP(True Positive)表示真正例,即實際為正例且被預測為正例的樣本數量;FP(False Positive)表示假正例,即實際為負例但被預測為正例的樣本數量。

1.2意義

意義:精確率反映了模型預測出的正例中真正正確的比例,用于衡量模型預測正例的準確性。例如,在垃圾郵件分類中,精確率高意味著模型預測為垃圾郵件的郵件中,確實是垃圾郵件的比例較高,可減少將正常郵件誤判為垃圾郵件的情況。

1.3數值接近1

數值接近 1:說明模型預測為正例的樣本中,真正為正例的比例很高。例如在文本分類任務中,若精確率達到 0.9 以上,表明模型預測為某一類別的文本,絕大部分確實屬于該類別,模型在識別正例時具有較高的準確性,誤判為正例的情況很少。

1.4數值再0.5左右

數值在 0.5 左右:表示模型預測正例的準確性一般,有一半左右預測為正例的樣本可能是錯誤的判斷。這意味著模型在區分正例和負例時,存在較大的混淆,可能需要進一步調整模型參數或特征工程,以提高其對正例的精確識別能力。

1.5數值接近0

數值接近 0:說明模型幾乎無法準確識別正例,預測為正例的樣本中大部分是錯誤的,模型在正例識別方面表現很差,可能存在嚴重的過擬合或欠擬合問題,或者數據集中存在噪聲干擾等因素影響了模型的判斷。

二、Recall(召回率)

2.1定義

定義:實際為正例的樣本中,被預測為正例的比例。計算公式為:
Recall= TP/(TP+FN),其中FN(False Negative)表示假反例,即實際為正例但被預測為負例的樣本數量。

2.2意義

意義:召回率體現了模型能夠正確識別出的正例的能力。在一些場景中,如疾病檢測,希望盡可能多地檢測出真正患病的人,即使可能會有一些誤判,此時召回率就非常重要。較高的召回率表示模型能夠找到大部分實際為正例的樣本,不會遺漏太多真正的正例。

2.3數值接近1

數值接近 1:表明模型能夠幾乎找出所有實際為正例的樣本。例如在疾病檢測場景中,召回率接近 1 意味著幾乎所有患病的樣本都被模型檢測出來了,很少有漏檢的情況,模型在捕捉正例方面具有很強的能力。

2.4數值在0.5左右

數值在 0.5 左右:說明模型只能識別出一半左右的實際正例樣本,存在較多的漏檢情況。這可能是因為模型對正例的特征學習不夠充分,或者正例樣本在數據集中分布不均衡,導致模型未能很好地學習到正例的各種特征,從而無法準確識別所有正例。

2.5數值接近0

數值接近 0:表示模型幾乎無法找到實際的正例樣本,漏檢情況非常嚴重。模型可能根本沒有學習到正例的有效特征,或者模型過于保守,將大量正例錯誤地判斷為負例,需要對模型進行重新訓練或調整,以提高其對正例的捕捉能力。

三、Accuracy(準確率)

3.1定義

定義:預測正確的樣本數占總樣本數的比例。計算公式為:
Accuracy= TP+TN/(TP+TN+FP+FN),其中TN(True Negative)表示真反例,即實際為負例且被預測為負例的樣本數量。

3.2意義

意義:準確率是一個較為直觀的指標,用于衡量模型整體的預測正確程度。但當數據集中正負樣本比例不均衡時,準確率可能會產生誤導。例如,在一個正負樣本比例為 9:1 的數據集上,即使模型將所有樣本都預測為正例,也能獲得 90% 的準確率,但實際上模型并沒有很好地學習到負例的特征。

3.3數值接近1

數值接近 1:表示模型整體的預測準確性很高,無論是正例還是負例,模型都能準確地進行分類。在數據分布較為均衡的情況下,準確率高說明模型對數據的擬合效果好,能夠學習到數據中的有效特征,從而做出準確的預測。

3.4數值接近0.5左右

數值在 0.5 左右:說明模型的預測結果與隨機猜測差不多,模型可能沒有學習到數據中的任何有效信息,無法對樣本進行準確分類。這可能是由于數據特征與目標變量之間沒有明顯的關聯,或者模型過于簡單,無法捕捉到數據中的復雜模式。

3.5數值接近0

數值接近 0:表示模型的預測結果幾乎都是錯誤的,這是一種極端情況,通常是由于模型存在嚴重的問題,如模型結構錯誤、數據預處理不當、訓練過程出現異常等,導致模型完全無法對數據進行正確的分類。

四、F1 值

4.1定義

定義:精確率和召回率的調和平均數,計算公式為:
F1= 2×Precision×Recall/(Precision+Recall)。

4.2意義

意義:F1 值綜合了精確率和召回率兩個指標,能夠更全面地反映模型的性能。當精確率和召回率都較高時,F1 值也會較高。在實際應用中,F1 值常用于平衡精確率和召回率,特別是在兩者之間存在權衡時,F1 值可以作為一個綜合的評估指標來選擇最優的模型。

4.3數值接近1

數值接近 1:說明模型在精確率和召回率上都表現出色,能夠在準確識別正例的同時,盡可能地找出所有正例,模型的綜合性能優秀。例如在信息檢索系統中,F1 值接近 1 表示系統既能準確地返回相關的檢索結果(精確率高),又能涵蓋大部分相關的信息(召回率高),能夠很好地滿足用戶的需求。

4.4數值0.5左右

數值在 0.5 左右:意味著模型在精確率和召回率之間存在一定的平衡,但整體性能一般。可能是精確率和召回率其中一個指標較高,而另一個指標較低,導致兩者的調和平均數不高。此時需要分析具體是哪個指標拖了后腿,進而針對性地改進模型,以提高 F1 值。

4.5數值接近0

數值接近 0:表明模型在精確率和召回率方面的表現都很差,可能存在嚴重的分類錯誤或對正例的識別能力不足,模型需要進行全面的優化和調整,包括重新選擇特征、調整模型結構、優化訓練參數等,以提高精確率和召回率,進而提升 F1 值。

五、ROC 曲線與 AUC

5.1ROC曲線

ROC 曲線: Receiver Operating Characteristic 曲線,以假正率(FPR)為橫坐標,真正率(TPR)為縱坐標繪制的曲線。其中
FPR= FP/(FP+TN),TPR= TP/(TP+FN)。ROC 曲線展示了模型在不同閾值下的分類性能,曲線越靠近左上角,說明模型的性能越好。

5.2AUC

AUC: Area Under the Curve,即 ROC 曲線下的面積。AUC 的值介于 0 到 1 之間,AUC 越大,說明模型的性能越好。AUC 為 1 表示模型能夠完美地將正負樣本區分開,AUC 為 0.5 表示模型的預測結果與隨機猜測相當。

5.3AUC接近1

AUC 接近 1:說明 ROC 曲線靠近左上角,模型具有很強的區分正負樣本的能力。在不同的閾值下,模型都能較好地將正例和負例區分開來,很少出現將正例誤判為負例或負例誤判為正例的情況,模型的性能非常優秀。
AUC 在 0.5 到 0.8 之間:表示模型具有一定的區分正負樣本的能力,但性能一般。ROC 曲線位于對角線(AUC = 0.5)上方,說明模型的預測結果優于隨機猜測,但還有較大的提升空間。可能需要進一步優化模型,調整特征或參數,以提高模型的性能。

5.4AUC接近0.5

AUC 接近 0.5:說明模型的區分能力與隨機猜測相當,ROC 曲線接近對角線。這意味著模型可能沒有學習到有效的特征來區分正負樣本,需要重新審視數據和模型,查找問題所在,可能需要重新進行特征工程或選擇更合適的模型。

5.5AUC小于0.5

AUC 小于 0.5:這種情況比較罕見,通常表示模型存在嚴重問題,其預測結果甚至不如隨機猜測。可能是模型訓練過程出現錯誤,或者數據存在嚴重的偏差或噪聲,導致模型學到了錯誤的模式,需要對整個建模過程進行全面檢查和修正。

六、平均絕對誤差(MAE)

6.1定義

定義:預測值與真實值之間絕對誤差的平均值。

6.2意義

意義:MAE 直觀地反映了模型預測值與真實值之間的平均誤差大小,其值越小,說明模型的預測結果越接近真實值,預測精度越高。

6.3數值接近0

數值接近 0:表示模型的預測值與真實值之間的平均差異非常小,模型能夠準確地預測出目標值,預測精度很高。例如在預測股票價格走勢時,MAE 接近 0 說明模型能夠準確地預測出股票的實際價格,誤差在可接受的范圍內,模型具有很強的預測能力。

6.4數值較大

數值較大:說明模型的預測值與真實值之間存在較大的平均差異。例如在房價預測中,如果 MAE 較大,意味著模型預測的房價與實際房價有較大的偏差,可能是模型沒有充分考慮到影響房價的各種因素,或者數據中存在一些異常值影響了模型的準確性,需要對模型進行改進或對數據進行進一步的處理。

七、均方誤差(MSE)

7.1定義

定義:預測值與真實值之間誤差平方的平均值。

7.2意義

意義:MSE 也用于衡量模型預測值與真實值之間的差異程度。由于對誤差進行了平方運算,MSE 會對較大的誤差給予更大的權重,因此對異常值更為敏感。MSE 越小,模型的性能越好。在一些優化問題中,常以最小化 MSE 為目標來訓練模型。

7.3數值接近0

數值接近 0:表明模型的預測值與真實值之間的誤差平方和很小,模型的預測效果非常好。與 MAE 類似,MSE 接近 0 表示模型能夠準確地擬合數據,對目標值的預測精度高,在各種預測任務中都屬于理想的狀態。

7.4數值較大

數值較大:由于 MSE 對誤差進行了平方運算,所以較大的 MSE 值說明模型存在較大的誤差,而且對較大的誤差給予了更大的權重。這可能是因為模型過于簡單,無法捕捉到數據中的復雜關系,或者存在過擬合現象,導致在訓練集上表現良好,但在測試集上誤差較大。需要對模型進行調整,如增加模型的復雜度、采用正則化方法等,以降低 MSE 值,提高模型的性能。


本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/76137.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/76137.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/76137.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Windows 圖形顯示驅動開發-WDDM 2.4功能-GPU 半虛擬化(十一)

注冊表設置 GPU虛擬化標志 GpuVirtualizationFlags 注冊表項用于設置半虛擬化 GPU 的行為。 密鑰位于: DWORD HKLM\System\CurrentControlSet\Control\GraphicsDrivers\GpuVirtualizationFlags 定義了以下位: 位描述0x1 ? 為所有硬件適配器強制設置…

Vue 的 nextTick 是如何實現的?

參考答案: nextTick 的本質將回調函數包裝為一個微任務放入到微任務隊列,這樣瀏覽器在完成渲染任務后會優先執行微任務。 nextTick 在 Vue2 和 Vue3 里的實現有一些不同: 1. Vue2 為了兼容舊瀏覽器,會根據不同的環境選擇不同包裝策…

安卓開發之LiveData與DataBinding

LiveData——生命周期感知 LiveData 是 Android Jetpack 提供的一個生命周期感知的數據持有者類,它可以用于持有數據并在數據發生變化時通知觀察者。LiveData 常與 ViewModel 配合使用,幫助簡化 UI 層和數據層之間的交互,確保 UI 在合適的生…

TCP協議與wireshark抓包分析

一、tcp協議格式 1. 源端口號 : 發送方使用的端口號 2. 目的端口號 : 接收方使用的端口號 3. 序號: 數據包編號 , tcp 協議為每個數據都設置編號,用于確認是否接收到相應的包 4. 確認序列號 : 使用 tcp 協議接收到數據包&#xff0c…

《HelloGitHub》第 108 期

興趣是最好的老師,HelloGitHub 讓你對開源感興趣! 簡介 HelloGitHub 分享 GitHub 上有趣、入門級的開源項目。 github.com/521xueweihan/HelloGitHub 這里有實戰項目、入門教程、黑科技、開源書籍、大廠開源項目等,涵蓋多種編程語言 Python、…

VITA 模型解讀,實時交互式多模態大模型的 pioneering 之作

寫在前面:實時交互llm 今天回顧一下多模態模型VITA,當時的背景是OpenAI 的 GPT-4o 驚艷亮相,然而,當我們將目光投向開源社區時,卻發現能與之匹敵的模型寥寥無幾。當時開源多模態大模型(MLLM),大多在以下一個或多個方面存在局限: 模態支持不全:大多聚焦于文本和圖像,…

VLAN的高級特性

前言: 1:華為VLAN聚合通過邏輯分層設計,將廣播域隔離與子網共享結合,既解決了IP地址浪費問題,又實現了靈活的網絡管理 2:MUX VLAN(Multiplex VLAN)提供了一種通過VLAN進行網絡資源控…

制作cass高程點塊定義——cad c#二次開發——待調試

public class Demo{[CommandMethod("xx")]public void Demo1(){using var tr1 new DBTrans();var doc Application.DocumentManager.MdiActiveDocument; var db doc.Database;var ed doc.Editor;var 圓心 new Point3d(0, 0, 0); var 半徑 10.0;using (var tr …

pod幾種常用狀態

在 Kubernetes 中,Pod 是最小的可部署單元,Pod 的狀態反映了其當前的運行狀況。以下是幾種常見的 Pod 狀態: 1. Pending 描述: Pod 已被 Kubernetes API Server 接收并創建,但還沒有開始運行在任何節點上。原因: Pod 資源不足&a…

04 單目標定實戰示例

看文本文,您將獲得以下技能: 1:使用opencv進行相機單目標定實戰 2:標定結果參數含義和數值分析 3:Python繪制各標定板姿態,查看圖像采集多樣性 4:如果相機畫幅旋轉90,標定輸入參數該如何設置? 5:圖像尺寸縮放,標定結果輸出有何影響? 6:單目標定結果應用類別…

DevEco Studio編輯器的使用-代碼code Linter檢查

Code Linter代碼檢查 Code Linter針對ArkTS/TS代碼進行最佳實踐/編程規范方面的檢查。檢查規則支持配置,配置方式請參考配置代碼檢查規則。 開發者可根據掃描結果中告警提示手工修復代碼缺陷,或者執行一鍵式自動修復,在代碼開發階段&#x…

wokwi arduino mega 2560 - 模數與數模轉換AD和DA

截圖&#xff1a; 20.53 黃燈滅 不報警 205.77 黃燈亮 報警 鏈接&#xff1a; https://wokwi.com/projects/415345595312267265 代碼&#xff1a; 詳細注釋版&#xff1a;AD和I2C仿真實驗案例程序 cpp #include <LiquidCrystal_I2C.h>// 定義I2C地址和LCD的行列數 #de…

如何使不同的窗體控件,適應不同分辨率的屏幕?

問題 當屏幕分辨率提高或降低時&#xff0c;原分辨率顯示正常的控件&#xff0c;將變得很小或很大&#xff0c;字體也變得太大或太小。 解決辦法 當分辨率變化時&#xff0c;采用遞歸的方法&#xff0c;對所有的控件放大或縮小。 public static void MainForm_Load(object s…

虛擬機(一):Java 篇

虛擬機&#xff08;一&#xff09;&#xff1a;Java 篇 虛擬機&#xff08;二&#xff09;&#xff1a;Android 篇 架構 運行時數據區&#xff1a; 棧&#xff1a; 堆&#xff1a; 堆&#xff1a;通過new創建的對象都在堆中分配。OutOfMemoryError TLAB(Thread Local All…

硬件基礎--14_電功率

電功率 電功率:指電流在單位時間內做的功(表示用電器消耗電能快慢的一個物理量)。 單位:瓦特(W)&#xff0c;簡稱瓦。 公式:PUI(U為電壓&#xff0c;單位為V&#xff0c;i為電流&#xff0c;單位為A&#xff0c;P為電功率&#xff0c;單位為W)。 單位換算:進位為1000&#xff…

更高的效率——MyBatis-plus

一、什么是MyBatis-plus&#xff1f; MyBatis-plus是MyBatis的增強工具&#xff0c;在MyBatis基礎上只做增強不做改變&#xff0c;可以簡化基礎的CRUD操作&#xff08;通過繼承 BaseMapper 接口可直接使用預定義的增刪改查方法&#xff09; 二、MyBatis-plus快速入門 2.1 準備…

【算法基礎】遞歸與遞推

目錄 遞歸實現指數型枚舉 題目 算法解析 遞歸實現排列型枚舉 題目 算法解析 費解的開關 題目 算法解析 遞歸實現組合型枚舉 題目 算法解析 帶分數 題目 算法解析 飛行員兄弟 題目 算法解析 翻硬幣 題目 算法解析 遞歸實現指數型枚舉 題目 算法…

Java 大視界 -- Java 大數據在智慧礦山設備故障預測與預防性維護中的技術實現(163)

&#x1f496;親愛的朋友們&#xff0c;熱烈歡迎來到 青云交的博客&#xff01;能與諸位在此相逢&#xff0c;我倍感榮幸。在這飛速更迭的時代&#xff0c;我們都渴望一方心靈凈土&#xff0c;而 我的博客 正是這樣溫暖的所在。這里為你呈上趣味與實用兼具的知識&#xff0c;也…

綜合實驗一

實驗拓撲圖&#xff1a; 實驗要求&#xff1a; 1,內網IP地址使用172.16.0.0/16分配 2,SW1和SW2之間互為備份 3,VRRP/STP/VLAN/Eth-trunk均使用 4,所有PC均通過DHCP獲取IP地址 5,ISP只能配置IP地址 6,所有電腦可以正常訪問ISP路由器環回 實驗步驟&#xff1a; 步驟1&…

snort檢測端口掃描工具

前面兩篇文章介紹了snort3相關知識和Ubuntu上的安裝配置Ubuntu22.04上Snort3的安裝與基本配置 -CSDN博客 和Snort規則定義并進行的簡單的測試Snort規則定義與測試 -CSDN博客&#xff0c;接下來我將介紹如何編寫一個簡單的檢測端口掃描的規則進行檢測 一、實驗環境 攻擊機&…