Deep Evidential Regression

在這里插入圖片描述


摘要


翻譯:

確定性神經網絡(NNs)正日益部署在安全關鍵領域,其中校準良好、魯棒且高效的不確定性度量至關重要。本文提出一種新穎方法,用于訓練非貝葉斯神經網絡以同時估計連續目標值及其關聯證據,從而學習偶然和認知不確定性。我們通過在原高斯似然函數上放置證據先驗,并訓練神經網絡推斷證據分布的參數來實現這一目標。此外,我們在訓練中施加先驗約束,當預測證據與正確輸出未對齊時對模型進行正則化。該方法不依賴推理期間的采樣,也無需使用分布外(OOD)樣本進行訓練,從而實現高效且可擴展的不確定性學習。我們在多個基準測試中展示了良好校準的不確定性度量,可擴展至復雜計算機視覺任務,并對抗性樣本和OOD測試樣本具有魯棒性。

研究背景?安全關鍵領域需要確定性神經網絡的可靠不確定性度量
??創新方法?1. 使用證據先驗替代傳統高斯似然、2. 網絡直接輸出證據分布超參數
??技術突破?同時建模: 偶然不確定性(數據噪聲) 認知不確定性(模型置信度)
??訓練機制?引入證據對齊的正則化項,懲罰預測證據與真實輸出的偏差
??效率優勢?無需: 推理時采樣、 OOD訓練數據
驗證效果?在以下場景有效標準基準測試、 復雜CV任務、 對抗/OOD樣本

傳統模式

在這里插入圖片描述
在這里插入圖片描述

class GaussianNN(nn.Module):def __init__(self, input_dim):super().__init__()self.fc = nn.Linear(input_dim, 2)  # 輸出mu和log_sigmadef forward(self, x):output = self.fc(x)mu = output[:, 0]          # 均值預測log_sigma = output[:, 1]   # 對數方差(數值穩定)sigma = torch.exp(log_sigma)return mu, sigmadef train_step(x, y_true):mu, sigma = model(x)loss = 0.5 * (torch.log(sigma**2) + (y_true - mu)**2 / sigma**2)loss.mean().backward()

案例
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

1.引言

翻譯

基于回歸的神經網絡(NNs)正被應用于計算機視覺[15]、機器人與控制[1,6]等安全關鍵領域,在這些領域中,推斷模型不確定性的能力對于最終的大規模應用至關重要。此外,精確且校準良好的不確定性估計有助于解釋置信度、捕捉分布外(OOD)測試樣本的領域偏移,并識別模型可能失敗的情況。

神經網絡的不確定性可以分為兩個方面進行建模:(1) 數據中的不確定性,稱為偶然不確定性(aleatoric uncertainty);(2) 預測中的不確定性,稱為認知不確定性(epistemic uncertainty)。雖然偶然不確定性可以通過數據直接學習,但認知不確定性的估計方法也有多種,例如貝葉斯神經網絡(Bayesian NNs),它在網絡權重上設置概率先驗,并通過采樣來近似輸出方差[25]。然而,貝葉斯神經網絡面臨一些限制,包括在給定數據的情況下難以直接推斷權重的后驗分布、推理過程中需要采樣帶來的計算開銷,以及如何選擇權重先驗的問題。

相比之下,證據深度學習(Evidential Deep Learning)將學習過程形式化為一個證據獲取過程[42,32]。每個訓練樣本都為一個學習到的高階證據分布提供支持。從該分布中采樣可得到低階似然函數的實例,而數據正是從中生成的。不同于貝葉斯神經網絡在網絡權重上設置先驗,證據方法直接對似然函數設置先驗。通過訓練神經網絡輸出高階證據分布的超參數,可以在無需采樣的情況下,學習到有依據的認知和偶然不確定性的表示。

迄今為止,證據深度學習主要面向離散分類問題[42,32,22],并且通常需要定義明確的距離度量以連接最大不確定性的先驗[42],或依賴于使用OOD數據進行訓練以提升模型不確定性[32,31]。相比之下,連續回歸問題缺乏明確定義的距離度量來正則化所推斷的證據分布。此外,在大多數應用場景中預先定義合理的OOD數據集并不容易;因此,亟需僅從分布內訓練集中獲得對OOD數據具有校準良好不確定性的方法。

我們提出了一種新的方法,通過學習證據分布來建模回歸網絡的不確定性(如圖1所示)。具體而言,本文做出了以下貢獻:

  1. 提出了一種新穎且可擴展的方法,用于在回歸問題中學習認知和偶然不確定性,無需在推理或訓練過程中進行采樣;
  2. 提出了適用于連續回歸問題的證據正則化方法,用于懲罰誤差和OOD示例上的錯誤證據;
  3. 在基準和復雜的視覺回歸任務上評估了認知不確定性,并與當前最先進的神經網絡不確定性估計技術進行了比較;
  4. 在OOD和對抗性擾動的測試輸入數據上評估了魯棒性和校準性能。
    傳統神經網絡vs貝葉斯神經網絡

貝葉斯神經網絡就像個"會承認自己會犯錯"的學霸??

傳統神經網絡(普通學霸)??貝葉斯神經網絡(謙虛學霸)
??特點??:每次考試都斬釘截鐵給答案??特點??:會給答案范圍
“這道題答案絕對是3.14!”“答案可能是3.1到3.2之間,我有80%把握”
實際可能是3.12,但從不告訴你它有多確定同時告訴你答案和可信度

工作原理類比??
??步驟1:考前劃重點(先驗)??
老師說:“考試重點在1-3章”(這就是先驗知識)
普通學霸:只背這3章,其他完全不看
貝葉斯學霸:重點看1-3章,但也會瞄一眼其他章節
??步驟2:考試答題(訓練)??
發現第4章也考了
貝葉斯學霸:
“看來不能全信老師,要調整復習策略”
→ 更新知識分布(計算后驗)
步驟3:回答不確定的題(預測)??
遇到超綱題時:
普通學霸:硬著頭皮蒙一個答案
貝葉斯學霸:
“這題我沒把握,答案可能在A到D之間”
→ 通過多次思考(采樣)給出概率范圍
4. 為什么需要多次"思考"???
貝葉斯學霸會這樣做:
第一次想:可能是B
第二次想:也可能是C

綜合100次思考結果:
60%概率是B
30%概率是C
10%概率是其他
??最終答案??:最可能是B,但有不確定性(方差)
??貝葉斯實際應用例子??
??醫療診斷場景??:
普通AI:
“患者有80%概率患癌”(醫生可能過度治療)
貝葉斯AI:
“患癌概率60%-85%,因為模型沒見過類似病例”
→ 提醒醫生需要進一步檢查
??貝葉斯關鍵優勢??
??知道什么時候不確定??:遇到沒見過的題型會明說
??能利用經驗??:把老師劃重點的知識融入判斷
??避免過度自信??:不會對蒙的答案打包票
本文
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

2. 從數據中建模不確定性

在這里插入圖片描述
在這里插入圖片描述在這里插入圖片描述

在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

3. 回歸中的證據不確定性

在這里插入圖片描述
NIG分布是高斯分布與逆伽瑪分布的聯合分布在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

在這里插入代碼片

4.實驗

在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

在這里插入圖片描述

下面展示了這幾種關系圖

示例像素級深度預測及其不確定性
圖像集展示了不同模型(如Dropout、Ensemble和Evidential)在處理同一場景時的表現。每種模型對應的展示包括:原始RGB圖像、該場景的真實深度圖、模型預測出的深度圖、模型預測誤差的絕對值圖以及模型估計的不確定性圖。
預測置信度水平與觀測誤差的關系
對比了不同方法(同樣包括Dropout、Ensemble和Evidential)在不同的預測置信度水平下的均方根誤差(RMSE)。通過這些曲線,可以直觀地看出隨著置信度的提高,各個模型的誤差變化趨勢,進而評估它們在不同置信度水平上的性能。
模型不確定性的校準情況
校準圖表描繪了模型期望置信度水平與實際觀測到的置信度水平之間的關系。理想情況下,這兩者應該完全吻合(即圖表中的 𝑦 = 𝑥 y=x 線)。此外,還提供了放大版的插圖來詳細展示每個模型的校準誤差,幫助理解不同模型在校準不確定性方面的能力差異。

在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

下面展示了這幾種關系圖

A. Cumulative density function (CDF) of ID and OOD entropy for tested methods
這部分通過累積密度函數(CDF)展示了不同方法(ID vs OOD)在熵上的分布情況。它可以幫助我們理解不同模型在識別OOD樣本時的能力,理想情況下OOD樣本應具有更高的熵值。
B. Uncertainty (entropy) comparisons across methods
此部分使用箱形圖對比了不同方法在ID與OOD數據集上的熵值。這有助于直觀地比較各種方法在不確定性估計上的差異,尤其是在區分ID和OOD數據方面。
C. Full density histograms of entropy estimated by evidential regression on ID and OOD data
展示了基于證據回歸方法對ID和OOD數據估算出的熵值的概率密度直方圖。這有助于深入了解不同數據集下模型輸出的不確定性分布情況。
D. Sample images
提供了一些樣本圖像的例子,包括RGB輸入、預測深度圖以及對應的熵圖。這部分通常用于視覺化展示模型預測結果及其不確定性區域,幫助理解和解釋模型的行為。

在這里插入圖片描述

在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

下面展示了這幾種關系圖

RMSE vs Noise ε:展示了對抗噪聲強度與均方根誤差(RMSE)之間的關系。
Uncertainty vs Noise ε:展示了對抗噪聲強度與估計的不確定性之間的關系。
CDF of Entropy:顯示了不同對抗噪聲強度下熵的累積分布函數(CDF)。
Visualization of Increasing Adversarial Perturbation:通過一系列圖像展示了隨著對抗擾動增加,輸入圖像、深度標簽、預測深度、絕對誤差及預測不確定性的變化情況。
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

補充知識:t分布

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/82676.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/82676.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/82676.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

每天掌握一個Linux命令 - sqlite3

Linux 命令工具 sqlite3 使用指南 一、工具概述 sqlite3 是 SQLite 數據庫的命令行工具,用于在 Linux 系統中直接操作 SQLite 數據庫(輕量級、無服務器、嵌入式關系型數據庫)。 核心特點: 無需安裝數據庫服務,直接通…

leetcode:2160. 拆分數位后四位數字的最小和(python3解法,數學相關算法題)

難度:簡單 給你一個四位 正 整數 num 。請你使用 num 中的 數位 ,將 num 拆成兩個新的整數 new1 和 new2 。new1 和 new2 中可以有 前導 0 ,且 num 中 所有 數位都必須使用。 比方說,給你 num 2932 ,你擁有的數位包括…

Python打卡第38天

浙大疏錦行 作業: 了解下cifar數據集,嘗試獲取其中一張圖片 import torch import torch.nn as nn import torch.optim as optim from torch.utils.data import DataLoader , Dataset # DataLoader 是 PyTorch 中用于加載數據的工具 from torchvision im…

AI 數據采集實戰指南:基于 Bright Data 快速獲取招標訊息

AI 數據采集實戰指南:基于Bright Data快速獲取招標訊息 在招標行業中,快速、準確地獲取招標公告、項目詳情、投標截止日期和其他關鍵招標信息,是投標企業提高競標成功率的核心競爭力。然而,招標信息往往分散在不同的平臺和網頁&a…

TCP 三次握手,第一次握手報文丟失會發生什么?

文章目錄 RTO(Retransmission Timeout)注意 客戶端想與服務端建立 TCP 連接時,先發送 SYN 報文,在這之后,如果客戶端遲遲收不到服務端的 SYNACK 報文,就會觸發「超時重傳」機制,重新發送 SYN 報文,而且重傳…

【DeepSeek論文精讀】12. DeepSeek-Prover-V2: 通過強化學習實現子目標分解的形式化數學推理

歡迎關注[【AIGC論文精讀】](https://blog.csdn.net/youcans/category_12321605.html)原創作品 【DeepSeek論文精讀】1. 從 DeepSeek LLM 到 DeepSeek R1 【DeepSeek論文精讀】10. DeepSeek-Coder-V2: 突破閉源模型在代碼智能領域的障礙 【DeepSeek論文精讀】12. De…

第十一節:第一部分:正則表達式:應用案例、爬取信息、搜索替換

正則表達式介紹 String提供的正則表達式的方法的書寫規則 正則表達式總結 正則表達式作用: 作用三:搜索替換 案例分析及代碼(圖片解析) 代碼: 代碼一:校驗手機號和郵箱格式是否正確 package com.itheima.…

視頻監控匯聚平臺EasyCVR工業與安全監控:防爆攝像機的安全應用與注意事項

石油、化工、煤礦等行業存在易燃易爆氣體、粉塵,普通監控設備易因電火花、高溫引發爆炸火災。隨著工業規模擴大,安全生產監控需求激增,防爆攝像機成為保障安全的關鍵。加之國家法規與行業標準對危險環境監控設備要求嚴格,規范其應…

重學計算機網絡之命令整理

配置權限相關 1.用戶執行模式:查看網絡設備狀態信息 2.特權執行模式:查看和修改網絡設備的狀態和控制信息 3.全局配置模式:對整個網絡設備進行全局性參數配置 4.接口配置模式:對網絡設備的接口進行配置 enable #進入特權執行模式…

數據結構與算法Day3:緒論第三節抽象數據類型、算法及其描述

各位親愛的讀者,大家好!今天博主給大家帶來的內容是C語言數據結構與算法當中抽象數據類型、算法及其分析的相關知識。 一.抽象數據類型 抽象數據類型:指的是用戶進行軟件系統設計時從問題的數據模型中抽象出來的邏輯數據結構和邏輯數據結構上…

ABC 350

E. Toward 0 從大規模向小規模,用記憶化搜索,只需要分好類,有哪幾種搜法。 期望實際上就是把每一種情況的答案答案都算出來,然后取個平均值 ,并不困難。 f ( i ) [ f ( i / 6 ) f ( i / 5 ) f ( i / 4 ) f ( i / 3…

多相電機驅動控制學習(1)——基于雙dq坐標系的六相/雙三相PMSM驅動控制

1.引言 最近想學習一下多相電機。想從相對簡單的開始吧,先學一個基于雙dq的六相/雙三相PMSM驅動控制(考慮中性點隔離以及不隔離的情況,即考慮是否有零序電流回路),后面有時間再學學基于VSD的六相/雙三相PMSM驅動控制。…

筆記: 在WPF中ContentElement 和 UIElement 的主要區別

一、目的:簡要姐掃在WPF中ContentElement 和 UIElement 的主要區別 ContentElement 和 UIElement 是 WPF 中的兩個基類,它們在功能和用途上有顯著的區別。 二、主要區別 ContentElement 主要特點: ? 沒有視覺表示: ContentElement 本身不直接渲染任…

Android-Glide學習總結

Glide三級緩存? 面試官 我看你簡歷里提到熟悉 Glide,能聊聊它的緩存機制嗎?比如加載圖片的時候,Glide 是怎么決定從內存還是磁盤讀取的? ?你? 哦,Glide 的緩存機制是吧?嗯,這個我之前在做項…

安卓證書的申請(保姆級圖文)

目錄 確認安裝了對應版本的jdk生成證書文件1. -genkey2. -alias test_certalias3. -keyalg RSA4. -keysize 20485. -validity 365006. -keystore test_cert.keystore 查看證書內容總結 歡迎關注 『發現你走遠了』 博客,持續更新中 歡迎關注 『發現你走遠了』 博客&a…

Unity性能優化

SetPass calls表示在當前攝像機的渲染過程中,Unity切換著色器通道(Shader Pass)來渲染游戲對象的次數。一個著色器(Shader)可以包含多個著色器通道,每個著色器通道可以通過不同的方式來渲染游戲對象。但每次…

Python+AI Agent:解鎖MCP Servers的智能潛力

💝💝💝歡迎蒞臨我的博客,很高興能夠在這里和您見面!希望您在這里可以感受到一份輕松愉快的氛圍,不僅可以獲得有趣的內容和知識,也可以暢所欲言、分享您的想法和見解。 推薦:「storms…

uni-app學習筆記十五-vue3頁面生命周期(一)

頁面生命周期概覽 vue3頁面生命周期如下圖所示: onLoad 此時頁面還未顯示,沒有開始進入的轉場動畫,頁面dom還不存在。 所以這里不能直接操作dom(可以修改data,因為vue框架會等待dom準備后再更新界面)&am…

【排序算法】快速排序詳解--附詳細流程代碼

快速排序算法 介紹 快速排序(Quick Sort)是一種高效的分治排序算法,由英國計算機科學家 Tony Hoare 于 1960 年提出。它是實際應用中最常用的排序算法之一。快速排序的基本思想是:選擇一個"基準"(pivot&am…

【監控】Prometheus中的告警機制介紹

prometheus實戰之三:告警規則_驗證prometheus告警規則-CSDN博客 Prometheus是一款開源的系統監控和告警工具,其告警功能是保障系統穩定運行的重要部分。以下將從告警的整體架構、核心概念、規則配置以及具體的通知流程等方面對Prometheus中的告警進行介…