【LLIE專題】LLIE低照度圖像結構先驗提取方法

在這里插入圖片描述

Zero-Shot Day-Night Domain Adaptation with a Physics Prior(ICCV,2021)

  • 專題介紹
  • 一、研究背景
  • 二、方法
        • 1. 物理反射模型與顏色不變特征的推導(原理推導、物理依據)
        • 2. 顏色不變特征的計算(特征計算公式整個過程)
        • 3. 可訓練的CIConv層設計(將第二節的計算過程卷積化)
  • 三、實驗結果
        • 1. 合成圖像分類實驗
        • 2. 自然圖像分類實驗
        • 3. 語義分割實驗
  • 四、總結
      • 在暗光增強任務作為結構先驗應用的前景

本文將對 Zero-Shot Day-Night Domain Adaptation with a Physics Prior,這篇文章進行講解。參考資料如下:

[1] 文章
[2] 代碼


專題介紹

在低光照環境下,傳統成像設備往往因畫面昏暗、細節丟失而受限。LLIE(低照度暗光增強)技術應運而生,它通過提升圖像亮度、對比度,減少噪點并恢復色彩細節,讓暗夜變得清晰可見。

LLIE技術從傳統方法如直方圖均衡化、Retinex模型等起步,近年來借助深度學習,尤其是卷積神經網絡(CNN),GAN模型,擴散模型實現了質的飛躍。這些算法能自動學習圖像特征,精準處理低光照圖像,效果顯著優于傳統技術。

本專題將聚焦LLIE技術的核心原理、應用案例及最新進展,讓我們一起見證LLIE如何點亮暗夜,開啟視覺新視界!歡迎一起探討交流!

系列文章如下
【1】ZeroDCE
【2】HVI
【3】CLIP-LIT
【4】GLARE
【5】Retinexformer
【6】SG-LLIE
【7】GPP-LLIE
【8】FusionNet
【9】EnligtenGAN
【10】PTG
【11】CSNorm


一、研究背景

本文介紹了SG-LLIE這篇文章中的結構先驗計算方法。
該論文在晝夜域適應方面探索了零樣本的情況。傳統的域適應是在一個域上訓練,然后利用測試集中的無標簽數據來適應目標域,但收集測試數據既貴又有時甚至收集不到。所以作者不依賴測試數據圖像,而是利用從基于物理的反射模型中得出的視覺歸納先驗來做域適應。作者把一些顏色不變邊緣檢測器設計成卷積神經網絡中的可訓練層,還評估了這些層對光照變化的穩健性。結果顯示,這種顏色不變層能減少整個網絡中特征圖激活的晝夜分布差異,而且在合成和自然數據集上的分類、分割、地點識別等多種任務中,都能提升零樣本晝夜域適應的性能。

二、方法

方案主要圍繞顏色不變卷積層(CIConv) 的設計展開,該卷積層基于物理反射模型推導的顏色不變特征,用于解決晝夜光照變化導致的域偏移問題。具體內容如下:

1. 物理反射模型與顏色不變特征的推導(原理推導、物理依據)
  • 基礎模型:方法基于Kubelka-Munk(KM)反射模型,該模型描述了物體反射光的光譜特性,公式為:
    E(λ,x)=e(λ,x)((1?ρf(x))2R∞(λ,x)+ρf(x))E(\lambda, x)=e(\lambda, x)\left(\left(1-\rho_{f}(x)\right)^{2} R_{\infty}(\lambda, x)+\rho_{f}(x)\right)E(λ,x)=e(λ,x)((1?ρf?(x))2R?(λ,x)+ρf?(x))
    其中,EEE 為反射光光譜,eee 為光源光譜,R∞R_{\infty}R?為物體材料反射率,ρf\rho_{f}ρf?為菲涅爾反射系數,λ\lambdaλ為光的波長,xxx 為圖像空間位置。
  • 顏色不變特征:通過對上述模型的簡化假設(這里感興趣的讀者可以詳細了解一下KM反射模型,本文不做過多介紹),推導得出多種顏色不變邊緣檢測器(如E、W、C、N、H),這些特征僅依賴物體材料屬性 R∞R_{\infty}R?,不受光照強度、顏色、場景幾何(如陰影)等因素影響(表1列出了各特征的不變性屬性)。
    在這里插入圖片描述
2. 顏色不變特征的計算(特征計算公式整個過程)
  • RGB到光譜特征的轉換:利用高斯顏色模型(高斯顏色模型(Gaussian Color Model)是一種用于圖像邊緣檢測的經典方法,核心思想是利用高斯核函數對圖像的顏色(或灰度)信息進行濾波,通過計算像素點在空間和顏色維度上的梯度變化來檢測邊緣。),將RGB圖像轉換為與光譜相關的特征(EEEEλE_{\lambda}Eλ?EλλE_{\lambda\lambda}Eλλ?),公式為:
    [E(x,y)Eλ(x,y)Eλλ(x,y)]=[0.060.630.270.30.04?0.350.34?0.60.17][R(x,y)G(x,y)B(x,y)]\left[\begin{array}{c}E(x, y) \\ E_{\lambda}(x, y) \\ E_{\lambda \lambda}(x, y)\end{array}\right]=\left[\begin{array}{ccc}0.06 & 0.63 & 0.27 \\ 0.3 & 0.04 & -0.35 \\ 0.34 & -0.6 & 0.17\end{array}\right]\left[\begin{array}{c}R(x, y) \\ G(x, y) \\ B(x, y)\end{array}\right]?E(x,y)Eλ?(x,y)Eλλ?(x,y)??=?0.060.30.34?0.630.04?0.6?0.27?0.350.17???R(x,y)G(x,y)B(x,y)??
    其中,EEE 為光強,EλE_{\lambda}Eλ?EλλE_{\lambda\lambda}Eλλ?分別為一二階光譜導數。
  • 空間導數計算:對于每個光譜特征(如EEE),通過與高斯導數核進行卷積計算空間導數。以ExE_xEx?EEE在x方向的空間導數)為例,計算公式為:
    Ex(x,y,σ)=∑t∈ZE(t,y)?g(x?t,σ)?xE_{x}(x, y, \sigma)=\sum_{t \in \mathbb{Z}} E(t, y) \frac{\partial g(x-t, \sigma)}{\partial x}Ex?(x,y,σ)=tZ?E(t,y)?x?g(x?t,σ)?
    其中,g(x?t,σ)g(x-t, \sigma)g(x?t,σ)是標準差為σ\sigmaσ的高斯函數,?g?x\frac{\partial g}{\partial x}?x?g?為其x方向的導數,通過滑動窗口與圖像中的EEE值卷積,得到x方向的空間導數。類似地,可計算y方向的空間導數(如EyE_yEy?),以及結合光譜導數的空間導數(如EλxE_{\lambda x}Eλx?EλλyE_{\lambda\lambda y}Eλλy?等)。
  • 顏色不變特征計算:計算完了空間導數,顏色不變特征即可根據表一公式進行計算。
3. 可訓練的CIConv層設計(將第二節的計算過程卷積化)

CIConv層是將第二階段的計算過程卷積化,使其可以進行訓練。

  • 尺度參數的學習:高斯導數核的尺度參數σ\sigmaσ影響特征細節與抗噪性(小σ\sigmaσ 保留細節但敏感于噪聲,大σ\sigmaσ抗噪但丟失細節)。作者將σ\sigmaσ 設為可訓練參數(通過σ=2s\sigma=2^sσ=2s轉換,sss 為訓練參數),以適應任務需求。
  • CIConv層的輸出:層的輸出通過對顏色不變特征的平方進行對數變換和樣本歸一化得到,對數變換和歸一化降低了光照強度變化對邊緣檢測的影響。即使在低光或不均勻光照下,W 也能穩定表示圖像的固有結構。公式為:
    CIConv(x,y)=log?(CI2(x,y,σ=2s)+?)?μSσSCIConv(x, y)=\frac{\log \left(CI^{2}\left(x, y, \sigma=2^{s}\right)+\epsilon\right)-\mu_{\mathcal{S}}}{\sigma_{\mathcal{S}}}CIConv(x,y)=σS?log(CI2(x,y,σ=2s)+?)?μS??
    其中,CICICI 為所選顏色不變特征,μS\mu_{\mathcal{S}}μS?σS\sigma_{\mathcal{S}}σS? 為樣本均值和標準差,?\epsilon?為數值穩定項。

該設計將物理先驗融入神經網絡,使模型無需目標域數據即可減少晝夜光照導致的特征分布偏移,為零樣本域適應提供了基礎。對于LLIE任務來說,提取的該顏色不變特征可以作為一種先驗信息進行任務指導。

三、實驗結果

該研究通過多個實驗驗證了基于物理先驗的零樣本晝夜域適應方法的有效性,涵蓋分類、分割等任務,具體如下:

1. 合成圖像分類實驗
  • 數據集:使用從ShapeNet數據集中選取的子集,通過物理渲染器Mitsuba生成合成圖像,包含10個物體類別。訓練集在“正常”光照條件(6500K)下生成,每個類別1000個樣本;測試集則在不同光照強度(從暗到亮)和顏色(2500K到20000K)條件下生成,每個類別300個樣本。
  • 模型與訓練:訓練基線ResNet-18和分別加入E、W、C、N、H五種顏色不變卷積層(CIConv)的ResNet-18,訓練175個epoch,使用SGD優化器,采用隨機水平翻轉、裁剪和旋轉等數據增強方式。
  • 結果:基線模型在光照條件偏離訓練集時精度迅速下降,而加入CIConv層的模型性能更穩定,其中W不變量模型表現最優,且能減少網絡各層特征圖的分布偏移。
    在這里插入圖片描述
2. 自然圖像分類實驗
  • 數據集:構建Common Objects Day and Night(CODaN)數據集,包含10個常見物體類別,由ImageNet、COCO和ExDark數據集組成。訓練集為白天圖像(每個類別1000個樣本),驗證集為白天圖像(每個類別50個樣本),測試集分為白天和夜間圖像(每個類別300個樣本)。
  • 模型與訓練:訓練加入不同顏色不變層的ResNet-18,訓練設置與合成圖像實驗類似,但數據增強改為隨機亮度、對比度、色調和飽和度調整。
  • 結果:W不變量模型在夜間測試集上準確率達59.67%,顯著優于基線模型(48.31%)和其他方法(如AdaBN的55.55%),且其生成的邊緣圖能更好地保留低強度和低飽和度邊緣,同時抑制噪聲。
    在這里插入圖片描述
    在這里插入圖片描述
3. 語義分割實驗
  • 數據集:使用CityScapes的白天訓練集(2975張標注圖像)進行訓練,在Nighttime Driving(50張粗標注夜間圖像)和Dark Zurich(151張精標注夜間圖像)測試集上評估。
  • 模型與訓練:采用RefineNet架構,分別使用ResNet-101和加入W不變量層的W-ResNet-101作為特征提取器,訓練時使用隨機縮放、亮度/對比度/色調調整和水平翻轉等數據增強。
  • 結果:W-RefineNet在Nighttime Driving和Dark Zurich測試集上的mIoU分別為41.6和34.5,優于僅使用源域數據訓練的其他模型(如RefineNet的34.1和30.6),且與使用源域和目標域數據的方法性能接近。
    在這里插入圖片描述

這些實驗從不同任務和數據集角度,驗證了CIConv層在減少晝夜光照導致的分布偏移、提升模型魯棒性方面的有效性。

四、總結

該論文聚焦零樣本晝夜域適應問題,提出了一種基于物理先驗的解決方案。通過引入基于Kubelka-Munk反射模型的顏色不變特征,設計了可訓練的Color Invariant Convolution(CIConv)層,將其作為CNN的輸入層,以減少光照變化導致的特征分布偏移。

在暗光增強任務作為結構先驗應用的前景

暗光增強任務的核心是在提升圖像亮度的同時,保留關鍵結構信息(如邊緣、紋理)并抑制噪聲。本文提出的顏色不變特征及CIConv層作為結構先驗,在該領域具有以下優勢:

  1. 保留結構一致性:顏色不變特征(如W不變量)對光照強度不敏感,能在暗光環境下穩定提取物體邊緣和結構信息。將其作為先驗融入暗光增強模型(如生成對抗網絡),可引導模型在提亮過程中優先保留這些關鍵結構,避免過度增強導致的邊緣模糊或細節丟失。
  2. 抑制噪聲干擾:CIConv層通過學習高斯核尺度參數σ,在提取結構時能平衡細節保留與抗噪性(大σ增強抗噪性)。這一特性可輔助暗光增強模型區分真實結構與噪聲,減少暗光環境下傳感器噪聲對增強結果的影響。
  3. 增強域適應性:暗光增強常面臨“白天-黑夜”“正常光-低光”的域偏移問題,本文的物理先驗可幫助模型學習光照不變的結構表示,提升模型在不同光照條件下的泛化能力,減少對大量配對暗光-正常光數據的依賴。

感謝閱讀,歡迎留言或私信,一起探討和交流。
如果對你有幫助的話,也希望可以給博主點一個關注,感謝。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/93489.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/93489.shtml
英文地址,請注明出處:http://en.pswp.cn/web/93489.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Font Awesome Kit 使用詳解

在現代網頁設計中,圖標是提升用戶體驗的關鍵元素。而 Font Awesome 作為最受歡迎的圖標庫,其最新版本 Font Awesome 7 通過 Kit 功能提供了更便捷高效的集成方式。本文將帶你全面了解如何使用 Font Awesome Kit,讓你的網站圖標管理變得輕松高…

第七十八章:AI的“智能美食家”:輸出圖像風格偏移的定位方法——從“濾鏡病”到“大師風范”!

AI圖像風格偏移前言:AI的“火眼金睛”——輸出圖像風格偏移的定位方法!第一章:痛點直擊——“畫風跑偏”?AI生成藝術的“審美危機”!第二章:探秘“畫風密碼”:什么是風格偏移?它藏在…

Android原生(Kotlin)與Flutter混合開發 - 設備控制與狀態同步解決方案

Kotlin 原生實現 (Android) 1.1 AndroidManifest.xml <manifest xmlns:android"http://schemas.android.com/apk/res/android"package"com.afloia.smartconnect"><applicationandroid:name".MainApplication"android:label"Smart …

已開源:Highcharts.NET,Highcharts Android,與Highcharts iOS集成

近期了解到&#xff0c;Highcharts官方宣布將Highcharts.NET&#xff0c;Highcharts Android&#xff0c;與Highcharts iOS集成轉換為開源。對于Highcharts提供世界一流的數據可視化工具&#xff0c;一直致力于將資源集中在可以為您提供最大價值的地方。官方提到&#xff1a;這…

KingbaseES:一體化架構與多層防護,支撐業務的持續穩定運行與擴展

聲明&#xff1a;文章為本人真實測評博客&#xff0c;非廣告 目錄 引言 一、什么是KingbaseES&#xff1f; 二、KingbaseES核心特性 1. 一鍵遷移&#xff0c;極速性能&#xff0c;安全無憂? 2. 性能強勁&#xff0c;擴展性強&#xff0c;助力企業應對大規模并發挑戰? …

scikit-learn/sklearn學習|廣義線性回歸 Logistic regression的三種成本函數

【1】引言 前序學習進程中&#xff0c;已經對線性回歸和嶺回歸做了初步解讀。 實際上&#xff0c; Logistic regression是一種廣義的線性模型&#xff0c;在對線性分類的進一步學習前&#xff0c;有必要了解 Logistic regression。 【2】Logistic regression的3種成本函數 …

Tiptap(基于 Prosemirror)vs TinyMCE:哪個更適合你的技術棧?

在這之前&#xff0c;先來介紹一下 ProseMirror&#xff1a; 1. ProseMirror 是底層內核 定位&#xff1a;一個強大的 富文本編輯框架/引擎&#xff0c;不是一個成品編輯器。 作者&#xff1a;Marijn Haverbeke&#xff08;CodeMirror 作者&#xff09;。 核心思想&#xff1…

多墨智能-AI一鍵生成工作文檔/流程圖/思維導圖

本文轉載自&#xff1a;多墨智能-AI一鍵生成工作文檔/流程圖/思維導圖 - Hello123工具導航 ** 一、AI 文檔與視覺化創作助手 多墨智能是一款基于人工智能的在線工具&#xff0c;支持一鍵生成專業文檔、流程圖與思維導圖&#xff0c;通過關鍵詞輸入快速完成內容創作&#xff0…

Kafka_Broker_副本基本信息

Kafka副本作用&#xff1a;提高數據可靠性 Kafka默認副本1個&#xff0c;生產環境一般配置為2個&#xff0c;保證數據可靠性&#xff0c;太多副本會增加磁盤存儲空間&#xff0c;增加網絡上數據傳輸&#xff0c;降低效率 Kafka中副本分為&#xff1a;Leader和Follower&#xff…

FreeRTOS 中的守護任務(Daemon Task)

在 FreeRTOS 中&#xff0c;守護任務&#xff08;Daemon Task&#xff09;是一個特殊的系統任務&#xff0c;主要用于管理軟件定時器和其他后臺操作。以下是關于 FreeRTOS 守護任務的詳細信息&#xff1a; 守護任務的作用軟件定時器管理&#xff1a; 當啟用 configUSE_TIMERS 時…

博士招生 | 麻省理工學院 招收化學+人工智能方向 博士/博士后

內容源自“圖靈學術博研社”gongzhonghao學校簡介麻省理工學院&#xff08;MIT&#xff09;QS世界排名第1&#xff0c;是全球科技研究領域的頂尖學府。自成立以來&#xff0c;MIT以其卓越的科研和教育質量贏得了世界的尊敬。學校在科學、工程、經濟和管理等多個領域具有深遠的影…

云計算-OpenStack 實戰運維:從組件配置到故障排查(含 RAID、模板、存儲管理,網絡、存儲、鏡像、容器等)

介紹 在云計算技術快速發展的背景下,OpenStack 作為開源的云計算管理平臺,憑借其靈活性、可擴展性和強大的組件生態,成為構建私有云、公有云和混合云的重要選擇。無論是云主機的創建與管理、存儲方案的配置(如 RAID 陣列、Swift 對象存儲、Cinder 塊存儲),還是網絡編排、…

idea代碼bug檢測插件

代碼檢測工具&#xff08;插件&#xff09;推薦&#xff1a;Alibaba Java Coding Guidelines、CheckStyle、PMD、FindBugs、SonarLint。可以在idea中安裝插件 讓你在關注代碼質量的同時&#xff0c;減少 code review 的工作量&#xff0c;提高 code review 的效率&#xff0c;…

Java String為什么要設計成不可變的?

大家好&#xff0c;我是鋒哥。今天分享關于【Java String為什么要設計成不可變的?】面試題。希望對大家有幫助&#xff1b; Java String為什么要設計成不可變的? 超硬核AI學習資料&#xff0c;現在永久免費了&#xff01; Java中的String類被設計為不可變&#xff08;immut…

集成電路學習:什么是ORB方向性FAST和旋轉BRIEF

ORB:方向性FAST和旋轉BRIEF ORB(Oriented FAST and Rotated BRIEF)是一種在計算機視覺領域廣泛應用的特征描述算法,它結合了FAST角點檢測算法和BRIEF描述子算法的優點,以實現高效且具有旋轉不變性的特征提取和匹配。以下是關于ORB算法的詳細解析: 一、ORB算法概述 …

【langgraph基礎入門】

1. LangGraph圖結構概念說明在以圖構建的框架中&#xff0c;任何可執行的功能都可以作為對話、代理或程序的啟動點。這個啟動點可以是大模型的 API 接口、基于大模型構建的 AI Agent&#xff0c;通過 LangChain 或其他技術建立的線性序列等等&#xff0c;即下圖中的 “Start” …

[逆向知識] AST抽象語法樹:混淆與反混淆的邏輯互換(一)

博客配套代碼發布于github&#xff1a;半自動化cookie更新&#xff08;歡迎順手Star一下?&#xff09; 相關逆向知識&#xff1a; [逆向知識] AST抽象語法樹&#xff1a;混淆與反混淆的邏輯互換&#xff08;二&#xff09;-CSDN博客 相關爬蟲專欄&#xff1a;JS逆向爬蟲實戰…

網絡安全合規6--服務器安全檢測和防御技術

一、服務器安全風險主要威脅&#xff1a;不必要的服務暴露&#xff08;如僅需HTTP卻開放多余端口&#xff09;。外網掃描&#xff08;IP/端口掃描&#xff09;、DDoS攻擊。系統漏洞攻擊&#xff08;操作系統、軟件版本已知漏洞&#xff09;。Web攻擊&#xff08;SQL注入、XSS、…

Mutually aided uncertainty

cycle loss calculation in order to regularize the two aux-decoders 輔助信息 作者未提供代碼

go基礎學習筆記

思維導圖變量 聲明形式為var 變量名 變量類型 賦值形式為變量名變量值 聲明和賦值同時形式為變量名:變量值 多個變量同時聲明使用形式為 var (x intb bool )當有多個變量類型一樣時&#xff0c;可以放在一行&#xff0c;形式為var x,y int,當類型一樣&#xff0c;并且需要賦值同…