噪聲建模在一小時:最小化準備工作的自監督低光RAW圖像去噪

論文標題:
Noise Modeling in One Hour: Minimizing Preparation Efforts for Self-supervised Low-Light RAW Image Denoising
發表日期:
2025年5月
作者:
Feiran Li, Haiyang Jiang*, Daisuke Iso
發表單位:
Sony Research, Tokyo University
原文鏈接:
https://arxiv.org/pdf/2505.00045
開源代碼鏈接:
https://github.com/SonyResearch/raw_image_denoising

引言

在低光環境下拍攝RAW圖像時,噪聲問題總是令人頭疼。傳統降噪方法需要大量成對的干凈-噪聲圖像進行訓練,而索尼研究院的這項研究提出了一種自監督學習方法,僅需1小時的準備時間就能完成噪聲建模,性能還比現有方法提升了0.54dB。這項技術將大大降低低光攝影的門檻,讓更多人能拍出清晰的照片。

論文中的方法架構圖展示了這個創新的降噪流程:

實驗結果對比圖顯示,該方法在保持圖像細節的同時有效去除了噪聲:

實驗結果對比圖

量子效率統計圖展示了該方法在傳感器特性分析方面的創新:

量子效率統計圖

問題背景及相關工作

在低光環境下拍攝RAW圖像時,噪聲問題尤為突出。相比標準RGB圖像,RAW圖像保留了原始噪聲特性,具有更高的位深度,因此在降噪方面展現出巨大潛力。然而,基于學習的方法需要大量成對的干凈-噪聲圖像進行訓練,這在實踐中往往難以實現。

傳統噪聲合成方法通常需要傳感器特定的建模,包括信號依賴和信號無關的噪聲合成兩個步驟。這些步驟往往需要大量人工干預和復雜流程,如系統增益校準和噪聲分析,耗時可達數天。

現有的噪聲合成方法主要分為兩類:基于統計模型的方法和基于神經網絡的方法。前者如ELD方法識別了RAW傳感器數據中的四種關鍵噪聲元素;后者如NoiseFlow使用流模型進行噪聲建模。但這些方法都存在實現復雜或部署困難的問題。

方法概述

本論文提出了一種簡單實用的噪聲合成流程,通過詳細分析噪聲特性和廣泛驗證現有技術,大大減少了準備時間。該方法的核心在于:

假設量子效率:通過假設量子效率值來合成光子散粒噪聲,避免了繁瑣的系統增益校準過程

直接采樣信號無關噪聲:直接從傳感器采集暗幀作為信號無關噪聲的樣本,省去了復雜的噪聲分析步驟

暗影校正:通過暗影校正消除時間一致性噪聲的影響,提高訓練效果

術語解讀

RAW圖像:直接從相機傳感器輸出的未經處理的圖像數據,保留了更多的原始信息

系統增益K:由量子效率(QE)和模擬增益(AG)組成,K=QE×AG,是噪聲建模中的關鍵參數

暗幀:在完全黑暗條件下拍攝的圖像,僅包含傳感器自身產生的噪聲

光子散粒噪聲:由光的量子特性引起,服從泊松分布,是信號依賴噪聲的主要成分

核心設計

本方法的整體流程如圖2所示:

圖2:降噪流程概覽。在準備階段,本文為每個模擬增益收集多個暗幀并計算相應的暗影。為了合成一對訓練圖像,本文假設一個系統增益K來生成泊松散粒噪聲圖,并將其與采樣得到的暗影校正暗幀一起添加到干凈圖像中。在推理階段,給定一個噪聲圖像,本文從中減去暗影后輸入網絡。

該方法的核心創新點在于:

基于假設的散粒噪聲合成:通過假設量子效率值來估計系統增益K,避免了復雜的校準過程

直接采樣信號無關噪聲:使用直接從傳感器采集的暗幀作為信號無關噪聲的樣本

暗影校正:通過暗影校正消除時間一致性噪聲的影響

論文主體思路

本論文的主要研究思路可以總結如下:

應用場景:低光環境下RAW圖像去噪

問題建模:通過噪聲合成實現自監督學習,解決成對數據不足的問題

模型Backbone:采用U-Net作為去噪網絡,與現有工作保持一致

損失函數:使用L1損失函數

訓練數據集:使用合成的噪聲-干凈圖像對

測試數據集:SID、ELD和LRID數據集

訓練方法:使用Adam優化器訓練1000個epoch,其中400個epoch用于微調

方法優勢:準備時間從數天縮短至1小時,性能提升0.54dB

方法缺點:需要已知模擬增益(AG),對普通消費者相機用戶可能不友好

主要創新點

基于假設的散粒噪聲合成:通過假設量子效率值來估計系統增益K,避免了復雜的校準過程

直接采樣信號無關噪聲:使用直接從傳感器采集的暗幀作為信號無關噪聲的樣本

暗影校正:通過暗影校正消除時間一致性噪聲的影響

簡化流程:將準備時間從數天縮短至1小時,同時保持甚至提升去噪性能

核心原理推導

本方法基于以下圖像形成模型:

其中Kd是用于亮度調整的數字增益,Ka是應用于模擬信號的系統增益,X是與場景輻照度成正比的實際光子數,Np是信號依賴噪聲,N1和N2是兩種信號無關噪聲。

信號依賴噪聲主要來自光子散粒噪聲,服從泊松分布:

系統增益K由量子效率(QE)和模擬增益(AG)組成:?

基于量子效率的物理約束(通常在30%-70%之間),可以安全地假設K值而不需要精確校準。

數據準備及實驗設計

實驗使用了三個流行的低光RAW圖像去噪數據集:

SID:使用Sony-A7S2全畫幅單反相機拍攝

ELD:使用另一臺Sony-A7S2相機拍攝

LRID:使用Redmi K30智能手機的IMX686傳感器拍攝

實驗對比了多種方法,包括:

監督方法:使用真實噪聲-干凈圖像對訓練

自監督方法:基于干凈圖像合成噪聲

混合方法:使用合成數據進行預訓練,真實圖像對進行微調

實驗結果

在SID和ELD數據集上,本文方法以46.43dB的平均PSNR刷新了自監督降噪記錄,甚至超過部分監督學習方法。來看關鍵數據對比:

圖3:不同噪聲合成方法的定性對比。所有圖像都經過簡單的圖像信號處理流程轉換為sRGB格式以便更好可視化。ELD和SFRN在圖像邊界處表現出明顯的顏色偏差,而本文方法則沒有。

在智能手機傳感器測試集LRID上,本文方法展現出45.08dB的驚人表現,比現有最佳方法提升0.54dB。更令人驚喜的是,使用僅10個暗幀進行在線校準時的性能損失不超過0.1dB!

圖4:不同模型擬合信號無關噪聲的分位數-分位數圖

圖4:不同模型擬合信號無關噪聲的分位數-分位數圖。左:重采樣數據與用于模型擬合數據的對比(即建模精度)。右:重采樣數據與未見暗幀數據的對比(即泛化精度)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/84557.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/84557.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/84557.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Puppeteer 瀏覽器自動化操作工具

pyppeteer 是 Python 版本的 Puppeteer,而 Puppeteer 是由 Google 開發的一個 Node.js 庫,用于控制 Chrome 或 Chromium 瀏覽器。pyppeteer 允許你通過 Python 代碼自動化操作瀏覽器,實現網頁爬取、自動化測試、生成截圖或 PDF 等功能。 核心…

接口性能測試-工具JMeter的學習

接口登錄鏈接http://111.230.19.204:8080/blog_login.html 一、JMeter基本使用流程 1、啟動Jmeter 2、在“測試計劃”下添加線程組 3、在“線程組”下添加“HTTP”取樣器 4、填寫“HTTP請求”的相關請求數據 5、在“線程組”下添加“查看結果樹”監聽器 6、點擊“啟動”按鈕…

mybatis-plus與jsqlparser共用時報sql解析錯誤

手動引入jsqlparser-4.6版本,但mybatis-plus中引用為4.4版本 解決方法一: jsqlparser版本與mybatis-plus中引用版本一致。 解決方法而二: 排除掉mybatis-plus中的jsqlparser。

用MMdetection框架訓練自己的數據集(全流程實戰)

前面我們準備好了COCO格式的數據集:將YOLO格式的數據集轉換為mmdetection格式-CSDN博客https://blog.csdn.net/qq_54708219/article/details/148224187?spm1001.2014.3001.5501 下面我們使用MMdetection開始訓練。 1.創建新的數據集類 首先,在mmdet/d…

VS Code中Maven未能正確讀取`settings.xml`中配置的新路徑

在VS Code中Maven未能正確讀取settings.xml中配置的新路徑,通常是由于以下原因導致的: 一、VS Code未使用你修改的settings.xml文件 VS Code的Maven插件可能使用了默認配置或指向其他settings.xml文件。解決方法: 手動指定settings.xml路徑…

2021年認證杯SPSSPRO杯數學建模A題(第二階段)醫學圖像的配準全過程文檔及程序

2021年認證杯SPSSPRO杯數學建模 A題 醫學圖像的配準 原題再現: 圖像的配準是圖像處理領域中的一個典型問題和技術難點,其目的在于比較或融合同一對象在不同條件下獲取的圖像。例如為了更好地綜合多種信息來辨識不同組織或病變,醫生可能使用…

RPM之(1)基礎使用

RPM之(1)基礎使用 Author: Once Day Date: 2025年5月26日 一位熱衷于Linux學習和開發的菜鳥,試圖譜寫一場冒險之旅,也許終點只是一場白日夢… 漫漫長路,有人對你微笑過嘛… 全系列文章可參考專欄: Linux實踐記錄_Once-Day的博客-CSDN博客 …

國內可做大批量pcb的工廠有哪些?

在電子產業升級浪潮中,PCB作為電子設備的基礎載體,其批量生產能力直接決定著終端產品的市場響應速度與品質穩定性。本文精選五家具備核心競爭力的廠商,從工藝深度、產能規模到服務模式展開剖析,為采購決策提供專業參考。 獵板PCB…

【視頻】使用海康SDK保存的MP4無法在瀏覽器(html5)中播放

1、問題描述 在使用海康 SDK 的 NET_DVR_SaveRealData 接口,將視頻流保存成MP4文件后,通過瀏覽器無法播放MP4,播放其它的MP4正常。 2、原因分析 對比可以正常播放的MP4 和 無法播放的MP4文件,比較它們的詳細信息,發…

AI時代新詞-生成對抗網絡(GAN)

一、什么是生成對抗網絡(GAN)? 生成對抗網絡(Generative Adversarial Network,簡稱GAN)是一種由生成器(Generator)和判別器(Discriminator)組成的深度學習模…

使用AutoKeras2.0的AutoModel進行結構化數據回歸預測

1、First of All: Read The Fucking Source Code import autokeras as ak import numpy as np from sklearn.model_selection import train_test_split from sklearn.metrics import mean_squared_error# 生成數據集 np.random.seed(42) x np.random.rand(1000, 10) # 生成1…

實戰設計模式之訪問者模式

概述 訪問者模式允許我們在不改變類的前提下,向已有類添加新的功能。簡單來說,就是將算法與對象的數據結構進行分離的一種方法。在實際應用中,當我們需要對一組對象執行一些操作,而這些操作又需要隨著需求的變化而不斷變化時&…

centos7.9使用docker-compose安裝kafka

docker-compose配置文件 services:zookeeper:image: confluentinc/cp-zookeeper:7.0.1hostname: zookeepercontainer_name: zookeeperports:- "2181:2181"environment:ZOOKEEPER_CLIENT_PORT: 2181ZOOKEEPER_TICK_TIME: 2000kafka:image: confluentinc/cp-kafka:7.0…

STM32:Modbus通信協議核心解析:關鍵通信技術

知識點1【 Modbus通信】 1、Modbus的概述 Modbus是OSI模型第七層的應用層報文傳輸協議 協議:說明有組包和解包的過程 2、通信機制 Modelbus是一個請求/應答協議 通信機制:主機輪詢,從機應答的機制。每個從設備有唯一的地址,主…

LeetCode 3362.零數組變換 III:貪心+優先隊列+差分數組——清晰題解

【LetMeFly】3362.零數組變換 III:貪心優先隊列差分數組——清晰題解 力扣題目鏈接:https://leetcode.cn/problems/zero-array-transformation-iii/ 給你一個長度為 n 的整數數組 nums 和一個二維數組 queries ,其中 queries[i] [li, ri] …

ORM++ 封裝實戰指南:安全高效的 C++ MySQL 數據庫操作

ORM 封裝實戰指南:安全高效的 C MySQL 數據庫操作 一、環境準備 1.1 依賴安裝 # Ubuntu/Debian sudo apt-get install libmysqlclient-dev # CentOS sudo yum install mysql-devel# 編譯時鏈接庫 (-I 指定頭文件路徑 -L 指定庫路徑) g main.cpp -stdc17 -I/usr/i…

JESD204B 協議介紹

一、協議概述 JESD204B是由JEDEC(固態技術協會)制定的高速串行接口標準,專為模數轉換器(ADC)、數模轉換器(DAC)與邏輯器件(如FPGA、ASIC)之間的數據傳輸設計。其核心目標…

yolov8,c++案例匯總

文章目錄 引言多目標追蹤案例人體姿態估計算法手勢姿態估計算法目標分割算法 引言 以下案例,基于c,ncnn,yolov8既可以在windows10/11上部署, 也可以在安卓端部署, 也可以在嵌入式端部署, 服務器端可支持部署封裝為DLL,支持c/c#/java端調用 多目標追蹤案例 基于yolov8, ncnn,…

運動規劃實戰案例 | 圖解基于狀態晶格(State Lattice)的路徑規劃(附ROS C++/Python仿真)

目錄 1 控制采樣 vs 狀態采樣2 State Lattice路徑規劃2.1 算法流程2.2 Lattice運動基元生成2.3 幾何代價函數2.4 運動學約束啟發式 3 算法仿真3.1 ROS C仿真3.2 Python仿真 1 控制采樣 vs 狀態采樣 控制采樣的技術路線源自經典的運動學建模思想。這種方法將機器人的控制指令空…

BERT框架:自然語言處理的革命性突破

引言 在自然語言處理(NLP)領域,2018年Google推出的BERT(Bidirectional Encoder Representations from Transformers)框架無疑是一場革命。作為基于Transformer架構的雙向編碼器表示模型,BERT通過預訓練學習…