圖像質量評價(Image Quality Assessment,IQA)

文章目錄

  • 圖像質量評價(Image Quality Assessment,IQA)
  • 一、評估方式:主觀評估 + 客觀評估
    • 1.1、主觀評估方式
    • 1.2、客觀評估方式:全參考 + 半參考 + 無參考
      • (1)全參考的方法對比(Full-Reference IQA,FR-IQA)
      • (2)半參考的方法對比(Reduced-Reference IQA,RR-IQA)
      • (3)無參考的方法對比(No-Reference / Blind IQA,NR-IQA)
    • 1.3、常用公開IQA數據集對比表

圖像質量評價(Image Quality Assessment,IQA)

圖像質量評價指標(Image Quality Assessment, IQA)是衡量圖像在主觀感受或客觀性能上的一組量化標準,常用于圖像增強、壓縮、重建、去噪等任務的效果評估。

圖像質量評估:維基百科
圖像質量評價:百度百科
圖像質量評價(每個方法的論文簡介與鏈接)

圖像質量評估綜述

  • 質量評估可分為:
    • 圖像質量評估IQA
    • 視頻質量評估VQA
  • IQA方法從宏觀上可分為:
    • 主觀評價:依賴人工評分,盡管準確性高、符合人眼視覺系統(HVS)偏好,但成本昂貴、效率低下,難以適配大規模自動化系統。
    • 客觀評價:則以數學模型自動預測圖像質量,廣泛應用于工業與科研領域,是當前主流研究方向。
  • 從參考圖像可用性角度,IQA又分為三類:
    • FR-IQA(全參考):借助無失真參考圖像,計算其與原始圖像的差異方法成熟、性能穩定,但對實際應用受限(因多數情況下參考圖像缺失)。
    • RR-IQA(半參考):只有原始圖像的部分信息或從參考圖像中提取的部分特征在性能與適用性之間折中。
    • NR-IQA(無參考):僅依賴待評估圖像本身,不需要參考圖像應用最廣但難度最大,當前是研究熱點。

一、評估方式:主觀評估 + 客觀評估

評估方式簡介特點與對比維度
主觀評估(Subjective IQA)基于真實觀察者的視覺感知,由人類主觀對圖像質量進行評分,常用指標包括MOS(平均意見得分)與DMOS(差異意見得分)。需要通過標準化實驗環境和統計方法獲取大量人評分。- ? 精度最高,最符合人眼感知
- ? 可復現性差,結果易受主觀因素干擾
- ? 成本高,需招募被試并控制實驗環境
- ? 實時性差,無法快速得出結果
- ? 難以部署,通常用于數據庫標注與模型基準
客觀評估(Objective IQA)通過數學模型或算法自動估算圖像質量分數,目標是盡可能逼近主觀得分,具有可重復性和實時性。根據參考圖像的使用程度分為FR(全參考)、RR(半參考)、NR(無參考)三類,是當前研究熱點。- ? 可復現、穩定性強
- ? 成本低,自動處理大規模圖像
- ? 實時性好,支持在線或終端部署
- ? 可廣泛應用于圖像壓縮、增強、采集質量控制等場景
- ? 精度依賴模型質量,NR方法尤其具有挑戰性

1.1、主觀評估方式

方法類型簡要說明評分輸出應用場景
MOS(平均意見得分)多人打分后取平均分1 ~ 5 或 0 ~ 100訓練NR-IQA模型,構建圖像質量數據集
DMOS(差分MOS)與原始圖像評分的差值,反映質量劣化程度通常為正數TID2013、CSIQ等主觀差分數據集
單刺激法(SS)僅展示失真圖像進行評分相對主觀KonIQ-10k, LIVE Wild等
雙刺激法(DSCQS)參考圖與失真圖并排顯示,受試者對失真程度打分相對準確LIVE、CSIQ、TID系列
三選一法(3AFC)三圖中選出質量最好/最差者,構建排序關系用于學習構造對比樣本對DeepIQA排序訓練等

1.2、客觀評估方式:全參考 + 半參考 + 無參考

類別全稱(英文)是否需要參考圖像輸入信息輸出結果代表算法/模型常見評價指標常用數據集優勢描述劣勢描述典型應用場景
FR-IQAFull Reference IQA? 全參考原圖 + 失真圖兩圖之間的相似性得分PSNR、SSIM、MS-SSIM、FSIM、VIFPSNR, SSIM, MSELIVE, TID2013, CSIQ, KADID-10k精度高,計算邏輯清晰,結果可對齊主觀感知依賴原圖,實際部署難編解碼優化、圖像增強算法調試
RR-IQAReduced Reference IQA? 半參考失真圖 + 原圖特征或統計量與參考特征的相似性得分RRED、DNT、NRQM(部分)JS差異, KL散度, 差值指標TID2013, LIVE, SIQAD節省傳輸成本,精度優于NR,兼顧應用性與性能仍需傳輸部分特征,模型通用性不足視頻傳輸評估、帶寬受限下的圖像監控
NR-IQANo Reference IQA / Blind IQA? 無參考單張失真圖圖像質量得分(預測值)BRISQUE、NIQE、PIQE、DeepBIQ、HyperIQA等MOS(主觀分數)KonIQ-10k, SPAQ, CLIVE, LIVE Wild無需參考圖,可用于實際圖像質量預測部署難以保證泛化能力,訓練依賴主觀評分數據集醫療圖像質檢、無人監督場景

(1)全參考的方法對比(Full-Reference IQA,FR-IQA)

方法名核心指標是否模型訓練主要思想優點缺點適用場景
MSE / PSNR均方誤差 / 峰值信噪比逐像素差異/誤差量度簡單高效,便于實現不符合人眼感知;不具備感知魯棒性壓縮、編碼等低層處理
SSIM結構相似度 Structural Similarity考察亮度、對比度與結構信息模擬視覺機制,感知一致性更好對幾何變化、偽影不敏感編解碼質量評估
MS-SSIM多尺度結構相似度多分辨率層次感知更貼近人眼感知層級計算略復雜高清視頻/圖像質量評價
VIF信息保真度 Visual Information Fidelity源圖像/失真圖像的信息量比率信息論基礎,評價可靠性高理論復雜,耗時較長圖像傳輸、壓縮失真評估
FSIM特征相似度 Feature SIM考察相位一致性、梯度強度敏感性高,魯棒性好不適合大規模計算圖像增強質量評價
LPIPS感知相似度 Learned Perceptual Image Patch Similarity是(深度模型)提取CNN特征后計算相似度感知特性強,視覺一致性高模型依賴重、需GPU超分辨、風格遷移、圖像復原等任務

(2)半參考的方法對比(Reduced-Reference IQA,RR-IQA)

方法名參考特征類型是否訓練模型方法特點優點缺點適用場景
RRED局部統計量(DCT能量特征)基于變換域的熵率與視覺冗余度估計精度高,接近FR-IQA特征提取依賴參考圖像,計算復雜通信系統圖像質量反饋
DNT-RRDCT統計特征僅傳輸部分統計特征用于質量預測傳輸代價低,可嵌入實際系統失真類型覆蓋范圍有限網絡圖像編碼傳輸
Wavelet-Q小波能量子帶統計量局部頻域統計特征構建質量指標可解釋性強,計算高效對某些失真魯棒性不足通信協議/嵌入式視頻傳輸
RR-FSIM相位一致性+幅度統計特征對FSIM簡化,只提取部分參考特征接近FR精度,傳輸成本低對特征選擇依賴高視頻會議、直播質量評估
RR-NSS自然場景統計參數利用自然圖像統計模型壓縮參考圖像信息適應性強不適合非自然圖像工業檢測、遠程圖像識別等場景

(3)無參考的方法對比(No-Reference / Blind IQA,NR-IQA)

🚀 NR-IQA研究現狀

  • 傳統統計方法階段(2010年以前)
    代表方法如BIQI、DIIVINE、BRISQUE等,依賴自然圖像統計(NSS)特征,使用SVM或貝葉斯回歸模型實現質量預測。該階段研究具有可解釋性強、計算代價低等優點,但泛化能力有限。
  • 數據驅動階段(2013年起)
    隨著深度學習發展,基于CNN的NR-IQA方法如CORNIA、NIMA、DeepBIQ等不斷涌現,能夠從圖像中自動學習判別特征,主觀一致性顯著提升。此類方法在主觀評分預測、跨數據庫泛化等方面取得較好效果,但對數據依賴嚴重、可解釋性差。
  • Transformer與自監督階段(2020年至今)
    新一代方法引入Vision Transformer結構(如MANIQA、TReS、MUSIQ)或自監督學習(如CONTRIQUE),提升跨場景泛化能力與語義建模能力。當前最先進模型普遍在多個公開數據集(如LIVE、TID2013、KonIQ-10k、CLIVE等)上取得了優異成績,開始接近甚至超過主觀一致性下限。
方法名稱首次提出模型類型特征類型是否訓練適用失真類型主觀一致性優點局限性應用場景
NIQE (Natural Image Quality Evaluator)2013傳統統計模型NSS(自然場景統計)泛化失真(無需訓練數據)中等無需訓練、計算高效對特定失真不敏感,主觀一致性不高快速篩選、質量控制
BRISQUE (Blind/Referenceless Image Spatial Quality Evaluator)2012SVM回歸NSS特征(空域)模糊、壓縮等常見失真輕量級、主觀一致性較高需訓練樣本,失真類型受限通用圖像評估
BLIINDS-II (Blind Image Integrity Notator using DCT Statistics)2011貝葉斯回歸NSS(頻域DCT)模糊、噪聲等中等頻域分析精細提取DCT特征耗時、訓練依賴性視頻壓縮質量監測
CORNIA (Codebook Representation for No-Reference IQA)2013機器學習原始圖塊+無監督特征學習多種失真結合深層表示對內容敏感,訓練成本高圖像增強前后質量評估
HOSA (Higher Order Statistics Aggregation)2015無監督統計特征聚合(SVD+高階矩)各類失真無需深度網絡,適應性強參數敏感,訓練集依賴醫學圖像質量分析
DIIVINE2011SVMNSS(空間+小波域)多類失真空間-頻域聯合特征維度高,訓練成本大圖像處理算法評估
IL-NIQE2015無監督NSS + 亮度不變性各類失真中等無訓練集依賴,穩定性強泛化能力有限嵌入式圖像監控設備
NIMA (Neural Image Assessment)2017CNN回歸全圖輸入(Inception)主觀美學/質量可預測MOS分布,美學兼顧訓練代價高圖像美學質量評分
DeepBIQ2016CNN分類+回歸局部圖塊+深度特征泛化強利用深層特征,有效預測黑盒問題,計算量大手機拍照圖像優化
RankIQA2017Siamese網絡Siamese排序特征多類失真模擬評分過程,更接近人感知排序數據構建復雜圖像優化排序任務
DBCNN2018CNN分類回歸VGG16 + 評分網絡各類失真精度高,可回歸MOS需要大量數據通用圖像質量評分
CONTRIQUE2021Transformer+NSSNSS嵌入 + 自監督學習泛化失真(無監督)利用NSS嵌入魯棒性強網絡復雜零樣本質量估計
MANIQA2022Vision Transformer局部塊 + 全局注意力泛化強極高高分辨率支持,跨數據集表現好模型參數多高端視覺質量分析

1.3、常用公開IQA數據集對比表

數據集名稱類型圖像數(參考/失真)失真類型主觀評分特點簡介
LIVE [官網]FR-IQA29 / 779模糊、壓縮、噪聲、快門抖動等5類DMOS最早最廣泛使用的數據集之一;包含真實失真與評分,廣泛用于FR-IQA評估基準。
CSIQ [官網]FR-IQA30 / 8666類失真×不同強度DMOS圖像與失真類型更豐富;主觀得分離散性較小;與LIVE互補。
TID2013 [官網]FR-IQA25 / 300024種失真×5級強度MOS非常全面的數據集;失真種類多,適合訓練與泛化測試。
TID2008FR-IQA25 / 170017類失真MOSTID2013前身,失真較少但結構相似。
KADID-10k [官網]FR-IQA81 / 10,12525類失真×不同強度MOS圖像種類多、失真復雜,適合深度學習模型訓練。
CID2013FR-IQA474 / 474實拍設備失真MOS強調真實場景采集(拍照質量);圖像尺寸大,適合真實感知建模。
Waterloo IAA [官網]FR-IQA4744 / 94,880常見壓縮與噪聲等失真無主觀得分用于無參考方法的無監督訓練或構造合成失真;大規模。
KonIQ-10k [官網]NR-IQA— / 10,073自然圖像,真實失真MOS高分辨率自然圖像;圖像來源廣泛,適合NR-IQA訓練;包含多維質量因子標注。
CLIVE [官網]NR-IQA— / 1,162拍攝圖像中自然失真MOS強調移動端/手持拍攝自然圖像質量;適合盲質量評價建模。
SPAQ [論文]NR-IQA— / 11,125高質量自然失真圖像MOS更具挑戰性,真實感強;含曝光/色彩/對比等因素。
FLIVENR-IQA— / 39,000+自然采集圖像MOS最大規模真實圖像質量數據集之一,適用于深度NR-IQA模型訓練。

📌 說明:

  • FR-IQA(Full Reference):提供參考圖像與失真圖像,可用于全參考算法對比。
  • NR-IQA(No Reference):無參考圖像,難度更高,適合實際部署情境。
  • MOS/DMOS:主觀評分標準,分別代表“平均意見分數”“差異平均意見分數”。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/89294.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/89294.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/89294.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【跟我學YOLO】(2)YOLO12 環境配置與基本應用

歡迎關注『跟我學 YOLO』系列 【跟我學YOLO】(1)YOLO12:以注意力為中心的物體檢測 【跟我學YOLO】(2)YOLO12 環境配置與基本應用 【跟我學YOLO】(3)YOLO12 用于診斷視網膜病變 【跟我學YOLO】&a…

Python爬蟲實戰:研究openpyxl庫相關技術

1. 引言 在當今數字化時代,互聯網上蘊含著海量有價值的數據。如何高效地獲取這些數據并進行分析處理,成為數據科學領域的重要研究方向。網絡爬蟲作為一種自動化的數據采集工具,可以幫助我們從網頁中提取所需的信息。而 openpyxl 作為 Python 中處理 Excel 文件的優秀庫,能…

Redis學習其一

文章目錄1.NoSQL概述1.1概述1.2Nosql的四大分類2.Redis入門2.1概述2.2基礎知識2.2.1基礎命令/語法2.2.2Redis為什么單線程還這么快2.3性能測試3.五大數據類型3.1Redis-key3.2String(字符串)3.3List(列表)3.4Set(集合)3.5Hash(哈希)3.6Zset(有…

高性能架構模式——高性能緩存架構

目錄 一、引入前提二、緩存架構的設計要點2.1、緩存穿透2.1.1、緩存穿透第一種情況:存儲數據不存在2.1.2、緩存穿透第二種情況:緩存數據生成耗費大量時間或者資源2.2、緩存雪崩2.2.1、解決緩存雪崩的第一種方法:更新鎖機制2.2.2、解決緩存雪崩的第二種方法:后臺更新機制2.3…

ubuntu+windows雙系統恢復

文章目錄前言一、恢復windows1.直接在grub命令行輸入exit退出2.手動查找windows引導文件先ls列出所有磁盤和分區查找各個分區是否包含引導文件設置引導分區以及引導文件路徑啟動windows二、在windows系統下刪除Ubuntu殘留引導文件三、準備ubuntu系統引導盤四、安裝ubuntu系統五…

使用Dify構建HR智能助理,深度集成大模型應用,賦能HR招聘管理全流程,dify相關工作流全開源。

HR智能助理系統 📋 項目概述 HR智能助理系統是一個基于AI技術的人力資源管理平臺,旨在通過智能化工具提升招聘效率,優化候選人評估流程,并提供專業的面試方案生成服務。 🎯 核心價值 提升招聘效率60%:自動化…

PowerBI實現僅在需要圖表時顯示圖表

PowerBI實現僅在需要圖表時顯示圖表實現效果點擊維度前:點擊維度后:實現步驟第一步,先創建一個矩陣表和一個柱形圖第二步,添加一個新卡片圖第三步,創建文本度量值Text "? 選擇一個地區"第四步,創…

信息收集知識總結

信息收集 在信息收集中,需要收集的信息:目標主機的DNS信息、目標IP地址、子域名、旁站和C段、CMS類型、敏感目錄、端口信息、操作系統版本、網站架構、漏洞信息、服務器與中間件信息、郵箱、人員、地址等。 域名信息收集 拿到公司名或者一個域名&…

工作第一步建立連接——ssh

照本宣科 SSH(Secure Shell,安全外殼協議)是一種用于在不安全網絡上進行安全遠程登錄和實現其他安全網絡服務的協議.功能主要是遠程登陸和文件傳輸(使用scp) 為了建立 SSH 遠程連接,需要兩個組件&#xf…

Markdown變身Word,解鎖格式轉換新姿勢

目錄一、引言二、在線轉換工具使用法2.1 工具推薦2.2 操作步驟2.3 優缺點分析三、文本編輯器的內置功能或插件3.1 適用編輯器列舉3.2 以 Visual Studio Code 為例的操作流程3.3 優勢說明四、使用專門的轉換軟件4.1 Pandoc 軟件介紹4.2 安裝步驟4.3 命令行轉換操作五、編程腳本實…

MR 處于 WIP 狀態的WIP是什么

WIP是什么 在MR(Merge Request 或代碼合并請求)中,WIP 是"Work In Progress" 的縮寫,意思是“正在進行中”或“在制品”。當一個MR 被標記為WIP,通常表示它尚未準備好被合并,可能還在開發中&…

機器學習-線性回歸模型和梯度算法

1. 線性回歸模型1.1 線性回歸模型線性回歸模型:將數據擬合成一條直線。作用:預測數字作為輸出。例子:房子的大小與房價的估計(圖表)(數據表)1.2 訓練集訓練集:用于訓練模型的數據集訓…

時序預測 | Matlab代碼實現VMD-TCN-GRU-MATT變分模態分解時間卷積門控循環單元多頭注意力多變量時序預測

預測效果代碼功能 代碼主要功能 該代碼實現了一個變分模態分解時間卷積門控循環單元多頭注意力多變量時間序列預測模型,核心功能為: 使用VMD(變分模態分解)將原始信號分解為多個IMF分量對每個IMF分量構建TCN-GRU-MATT混合神經網絡…

HTML5 離線存儲

HTML5 離線存儲(通常指 Application Cache)是早期用于實現 Web 應用離線訪問的技術,但由于其設計缺陷已被廢棄。現代 Web 開發中,取而代之的是更強大的 Service Worker Cache API 方案(屬于 Progressive Web Apps 技術…

JavaScript 性能優化實戰:深入性能瓶頸,精煉優化技巧與最佳實踐

前言 現代前端開發,不僅要“能跑”,更要“跑得快”。在用戶體驗為王的時代,JavaScript 性能優化已經成為前端工程師的必修課。 為什么要關注 JavaScript 性能 加載緩慢 → 用戶流失卡頓滯后 → 交互體驗崩潰資源浪費 → 設備電量與內存被吞…

文心4.5開源背后的戰略棋局:百度為何選擇All in開放?

文章目錄引言:一場顛覆AI行業格局的孤注國內開源模型的崛起與威脅國際競爭格局的重塑1.技術維度:開源是突破模型性能瓶頸的“加速器”1.1 閉源模型的“內卷化”困境1.2 文心4.5的開源技術架構:從“黑箱”到“樂高”1.2.1文心4.5的技術創新1.2…

SAP學習筆記 - 開發46 - RAP開發 Managed App Metadata Extension 2 - Booking_M,BookSuppl_M

上一章講了 RAP開發中,New Service Definition,Metadata Extension,在Metadata 文件中 復習了 lineItem,selectionField,Search,ObjectModel,Value Help,headerInfo 等內容。 SAP學…

# Win11開機卡死?無法進入登錄界面?3招強制進安全模式,快速修復系統

Win11開機卡死?無法進入登錄界面?3招強制進安全模式,快速修復系統一、問題描述: 當你的win11電腦開機后卡在圖片界面就死機,無法進入登錄界面,不顯示windows徽標,不能正常啟動,可能的…

快捷支付與網關支付:兩種主流支付方式的深度解析

在當今數字化支付時代,快捷支付和網關支付作為兩種主流的電子支付方式,為消費者和商家提供了多樣化的支付選擇。本文將深入探討這兩種支付方式的區別、適用場景及各自的優劣勢,幫助您更好地理解現代支付生態。一、快捷支付:便捷高…

【WRFDA數據教程第一期】LITTLE_R 格式詳細介紹

目錄LITTLE_R 格式概述LITTLE_R 的結構1-Header Record 詳解:觀測的“身份證”2-Data Record:觀測數據本體3-Ending Record:終止標志4-Tail Integers:尾部校驗字段另-Missing Values(缺測值處理)Mandatory,…