[2020-ECCV]PIPAL-a Large-Scale Image Quality Assessment Dataset for Perceptual Image Restoration論文簡析

[2020-ECCV] PIPAL: a Large-Scale Image Quality Assessment Dataset for Perceptual Image Restoration 論文簡析

論文:https://arxiv.org/abs/2007.12142
代碼及數據集:https://github.com/HaomingCai/PIPAL-dataset

概述

本文認為隨著圖像重建(IR)算法的快速發展(特別是一些基于GAN的模型的出現),使得現有的圖像質量評價(IQA)的方法已經不能很好地評估這些圖像重建方法。因此,IQA方法應當隨著IR算法一起演進更新。基于此,本文提出了一個新的大型圖像感知評估數據集PIPAL,并且該數據集使用了Elo評分系統來對兩兩圖像進行比較,更新評分,這使得該數據集的評分標簽可以不斷地更新,以適應將來可能會出現的新型IR算法。并且,本文基于PIPAL數據集為IQA和IR提出了一種新的指標。結果顯示本文的數據集和指標能更好地評價最近基于GAN的IR算法。

其借用的Elo等級分系統的一個好處是:每次接收評分者給出的標簽時,并不需要評分者直接給出MOS分的絕對數值,而是請評分者在兩張圖像中選出較好的一張即可。這無疑降低了受訪評分者評分的難度,并大大提高了了收集評分的可信度。畢竟,按照人類的主觀感知對一張圖像直接給出數值分數還是一件相當tricky的事情。受到個人狀態、心情等方面的影響,同一個人在不同的時間對同一張圖像的打分可能是不同的,但是兩張圖像中哪一張更好一點的判斷基本是不會變的。

摘要

圖像質量評價(IQA)是圖像重建(IR)算法發展的關鍵因素。最近的基于GAN的圖像重建方法取得了較大的性能提升,但是量化評估仍然是較大的挑戰。尤其是,我們觀察到感知質量和評估結果之間越來越不一致。由此,我們提出兩個問題:一是現有的IQA方法能否客觀地評估最近的IR算法?二是當致力于打敗最新的benchmark,我們是否真的得到了更好地IR算法?為了回答這些問題,和促進IQA模型的發展,我們提出了一個大規模的IQA數據集,叫做Peceptual Image Processing Algorithms(PIPAL) 數據集。特別之處在于,本數據集是基于GAN的方法的結果,這在之前的數據集中是沒有的。我們收集了超過113萬條人類判斷來使用更可靠的“Elo系統”為PIPAL圖像分配主觀分數。基于PIPAL,我們為IQA和SR模型提出了一種新的指標。我們的結果顯示現有的IQA方法并不能很好地評估基于GAN的IR算法。使用合適的評估方法是很重要的,IQA方法應當隨著IR算法的發展一起更新。最后,我們通過引入 anti-aliasing pooling 來提高基于GAN畸變的IQA網絡的性能。實驗證明了該方法的有效性。

PIPAL數據集

本文從以下三個方面來介紹PIPAL數據集:

  • 參考圖像的收集
  • 降質方法的質量和種類
  • 主觀分數的收集

參考圖像的收集

從高質量圖像數據集DIV2K和Flickr2K,更關注與較難重建的部分,比如高頻紋理信息。我們將這些表示紋理的部分塊從所選圖像中切下來。所選的圖像包含了各種不同的真實世界的紋理信息,包括但不限于:建筑物、動植物、人臉、文字和合成的紋理等。切下來的圖像的尺寸為288。

圖像降質

本數據集中有40中降質方法,分為四個子類。總覽如下表:

在這里插入圖片描述

  • 第一個子類包含了許多傳統的降質方法。比如模糊、噪聲、壓縮等,即一些低層的圖像編輯操作。
  • 第二個子類是一些現有算法的超分結果。這些超分算法又分為三類。傳統算法、PSNR導向的算法和基于GAN的算法。傳統算法在某種程度上可以理解為細節上的損失;PSNR導向的算法通常是基于深度模型的,它們比傳統算法有更銳利的邊緣和更好的PSNR表現;基于GAN的算法通常與細節損失的質量不太匹配,因為它們通常包含類紋理噪聲,或噪聲的質量,類紋理噪聲在外觀上與GT相似但不準確。 基于 GAN 的失真示例如下圖所示。測量不正確但相似特征的相似性對于感知超分的發展非常重要。

在這里插入圖片描述

  • 第三個子類包括幾種去噪算法的輸出。 與圖像 SR 類似,所使用的去噪算法包含基于模型的算法和基于深度學習的算法。 除了高斯噪聲,我們還包括 JPEG 壓縮噪聲去除結果。
  • 最后,我們包括混合退化的恢復結果。 如之前的工作所述,依次執行去噪和 SR 將帶來新的偽影或不同的模糊效果。

總之,我們有40中降質類型和116中不同的降質等級,總共29K張降質圖像。

Elo等級分系統

前人的MOS得分方法

給定失真圖像,為每個失真圖像提供平均意見得分 (MOS)。

  1. 早期的數據集使用“五級評級”方法,其中圖像直接分為五個類別。 當評分者沒有足夠的經驗時,使用這種方法會導致巨大的偏差。
  2. 后來,數據集通常使用瑞士評級系統通過大量成對選擇來收集 MOS。 然而,這種成對 MOS 的計算方式使其依賴于特定的數據集,這意味著當兩個失真圖像包含在兩個不同的數據集中時,它們的 MOS 分數可能會發生顯著變化。
  3. 為了消除這種集合依賴效應,又有人提出僅基于成對偏好的概率來構建數據集。這種方法可以提供更準確的傾向概率。 但是,它不僅需要大量的人工判斷,而且無法提供失真類型的 MOS。

ELo等級分系統

在本文提出的數據集中,我們采用 Elo 評分系統將成對偏好概率和評分系統結合在一起。 Elo 系統的使用不僅提供了可靠的人工評級,而且還減少了所需人工判斷的次數。

Elo 評分系統是一種基于統計的評分方法,最初被提出用于評估國際象棋選手的水平。 我們假設兩個圖像 IAI_AIA?IBI_BIB? 之間的用戶偏好遵循由他們的 Elo 分數參數化的邏輯分布logistic distribution。 給定他們的 Elo 分數 RAR_ARA?RBR_BRB?,期望的偏好概率如下:
PA>B=11+10(RB?RA)/M,PB>A=11+10(RA?RB)/MP_{A>B}=\frac{1}{1+10^{(R_B-R_A)/M}},\ \ \ P_{B>A}=\frac{1}{1+10^{(R_A-R_B)/M}} PA>B?=1+10(RB??RA?)/M1?,???PB>A?=1+10(RA??RB?)/M1?
其中 PA>BP_{A>B}PA>B? 表示一個評分者會相比與 IBI_BIB? 更喜歡 IAI_AIA? 的概率。MMM 是分布的一個參數,在我們的數據集中 M=400M=400M=400 。一旦評分者作出了選擇,我們會根據以下規則為 IAI_AIA?IBI_BIB? 更新Elo分數:
RA′=RA+K×(SA?PA>B),RB′=RB+K×(SB?PB>A)R'_A=R_A+K\times (S_A-P_{A>B}), \ \ \ R'_B=R_B+K\times (S_B-P_{B>A}) RA?=RA?+K×(SA??PA>B?),???RB?=RB?+K×(SB??PB>A?)
其中 KKK 是一次判斷的變化步長,設置為16。SAS_ASA? 表示是否選擇 IAI_AIA?:如果IA獲勝,SA=1S_A=1SA?=1,如果 IAI_AIA? 失敗,SA=0S_A=0SA?=0。 通過數千次人工判斷,每個扭曲圖像的 Elo 分數都會收斂。 最后幾個步驟的 Elo 分數的平均值將被指定為 MOS 主觀分數。 平均操作旨在減少 Elo 變化的隨機性。

例子

舉個例子。 假設 RA=1500R_A = 1500RA?=1500,和 Rb=1600R_b = 1600Rb?=1600,那么我們有 PA>B≈0.36P_{A>B} ≈ 0.36PA>B?0.36PB>A≈0.64P{B>A} ≈ 0.64PB>A0.64。 在這種情況下,如果選擇 IAI_AIA?,則 IAI_AIA? 的更新 Elo 分數將為 RA=1500+16×(1?0.36)≈1510R_A = 1500 + 16× (1 ?0.36) ≈ 1510RA?=1500+16×(1?0.36)1510IBI_BIB? 的新分數為 RB=1600+16×(0?0.64)≈1594R_B = 1600 + 16 × (0 ? 0.64)≈1594RB?=1600+16×(0?0.64)1594; 如果選擇 IBI_BIB?,新的分數將是RA≈1494R_A≈1494RA?1494RB≈1605R_B≈1605RB?1605。注意,由于選擇不同圖像的預期概率不同,Elo分數的值變化也會不同。 這也表明,當質量相差太大時,獲勝者不會從糟糕的圖像中獲得很多收益。 根據上式,200 的分差表示 76% 的獲勝機會,400 表示超過 90% 的機會。 最開始,我們為每個扭曲的圖像分配一個 1400 的 Elo 分數。 經過多次人工判斷(在我們的數據集中,我們有 113 萬次人工判斷),最終得到了每張圖像的 Elo 分數。

采用 Elo 系統的另一個優勢是我們的數據集可以是動態的,并且可以在未來擴展。 Elo 系統在電子游戲中被廣泛用于評估玩家的相對水平,在電子游戲中,玩家不斷變化,Elo 系統可以在少數游戲玩法中為新玩家提供評分。 回想一下,“這些 IQA 方法面臨挑戰”的主要原因之一是 GAN 和基于 GAN 的 IR 方法的出現。如果將來提出其他新型的圖像生成技術會怎樣? 人們是否需要構建一個新的數據集來包含這些新算法? 憑借 Elo 系統的可擴展特性,人們可以輕松地將新的失真類型添加到該數據集中并遵循相同的評級過程。 Elo 系統會自動調整所有失真的 Elo 分數,而不需要再對舊的重新評分。

結果

本文基于提出的 PIPAL 數據集進行了全面的研究。 首先為IQA方法建立一個基準。 通過這個基準,回答了“現有的 IQA 方法能否客觀地評估最近的 IR 算法?”的問題。 然后,本文為一些最近的 SR 算法建立了一個基準,以探索 IQA 方法的發展與 IR 研究之間的關系。 我們可以得到這樣的答案:“我們是否通過在這些 IQA 方法上擊敗基準來獲得更好的 IR 算法?” 最后,我們通過與其他現有的失真類型進行比較來研究基于 GAN 的失真的特征。 最后還通過引入anti-aliasing pooling來提高 IQA 網絡在基于 GAN 的失真上的性能。

實驗部分有興趣的話,請自行查閱原文吧。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/532730.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/532730.shtml
英文地址,請注明出處:http://en.pswp.cn/news/532730.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

郫都區計算機老師周俊老師,教師節,帶你走進郫都教師背后的故事

點擊“郫都教育”關注我們:)有這樣一群人“師者,所以傳道,授業,解惑也”是他們奉獻一生的事業“隨風潛入夜,潤物細無聲”是他們培養英才的責任“春蠶到死絲方盡,蠟炬成灰淚始干”是他們追求終生的信仰值此第…

(2021) 18 [代碼講解] 可執行文件

(2021) 18 [代碼講解] 可執行文件 南京大學操作系統課蔣炎巖老師網絡課程筆記。 視頻:https://www.bilibili.com/video/BV1HN41197Ko?p18 講義:http://jyywiki.cn/OS/2021/slides/C8.slides#/ 背景 回顧 程序 狀態機 狀態機執行 狀態機上的路徑狀…

如何學習計算機思維,劉康平:為什么我們每個人都應該學習計算思維?

不久前,微軟亞洲研究院資深學術合作經理劉康平應邀在“造就”做了演講,以下為演講節選,由“造就”授權轉載。劉康平 微軟亞洲研究院資深學術合作經理以中國象棋為例,在這樣一個棋局上,你怎么用最快的方式找到「將」和「…

鏈接與加載-NJU-JYY

(2021) 19 [代碼講解] 從零實現動態加載 南京大學操作系統課蔣炎巖老師網絡課程筆記。 視頻:https://www.bilibili.com/video/BV1N741177F5?p15 講義:http://jyywiki.cn/OS/2021/slides/C9.slides#/ 背景 回顧: ELF可執行文件 只要能完成…

計算機械功的公式,機械功率計算公式

初中物理公式物理量(單位) 公式 備注 公式的變形速度V(m/S) v S /t (S::路程; t::時間 )重力G(N) Gmg (m:質量;g:9.8N/kg或者10N/kg)密度ρ(kg/m3) ρ m:質量/V:體積 (m:…

饑荒聯機自建服務器有什么用,聯機版饑荒使用專用服務器的好處 | 手游網游頁游攻略大全...

發布時間:2016-02-15存檔保存位置是?很多玩家對此并不是很了解,不過別著急喲,下面99單機小編就為你帶來高玩分享的相關技巧心得攻略,希望大家能喜歡. 聯機版的存檔與單機版是不同的,由于聯機版饑荒建 ...標簽:游戲資訊 攻略秘籍發布時間:201…

(2021) 26 [持久化] 持久數據的可靠性:RAID和journaling

(2021) 26 [持久化] 持久數據的可靠性:RAID和journaling 南京大學操作系統課蔣炎巖老師網絡課程筆記。 視頻:https://www.bilibili.com/video/BV1HN41197Ko?p26 講義:http://jyywiki.cn/OS/2021/slides/16.slides#/ 背景 回顧 文件系統 …

計算機-p命令,OD(電腦命令)_百度百科

od 命令用途是以指定格式顯示文件。常見的文件為文本文件和二進制文件。此命令主要用來查看保存在二進制文件中的值。比如,程序可能輸出大量的數據記錄,每個數據是一個單精度浮點數。這些數據記錄存放在一個文件中,如果想查看下這個數據&…

Linux下編譯、鏈接、加載運行C++ OpenCV的兩種方式及常見問題的解決

Linux下編譯、鏈接、加載運行C OpenCV的兩種方式及常見問題的解決 在Linux下安裝完OpenCV C之后(還沒有安裝的讀者請參考Ubuntu 18.04 安裝OpenCV C),本文將探索Linux下編譯、鏈接C OpenCV的兩種方式,并且給出筆者在初次嘗試時遇…

win10無法檢驗服務器出示的ssl證書,win10系統網站啟用ssL安全證書的操作方法

win10系統網站啟用ssL安全證書的操作方法?很多win10用戶在使用電腦的時候,會發現win10系統網站啟用ssL安全證書的的現象,根據小編的調查并不是所有的朋友都知道win10系統網站啟用ssL安全證書的的問題怎么解決,不會的朋友也不用擔心&#xff…

Linux下構建自己的C++共享庫并配合pkg-config生成鏈接選項

Linux下構建自己的C共享庫并配合pkg-config生成鏈接選項 本文將以C鏈表的新建、打印操作為例構建自己的共享庫,并在實際調試代碼時嘗試使用。我們在做數據結構題時經常需要將鏈表打印出來看一下結果,但是并沒有一種庫函數可以讓我們直接調用來打印自己的…

webkitlineclamp css3,-webkit-line-clamp

無標題文檔static:對象遵循常規流。top,right,bottom,left等屬性不會被應用。 relative: 對象遵循常規流,并且參照自身在常規流中的位置通過top,right,bottom,left屬性進…

Linux內核初探

Linux內核初探 內核的組成部分 kernel:內核核心文件,一般為bzp_w_picpath,經過壓縮處理的鏡像文件;通常內核核心文件保存在/boot/目錄下,名稱為vmlinuz-version-release kernel object(ko):內核對象&…

Nplayer本地文件拷到服務器,手把手教你簡易NAS構建,手機/平板/智能電視隨意調取,家庭存儲云共享,有了自己的網絡云盤后再也不用擔心容量不夠了!...

之前嫌鍵盤俠煩,寫這些也沒意義所以把賬號注銷了文章刪除了,現在想了想我抗吧12級老蛆還噴不過這幫小兔崽子?換了skt.ruo穢土轉生,求噴子和我在各評論對線。特別是匿名dog見一個懟死一個。下面是之前號寫的內容原文 -#簡介NAS全稱…

gdb 入門

gdb 入門 簡介 gdb是GNU開源組織發布的一個強大的Linux下的程序調試工具。 一般來說,GDB主要幫助你完成下面四個方面的功能: 1、啟動你的程序,可以按照你的自定義的要求隨心所欲的運行程序。 2、可讓被調試的程序在你所指定的調置的斷點…

視頻監控系統中的平臺服務器,【視頻監控主機 網絡視頻集中管理平臺服務器】 - 太平洋安防網...

完善的管理功能管理系統內所有設備的接入及設備權限。設備狀態監視。系統資源及用戶權限分配及系統搶權管理。電子地圖。實現系統內視頻流的管理和轉發控制。可通過WEB遠程管理。強大的報警事件管理功能系統具備完善的報警及處理功能,能根據預先編寫事件 處理預案對…

Linux下的CUDA多版本管理

Linux下的CUDA多版本管理 關于CUDA、cuDNN等的簡介和安裝可參考:顯卡、顯卡驅動、CUDA、CUDA Toolkit、cuDNN 梳理。 CUDA多版本 有時我們會在一臺機器上同時看到多個版本的CUDA,比如nvcc -V和nvidia-smi的輸出就可能會不同: 在我們實驗室…

電腦顯示無法連接sql服務器,他人的電腦為什么無法連接我電腦上的sql sever服務器...

如果SQL2005連接不上,并且服務器上所有與防火相關的東西都關閉了,還是連接不上。進行如下操作:一、為 SQL 啟用遠程連接1. 單擊“開始”,依次指向“程序”、“Microsoft SQL Server 2005”和“配置工具”,然后單擊“SQL Server 外…

ONNX初探

ONNX初探 轉載自:https://blog.csdn.net/just_sort/article/details/112912272 0x0. 背景 最近看了一些ONNX的資料,一個最大的感受就是這些資料太凌亂了。大多數都是在介紹ONNX模型轉換中碰到的坑點以及解決辦法。很少有文章可以系統的介紹ONNX的背景…

服務器修改地址,服務器修改管理地址

服務器修改管理地址 內容精選換一換在彈性云服務器上安裝完成后輸入公網IP,無法連接目的虛擬機,端口無法訪問工具。源端網絡未連通目的端。目的端安全組未開放8084端口。目的端網絡ACL禁用了8084端口。登錄源端服務器后,在源端服務器中ping 目…