CVPR 2024最佳論文分享:打破剛性的超分辨率圖像處理GNN

CVPR 2024最佳論文分享:打破剛性的超分辨率圖像處理GNN

CVPR(Conference on Computer Vision and Pattern Recognition)是計算機視覺領域最有影響力的會議之一,主要方向包括圖像和視頻處理、目標檢測與識別、三維視覺等。近期,CVPR 2024 公布了最佳論文。共有10篇論文獲獎,其中2篇最佳論文,2篇最佳學生論文,2篇最佳論文題目和4篇最佳學生論文提名。本公眾號推出CVPR 2024最佳論文專欄,分享這10篇最佳論文。

本文詳細介紹了CVPR 2024最佳論文《Image Processing GNN: Breaking Rigidity in Super-Resolution》。該論文的第一作者為北京大學博士田雨川。論文針對超分辨率圖像重建中的剛性問題,提出了一個新的圖神經網絡模型IPG,通過靈活的圖結構提升超分辨率性能。本文由李楊撰寫,審校為朱旺和陸新穎。

1.研究背景與解決的關鍵問題

超分辨率(Super-Resolution, SR)是指從低分辨率圖像重建高分辨率圖像。在現有的SR方法中,卷積神經網絡(Convolutional Neural Network,CNN)和基于自注意力機制的Transformer模型是主要的兩大類方法。然而,這些方法在操作上存在剛性問題:每個像素聚集相同數量的鄰近像素信息,導致在細節豐富的圖像部分上重建效果不佳。論文提出了一種基于圖的超分辨率方法(Image Processing GNN,IPG),通過靈活的圖結構(Graph Structure)打破傳統方法的剛性限制,提升超分辨率性能。

2.方法

(1)模型架構

圖1 IPG模型的總體架構

其中, 多尺度聚合塊(Multiscale Graph-aggregation Blocks,MGB):負責從局部和全局尺度聚合信息。圖聚合層(Graph Aggregation Layers,GAL):執行圖聚合操作,聚合局部和全局信息。圖構建:在每個MGB塊中,分別執行局部和全局采樣,構建圖結構,交替分配給GAL層進行聚合操作。

(2)優勢
1)度靈活性

在傳統方法中,每個像素聚集相同數量的鄰域像素信息,這種“度等效剛性”在SR任務中顯得不合理。論文提出了一種度靈活性的圖解決方案,基于細節豐富的圖像部分,設計了一種度變異圖結構。具體來說,通過設計一個細節感知指標(Detail-rich Indicator Metric,DF),對圖像節點的重要性進行度量,并將更高的度分配給細節豐富的節點。

2)像素節點靈活性

在圖像圖結構中,論文采用像素而非圖像塊作為圖節點,以避免由于圖塊剛性導致的對齊問題。相比之下,像素節點能夠更靈活地找到其相關像素進行聚合,從而避免像素對齊問題。

3)空間靈活性

論文提出了一種結合局部和全局采樣的像素節點連接搜索策略,以聚合局部和全局信息。局部采樣在節點周圍的鄰域中選擇,構建局部圖;全局采樣在整個圖像上以擴展模式選擇,構建全局圖。通過這種方式,圖能夠靈活地聚合局部和全局信息,從而提升SR性能。

4)圖聚合

在圖聚合過程中,論文采用邊緣條件聚合(Edge-conditioned Aggregation),這種方法在保持鄰域信息的同時,關注像素之間的關系,適用于低級視覺任務。通過在節點特征中加入相對位置編碼,增強位置信息,進一步提升圖聚合的效果。

3.實驗結果

圖2 IPG-S和IPG與SR基線在FLOPs和性能方面的比較

所提出的 IPG-S 和 IPG 與 SR 基線在浮點運算次數(Floating Point Operations per Second,FLOPs)和性能方面的比較。由于圖結構的靈活性,IPG 在類似的 FLOPs下可以比其他 SR 模型高出0.1dB。值得注意的是,FLOPs僅反映理論計算成本,而不反映實際推理速度。

表1 IPG與其他SR方法在多個基準數據集上的比較

表1展示了IPG與其他SR方法在多個基準數據集上的詳細比較。結果顯示,IPG在峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)和結構相似性(Structural Similarity,SSIM)指標上均取得了顯著的提升。

4.可視化

圖3與最新 SR 基線的視覺比較

圖3展示了在Urban100數據集上的可視化結果對比。可以看到,IPG模型在細節重建方面表現優異,重建出的圖像細節更加清晰,偽影更少。

5. 結論

論文提出了一種基于圖的超分辨率方法IPG,通過靈活的圖結構打破傳統方法的剛性限制,提升超分辨率性能。實驗結果表明,IPG在多個基準數據集上的表現優于現有的SR模型。論文設計了度靈活圖、像素節點和空間靈活性策略,使得IPG能夠充分利用圖的靈活性,在超分辨率任務中取得了顯著的提升。

圖片

掃碼關注我們

微信號:人工智能怎么學

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/40445.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/40445.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/40445.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

分布式數據庫HBase:從零開始了解列式存儲

在接觸過大量的傳統關系型數據庫后你可能會有一些新的問題: 無法整理成表格的海量數據該如何儲存? 在數據非常稀疏的情況下也必須將數據存儲成關系型數據庫嗎? 除了關系型數據庫我們是否還有別的選擇以應對Web2.0時代的海量數據? 如果你也曾經想到過這些問題, 那么HBase將是…

C++: 左值引用和右值引用

目錄 概念: 理解: 左值引用,右值引用 左值引用能否給右值取別名? 右值引用能否給左值取別名? 引用的意義是什么? 左值和右值對自定義類型有什么區別嗎? move的妙用! 沒有優化…

LLMs之CriticGPT:CriticGPT的簡介、安裝和使用方法、案例應用之詳細攻略

LLMs之CriticGPT:CriticGPT的簡介、安裝和使用方法、案例應用之詳細攻略 目錄 CriticGPT的簡介 1、簡介 2、CriticGPT的方法 2.1、CriticGPT的訓練方法 2.2、CriticGPT的批評生成方法 3、局限性 4、后續步驟 CriticGPT的安裝和使用方法 CriticGPT的案例應用…

“proxy_pass“ directive is duplicate

后面發現是nginx.conf里面proxy pass這里有兩個,注釋其中一個并重新運行即可!

AI并不是開發者的敵人,而是幫助他們實現更高效工作的得力助手。

AI是在幫助開發者還是取代他們? 在軟件開發領域,生成式人工智能(AIGC)正在改變開發者的工作方式。無論是代碼生成、錯誤檢測還是自動化測試,AI工具正在成為開發者的得力助手。然而,這也引發了對開發者職業前…

基于主流SpringBoot進行JavaWeb開發的學習路線

目錄 一、學習路線 (1)第一部分(Web前端開發的技術棧) (2)第二部分(Web后端開發) 二、學習之后必備的技能 三、學習Web開發的基礎與未來的收獲 學完這一類知識目標:…

Mybatis-01 原理

一. JDBC式編程 在 jdbc 編程中,我們最常用的是 PreparedStatement 式的編程,我們看下面這個例子; Connection conn null; PreparedStatement ps null; ResultSet rs null;try {// 1. 注冊驅動Class.forName("com.mysql.jdbc.Drive…

Sping源碼總覽

源碼地址:https://github.com/spring-projects/spring-framework 倉庫地址:https://gitcode.net/qq_42665745/spring/-/tree/master 文章目錄如下: 實現一個簡單的Bean容器Bean 的定義、注冊、獲取Bean有參構造實例化Bean屬性注入資源加載器…

C++11使用std::future和std::promise實現線程同步和異步通信

std::future 和 std::promise 是 C11 引入的標準庫特性,用于實現線程間的異步通信和同步。它們提供了一種機制,使一個線程能夠生成一個值或異常,并讓另一個線程獲取這個值或異常。 (線程A中設置結果) std::promise 用于設置異步操作的結果(線…

【Jupyter Notebook與Git完美融合】在Notebook中駕馭版本控制的藝術

標題:【Jupyter Notebook與Git完美融合】在Notebook中駕馭版本控制的藝術 Jupyter Notebook是一個流行的開源Web應用程序,允許用戶創建和共享包含實時代碼、方程、可視化和解釋性文本的文檔。而Git是一個廣泛使用的分布式版本控制系統,用于跟…

關于C#在WPF中如何使用“抽屜”控件

關于C#在WPF中如何使用“抽屜”控件 1.前提準備2.XAML代碼3.對應的C#代碼4.顯示效果1.前提準備 需要引用MaterialDesign控件庫,關于如何引用,請參照文章——關于C#如何引用MaterialDesign控件庫 2.XAML代碼 <Window x:Class="MaterialDesign_Test.MainWindow"…

化身成羊:關于羊的詞群探析

在西方的神話故事中&#xff0c;像主神宙斯&#xff0c;或者基督教義中的上帝&#xff0c;通常都有化身成羊的形象。 那為什么會這樣呢&#xff1f; 一、什么是神話(myth)&#xff1f; 神話&#xff0c;正式的用詞是 mythology&#xff1a; mythology n.神話&#xff1b;神話…

Http接口RestSharp中StatusCode返回0, 但服務器或本地postman獲取應答正常(C#)

我的本地和其他服務器用同一段代碼都可以訪問&#xff1a; 原代碼&#xff1a; RestClient client new RestClient(url); client.Timeout -1; RestRequest request new RestRequest(Method.POST); request.AddHeader("Authorization", "Bearer " acc…

Echarts中的折線圖,多個Y軸集中在左側(在Vue中使用多個Y軸的折線圖)

簡述&#xff1a;在 ECharts 中&#xff0c;創建一個帶有多個 Y 軸的折線圖&#xff0c;并且將這些 Y 軸都集中顯示在圖表的左側&#xff0c;可以通過合理配置 yAxis 和 series 的屬性來實現。簡單記錄 一. 函數代碼 drawCarNumEcs() {// 初始化echarts圖表,并綁定到id為"…

網絡安全設備——探針

網絡安全設備探針是一種專門用于網絡安全領域的工具&#xff0c;它通過對網絡流量進行監控和分析&#xff0c;幫助發現和防止網絡攻擊。以下是對網絡安全設備探針的詳細解釋&#xff1a; 定義與功能 定義&#xff1a;網絡安全設備探針是一種設備或軟件&#xff0c;它通過捕獲…

【docker】運行階段遇到的問題

目錄 1、查詢docker 下掛載了哪些工具 2、docker中的簡單命令 3、實際場景應用&#xff08;redis&#xff09; 目前工作中僅用到了redis,所以沒有太多經驗可以交流&#xff0c;暫時僅將我目前遇到的進行發布。還請見諒。 1、查詢docker 下掛載了哪些工具 docker ps -a 或者…

Vue組件如何“傳話”?這里有個小秘訣!

?&#x1f308;個人主頁&#xff1a;前端青山 &#x1f525;系列專欄&#xff1a;vue篇 &#x1f516;人終將被年少不可得之物困其一生 依舊青山,本期給大家帶來vue篇專欄內容:vue-組件通信 目錄 Vue組件通信 &#xff08;1&#xff09; props / $emit 1. 父組件向子組件傳…

適合職場小白的待辦事項管理方法和工具

剛入職場那會兒&#xff0c;我每天都像只無頭蒼蠅&#xff0c;忙得團團轉卻效率低下。待辦事項像潮水般涌來&#xff0c;會議、報告、客戶跟進……每一項都像是懸在頭頂的利劍&#xff0c;讓我焦慮不堪。我深知&#xff0c;管理好待辦事項是職場生存的必修課&#xff0c;但該如…

內衣洗衣機哪個牌子好用?傾力推薦四大熱門產品,質量放心

在當今社會&#xff0c;內衣洗衣機已經成為每個家庭必不可少的家電之一。但由于市場上的內衣洗衣機品牌和型號繁多&#xff0c;對于消費者來說&#xff0c;選擇一款實用、性價比高的內衣洗衣機是非常重要的。那么&#xff0c;內衣褲洗衣機哪個品牌最好&#xff1f;接下來我將會…

框架為我們做了什么?

1. SpringBoot 1.1 web服務器 Spring Boot 的 web 服務器原理主要基于其嵌入式服務器的概念&#xff0c;這意味著它內嵌了一個 web 服務器&#xff0c;無需部署到外部服務器上。Spring Boot 內嵌了如 Tomcat、Jetty 或 Undertow 等 servlet 容器。 1.2 servlet Servlet&…