(cvpr2025) Adaptive Rectangular Convolution for Remote Sensing Pansharpening

論文:(cvpr2025) Adaptive Rectangular Convolution for Remote Sensing Pansharpening

代碼:https://github.com/WangXueyang-uestc/ARConv.git

這個論文研究的是全色與多光譜圖像的融合。作者認為現有的基于CNN的方法中,傳統的卷積存在兩個問題:問題1,卷積被限制在一個固定的方形窗口內。問題2,采樣點的個數是預設的,保持不變。

為了解決這兩個問題,作者提出了 ARConv (Adaptive Rectangular Convolution),與當前方法的比較如下圖所示,最大的變化是窗口可以變成3x5這樣的形狀,這個尺寸是通過網絡學出來的。

作者提出了ARConv ,如下圖所示,主要包括四個步驟:

  • 學習卷積核的高度和寬度:用網絡學習每個像素位置的卷積核高度和寬度。每個位置學到的卷積核高度和寬度是不同的,這使得卷積核的形狀能夠自適應地調整以適應不同尺度的物體。(網絡的最后輸出是 sigmoid函數,因此輸出是(0,1)區間,作者使用a,b變量進行了縮放,這個變量是通過實驗手工設置的)
  • 確定采樣點的數量: 根據高度和寬度特征圖的平均值,通過映射函數選擇垂直和水平方向上的采樣點數量,并確保采樣點數量為奇數。(作者設計了變量m,n,可以用高度、寬度平均值除以m,n得到采樣點數量,這個m,n也是手工設置的)
  • 生成采樣圖:基于標準卷積的采樣網格,通過縮放矩陣調整采樣點位置,并采用雙線性插值估計非整數位置的像素值。
  • 卷積實現:對生成的采樣圖進行卷積操作,并引入仿射變換以增強空間適應性。

在這里插入圖片描述

全色與多光譜圖像的融合網絡的整體架構如下圖所示,是典型的UNET結構,中間加了5個應用ARConv的block。

ARConv 的特點是: 卷積可以適應圖像中不同大小和形狀的物體。在遙感圖像中,物體的尺度差異很大,例如小汽車和大型建筑物。傳統的固定形狀卷積核(如 3x3 或 5x5)無法有效地捕捉這些不同尺度的特征,而ARConv通過自適應調整卷積核的形狀,能夠更好地提取每個局部區域的特征。盡管卷積核大小不同,但最后采樣點又是相同的,這樣又加速了計算。為證明研究動機,可視化是必要的,也就是說對于不同尺寸的目標,學習到的卷積核大小是不同的。 論文中有一個實驗,如下圖所示,作者把5個block里學到的卷積核大小可視化出來了。作者指出,在第四層建筑外圍有一條藍細線,這表明卷積核的高度在邊緣處較小。

實驗部分可以參考作者論文,這里不過多介紹。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/909921.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/909921.shtml
英文地址,請注明出處:http://en.pswp.cn/news/909921.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【圖像處理入門】7. 特征描述子:從LBP到HOG的特征提取之道

摘要 特征描述子是圖像處理中提取圖像本質信息的關鍵工具。本文將深入講解局部二值模式(LBP)與方向梯度直方圖(HOG)兩種經典特征描述子的原理、實現方法及應用場景。結合OpenCV代碼示例,展示如何利用LBP提取紋理特征、使用HOG進行目標檢測,幫助讀者掌握從圖像中提取有效…

AI 應用開發的‘核心樞紐’:Dify、Coze、n8n、FastGPT、MaxKB、RAGFlow 等六大平臺全面對決

在人工智能與自動化流程日益普及的當下,各類平臺如雨后春筍般涌現,成為構建智能應用與自動化工作流的 “核心樞紐”。其中,Dify、Coze、n8n、FastGPT、MaxKB、RAGFlow 備受矚目,它們各自具備獨特的功能與優勢,適用于不…

RV1126+OPENCV對視頻流單獨進行視頻膨脹/腐蝕操作

一.RV1126OPENCV對視頻流進行視頻膨脹操作的大體流程圖 思路:初始化VI與VENC模塊,之后開啟兩個線程,一個線程從VI模塊獲取視頻流數據,用Opencv的Mat將其轉成Mat矩陣之后進行用dilate膨脹,將膨脹之后的視頻數據用send函…

Cordova + Vue 移動端視頻播放組件(支持 HLS + 原生播放器兜底)

在混合 App 中,移動端使用 標簽播放視頻經常踩坑,尤其是格式兼容、跨域限制、WebView 差異等問題。 本文介紹一個通用的 Cordova 視頻播放組件:優先 HTML5 播放,播放失敗自動提示用戶使用系統播放器,并支持原生插件兜底…

【Linux】掌握vim編譯器使用——詳細教程

提示:文章寫完后,目錄可以自動生成,如何生成可參考右邊的幫助文檔 文章目錄 一、Vim的三種核心模式解析 二、高效編輯核心命令大全 1. 光標快速導航 2. 文本編輯四連擊 3. 高效搜索替換 三、Vim神技:批量注釋與多文件編輯 1. 批量…

Oracle遷移瀚高,如何做表等對象與文件名一對一的文件腳本(APP)

文章目錄 環境文檔用途詳細信息 環境 系統平臺:Linux x86-64 Red Hat Enterprise Linux 7 版本:4.5 文檔用途 Oracle遷移到瀚高后,需要整理一張表對應一個與表同名的腳本,一個函數對應一個與函數同名的腳本 詳細信息 一、整理…

洞察分享 | 在萬物互聯的時代,如何強化網絡安全,更有效地保護工業基礎設施?

2025年,物聯網(IoT)與互聯系統已深度融入工業4.0的發展之中,同時也帶來了前所未有的網絡安全挑戰。隨著工業系統的互聯互通不斷加深,網絡攻擊的范圍和類型不斷增加,關鍵基礎設施因此面臨更高的網絡風險暴露…

k8s 1.23.6版本apiserver list-watch原理機制

Kubernetes 1.23.6 版本中,API Server 的 **List-Watch 機制** 是集群狀態同步的核心機制,其設計目標是高效、實時地將資源變更通知到各組件(如 kubelet、controller-manager等)。以下是其詳細原理和工作機制: 1. 核心…

Linux基本指令篇 —— mkdir指令

mkdir是Linux和Unix-like系統中用于創建目錄的基本命令,全稱為"make directory"。下面將詳細介紹這個命令的用法、選項和實際應用。 目錄 一、基本語法 二、基本用法 創建單個目錄 創建多個目錄 三、常用選項 -p 或 --parents -m 或 --mode -v 或 …

聊聊GPIO 工作模式

嵌入式開發中,GPIO(General-Purpose Input/Output)是最基礎也最常用的功能模塊之一。你可以把它想象成微控制器伸出來的無數根“手腳”:既可以用它輸出信號去點亮LED、驅動外設,也可以用它輸入信號來檢測按鍵、讀取傳感…

DM9000AE+STM32H7在rt-thread中的使用

概述 記錄下DM9000AE在rt-thread上的使用 FMC的配置 rt-thread的網絡設備驅動注冊 硬件連接 16bit總線 掛在FMC_A0 地址0x6000_0000 FMC的配置 FMC是STM32H7的一個外設,通過FMC把DM9000當做一個SRAM來訪問,只需要配置好FCM的時序就可以了。 DM9000…

TiDB 字符串行轉列與 JSON 數據查詢優化知識筆記

一、長字符串行轉列方案 JSON_TABLE 方案(TiDB 5.0 推薦) 通過將逗號分隔字符串轉為 JSON 數組后展開為行: sql SET str ‘a,b,c,d’; SELECT jt.val, jt.pos FROM JSON_TABLE( CONCAT(‘[’, REPLACE(str, ‘,’, ‘“,”’), ‘"]’…

1 Studying《Performance Analysis and Tuning on Modern CPUs》7-11

目錄 Part2. Source Code Tuning For CPU 數據驅動優化 7 CPU Front-End Optimizations 7.1 Machine code layout //機器碼布局 7.2 Basic Block 7.3 Basic block placement 7.4 Basic block alignment 7.5 Function splitting //函數拆分 7.6 Function groupin…

WinUI3入門6:子線程處理UI 窗口加載后執行 獲取和設置控件尺寸 自動生成事件代碼框架

初級代碼游戲的專欄介紹與文章目錄-CSDN博客 我的github:codetoys,所有代碼都將會位于ctfc庫中。已經放入庫中我會指出在庫中的位置。 這些代碼大部分以Linux為目標但部分代碼是純C的,可以在任何平臺上使用。 源碼指引:github源…

中國招聘智能化白皮書:從 “人撐不住“ 到 “AI 破局“ 的底層邏輯革命——AI得賢招聘官第六代AI面試官

一場面試,牽動一家公司的人力系統。 當簡歷數量以千計堆疊、當HR通宵挑燈刷篩選、當面試質量與效率陷入兩難,招聘不再只是流程問題,而成了“組織生存”的關鍵變量。 問題是:靠人,已經撐不住了。 企業招聘正步入前所…

防爆型激光測距傳感器:危險環境中的安全守護者

在石油化工、煤礦開采、核電站等高危工業場景中,爆炸性氣體與粉塵的存在讓傳統測量設備望而卻步。而防爆型激光測距傳感器的出現,猶如為這些領域注入了一劑“安全強心針”,以毫米級精度與防爆雙重保障,重新定義了工業測量的安全邊…

【AI編程】PC的一個提示詞,生成網站首頁,模型gpt4.1 、deepseekv3和claude3.7對比,你更喜歡哪個?

AI提示詞: 角色 你是一位資深的前端工程師、設計師和插畫師 設計風格 優雅的極簡主義美學與功能的完美平衡; 清新柔和的漸變配色與品牌色系渾然一體; 恰到好處的留白設計; 輕盈通透的沉浸式體驗; 信息層級通過微妙的陰影過渡與模塊化卡片布局清晰呈現; 按鈕添加…

跟著AI學習C# Day12

&#x1f4c5; Day 12&#xff1a;LINQ&#xff08;Language Integrated Query&#xff09;基礎 ? 目標&#xff1a; 理解 LINQ 的基本概念和作用&#xff1b;掌握使用 LINQ 查詢集合&#xff08;如 List<T>、Array&#xff09;&#xff1b;學會使用常用 LINQ 方法&am…

ubuntu網絡管理五花八門netplan 、NetworkManager、systemd、networking是什么關系

文章目錄 **1. Netplan&#xff08;網絡配置抽象層&#xff09;****2. NetworkManager&#xff08;動態網絡管理&#xff09;****3. systemd-networkd&#xff08;輕量級網絡管理&#xff09;****4. networking&#xff08;傳統的 ifupdown&#xff09;****5. 它們之間的關系**…