OpenCV CUDA模塊設備層-----設備端(GPU)線程塊級別的一個內存拷貝工具函數blockCopy()

  • 操作系統:ubuntu22.04
  • OpenCV版本:OpenCV4.9
  • IDE:Visual Studio Code
  • 編程語言:C++11

算法描述

在同一個線程塊(thread block內,將 [beg, end) 范圍內的數據并行地復制到 out 開始的位置。
它使用了 CUDA 線程協作機制(warp-level 或 block-level) 來實現高效的塊級拷貝,通常比簡單的逐線程拷貝更快。

函數原型

_device__ static __forceinline__ void cv::cudev::blockCopy 	
(InIt  	beg,InIt  	end,OutIt  	out 
) 		

參數

參數名類型含義
begInIt輸入范圍的起始迭代器(或指針)
endInIt輸入范圍的結束迭代器(不包含該位置)
outOutIt輸出范圍的起始迭代器(或指針)

使用場景

  • 圖像處理中的 局部塊拷貝
  • 構建 GPU 并行歸約(reduction)算法前的數據準備
  • 實現滑動窗口(sliding window)或卷積操作時的 tile 數據加載
  • 需要多個線程協同完成連續內存拷貝的任務

示例代碼


#include <opencv2/cudev/functional/functional.hpp>
#include <cstdio>
#include <opencv2/core.hpp>
#include <opencv2/core/cuda.hpp>
#include <opencv2/cudev/block/block.hpp>
#include <iostream>using namespace cv::cudev;// 定義 tile 大小為 16x16
#define TILE_SIZE 16__global__ void processImageKernel(const uchar* input, size_t pitchIn,uchar* output, size_t pitchOut,int width, int height) {// 共享內存用于存儲當前線程塊處理的 tile__shared__ uchar tile[TILE_SIZE][TILE_SIZE];// 當前線程負責的圖像坐標int x = blockIdx.x * TILE_SIZE + threadIdx.x;int y = blockIdx.y * TILE_SIZE + threadIdx.y;// 檢查是否在圖像范圍內if (x >= width || y >= height)return;// 輸入和輸出指針const uchar* in_ptr = input + y * pitchIn + x;uchar* out_ptr = output + y * pitchOut + x;// 將當前 tile 拷貝到共享內存blockCopy(in_ptr, in_ptr + TILE_SIZE * TILE_SIZE, &tile[0][0]);__syncthreads();  // 必須同步所有線程,確保共享內存拷貝完成// 對 tile 中的數據進行簡單處理(比如增加亮度)uchar value = tile[threadIdx.y][threadIdx.x];value = min(value + 50, (uchar)255);// 寫回到輸出位置blockCopy(&value, &value + 1, out_ptr);
}int main() {// 創建一個測試圖像(8UC1)cv::Mat h_src = cv::Mat::zeros(128, 128, CV_8UC1);h_src.setTo(100);  // 填充為灰度值 100// 上傳到 GPUcv::cuda::GpuMat d_src, d_dst;d_src.upload(h_src);d_dst.create(h_src.size(), h_src.type());// 設置 kernel 參數dim3 threads(TILE_SIZE, TILE_SIZE);dim3 blocks((h_src.cols + TILE_SIZE - 1) / TILE_SIZE,(h_src.rows + TILE_SIZE - 1) / TILE_SIZE);// 調用 kernelprocessImageKernel<<<blocks, threads>>>(d_src.ptr<uchar>(), d_src.step,d_dst.ptr<uchar>(), d_dst.step,d_src.cols, d_dst.rows);// 下載結果cv::Mat h_dst;d_dst.download(h_dst);// 顯示部分結果std::cout << "Output image sample:\n" << h_dst(cv::Rect(0, 0, 5, 5)) << std::endl;return 0;
}

運行結果

Output image sample:
[150,   0,   0,   0,   0;0,   0,   0,   0,   0;0,   0,   0,   0,   0;0,   0,   0,   0,   0;0,   0,   0,   0,   0]

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/88126.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/88126.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/88126.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

https沒有證書可以訪問嗎?外網怎么訪問內網?

沒有SSL證書的網站無法正常通過HTTPS協議訪問?。HTTPS的實現必須依賴有效的SSL證書完成加密握手&#xff0c;否則瀏覽器會直接阻斷連接或顯示嚴重的安全警告。?? 一、技術實現層面? ?HTTPS協議強制要求證書?。 HTTPS基于SSL/TLS協議實現加密通信&#xff0c;而SSL證書是…

Python pytesseract【OCR引擎庫】 簡介

想全面了解DeepSeek的看過來 【包郵】DeepSeek全攻略 人人需要的AI通識課 零基礎掌握DeepSeek的實用操作手冊指南【限量作者親筆簽名版售完即止】 玩轉DeepSeek這本就夠了 【自營包郵】DeepSeek實戰指南 deepseek從入門到精通實用操作指南現代科技科普讀物AI普及知識讀物人工智…

ubuntu安裝postman教程并中文漢化詳細教程

一、下載postman安裝包 通過網盤分享的文件:Postman-linux-x64-8.7.0.tar.gz 鏈接: https://pan.baidu.com/s/10WYeguDJlK85cKJ6ptX01w?pwd=xqkh 提取碼: xqkh 二、解壓到/opt目錄 tar -zxvf Postman-linux-x64-8.7.0.tar.gz如果子用戶沒有/opt權限,可以給子用戶賦予/opt的…

《壘球知識科普》壘球世界紀錄·壘球1號位

奧運壘球冠軍記錄 歷屆冠軍榜 1996亞特蘭大奧運會 冠軍&#xff1a;美國隊 ? 首屆奧運壘球賽&#xff0c;美國主場3戰全勝奪冠&#xff01; 1996 Atlanta Olympics Champion: USA ? Dominated all 3 games in first Olympic softball event 2000悉尼奧運會 冠軍&#…

通信網絡編程3.0——JAVA

主要添加了私聊功能 1服務器類定義與成員變量 public class ChatServer {int port 6666;// 定義服務器端口號為 6666ServerSocket ss;// 定義一個 ServerSocket 對象用于監聽客戶端連接//List<Socket> clientSockets new ArrayList<>();// 定義一個列表用于存儲…

RediSearch `FT.CREATE` 完全參數指南 HASH/JSON 雙寫實戰

1、索引與 Schema 速概 索引 (index) —— 倒排、前綴、向量、Geo … 元數據集合Schema —— 索引藍圖&#xff1a;定義字段、類型、權重、排序及存儲策略FT.CREATE —— 創建索引命令&#xff0c;分「索引級參數」和「字段級參數」兩層 2 、FT.CREATE 語法模板 FT.CREATE &…

QT學習教程(三十七)

系統繁忙時的響應&#xff08;Staying Responsive During Intensive Processing&#xff09; 當我們調用QApplication::exec()時&#xff0c;Qt 就開始了事件循環。啟動時&#xff0c;Qt 發出顯示和繪制事件&#xff0c;把控件顯示出來。然后&#xff0c;事件循環就開始了&…

hot100 -- 17.技巧

1.多數元素 問題&#xff1a; 給定一個大小為 n 的數組 nums &#xff0c;返回其中的多數元素。多數元素是指在數組中出現次數 大于 ? n/2 ? 的元素。 你可以假設數組是非空的&#xff0c;并且給定的數組總是存在多數元素。 方法1&#xff1a; 哈希表 實時判斷&#xff…

算法第39天| 打家劫舍 1、2、3

198. 打家劫舍 題目 思路與解法 class Solution { public:int rob(vector<int>& nums) {// dp數組含義&#xff1a;// 考慮下標i&#xff08;包括i&#xff09;以內的房屋&#xff0c;最多可以偷竊的金額為dp[i]if (nums.size() 0) return 0;if (nums.size() 1)…

車載CAN總線數據采集與故障診斷裝置設計與實現

車載CAN總線數據采集與故障診斷裝置設計與實現 鏈接:1.6W字 [下載]摘要1.1 研究背景1.2 研究意義(1)技術提升:推動CAN總線診斷的智能化與實時性(2)經濟價值:降低診斷成本與維修時間(3)安全與標準化:促進車聯網數據安全體系建設社會效益1.3 國內外研究現狀1.3.1 國外研…

布瑞琳BRANEW:高端洗護領航者,鑄就品質生活新典范

近日,布瑞琳BRANEW,這一中國高端洗護行業的領軍品牌,再次憑借其卓越的服務品質、創新的經營模式以及對行業標準的深度推動,成為市場矚目的焦點。作為北京2022年冬奧會和殘奧會的商業服務保障單位,布瑞琳不僅展現了其無與倫比的服務能力,更在國際舞臺上彰顯了品牌的非凡影響力。…

AWS服務器擴充硬盤

1、在控制臺上將需要擴充的硬盤增加空間 將硬盤大小由原來的50G升級到200G 2、登錄所掛載的服務器 1&#xff09;查看硬盤分區情況 adminip-172-31-121-13:~$ sudo lsblk NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINTS nvme0n1 259:0 0 200G 0 disk ├─nv…

嵌入式自學第四十二天

PWM:脈沖寬度調制&#xff0c;調節電壓為方波。關鍵參數&#xff1a;占空比、周期。 UART&#xff1a;通用異步收發器。 參與通信的設備&#xff1a;主機host 通信的本質&#xff1a;數據的傳遞。 通信方式&#xff1a; 單工&#xff1a;只能單向傳遞 半雙工&#xff1a;雙向…

人工智能如何重塑教育體系:個性化學習的新時代

&#x1f4dd;個人主頁&#x1f339;&#xff1a;慌ZHANG-CSDN博客 &#x1f339;&#x1f339;期待您的關注 &#x1f339;&#x1f339; 一、引言&#xff1a;教育的“智能革命”正在發生 教育作為人類社會發展的基石&#xff0c;始終緊隨技術進步不斷演化。從印刷術帶來知識…

【云原生】基礎篇

?一、云原生 1.1 本質與核心技術體系? 云原生&#xff08;Cloud Native&#xff09;是以容器化、微服務、聲明式API和動態編排為核心的架構范式&#xff0c;旨在最大化利用云的彈性、可觀測性和自動化能力。其技術棧分層如下&#xff1a; ?1.2、云原生核心技術棧? ?層級…

實時反欺詐:基于 Spring Boot 與 Flink 構建信用卡風控系統

在金融科技飛速發展的今天&#xff0c;信用卡欺詐手段日益高明和快速。傳統的基于批處理的事后分析模式已難以應對實時性要求極高的欺詐場景。本文將詳細介紹如何利用 Spring Boot 和 Apache Flink 這對強大的組合&#xff0c;構建一個高性能、可擴展的實時信用卡反欺詐系統。 …

通過apache共享文件

有時候&#xff0c;vmware虛擬機的vmware tools總是安裝失敗&#xff0c;這樣就不能在虛擬機和主機之間共享文件。此時可以利用apache通過文件上傳和下載共享文件。 通過下面的php文件&#xff0c;虛擬機作為客戶端訪問此php&#xff0c;可以在虛擬機和主機之間共享文件。當然…

Maven生命周期,測試

測試 Junit入門 單元測試 單元測試&#xff1a;就是針對最小的功能單元(方法)&#xff0c;編寫測試代碼對其正確性進行測試。 JUnit&#xff1a;最流行的Java測試框架之一&#xff0c;提供了一些功能&#xff0c;方便程序進行單元測試&#xff08;第三方公司提供&#xff09…

H5調試工具vconsole和Eruda對比

VConsole與Eruda對比分析 VConsole和Eruda是兩款主流的移動端JavaScript調試工具&#xff0c;它們在功能定位、使用場景和技術實現上有諸多差異。以下從多個維度進行對比&#xff0c;幫助你選擇更適合的工具&#xff1a; 一、核心功能對比 功能維度VConsoleEruda基礎日志輸出…

Java經典編程題

題目 1&#xff1a;斐波那契數列 題目要求&#xff1a;編寫一個方法&#xff0c;輸入正整數n&#xff0c;輸出斐波那契數列的第n項。斐波那契數列的定義是&#xff1a;F(0)0&#xff0c;F(1)1, 當n > 1時&#xff0c;F(n)F(n - 1)F(n - 2)。 答案&#xff1a; public cla…