【深度學習】【目標檢測】【OnnxRuntime】【C++】YOLOV5模型部署

【深度學習】【目標檢測】【OnnxRuntime】【C++】YOLOV5模型部署

提示:博主取舍了很多大佬的博文并親測有效,分享筆記邀大家共同學習討論

文章目錄

  • 【深度學習】【目標檢測】【OnnxRuntime】【C++】YOLOV5模型部署
  • 前言
  • Windows平臺搭建依賴環境
  • 模型轉換--pytorch轉onnx
  • ONNXRuntime推理代碼
    • 完整推理代碼
  • 總結


前言

本期將講解深度學習目標檢查網絡YOLOV5模型的部署,對于該算法的基礎知識,可以參考其他博主博文。
讀者可以通過學習【OnnxRuntime部署】系列學習文章目錄的C++篇* 的內容,系統的學習OnnxRuntime部署不同任務的onnx模型。


Windows平臺搭建依賴環境

在【入門基礎篇】中詳細的介紹了onnxruntime環境的搭建以及ONNXRuntime推理核心流程代碼,不再重復贅述。


模型轉換–pytorch轉onnx

本博文將通過Ultralytics–YOLOv5算法的口罩檢測項目【參考博文:Windows11下YOLOV5口罩目標檢測】,簡要介紹YOLOV5模型部署。
在博文Windows11下YOLOV5口罩目標檢測項目中已經通過以下命令導出了onnx模型:

python export.py --weights runs/train/exp/weights/best.pt --include onnx


【yolov5s-mask.onnx百度云鏈接,提取碼:15v2 】直接下載使用即可。


ONNXRuntime推理代碼

利用可視化工具查看onnx模型結構: 通過可視化Netron工具【在線工具】,展示模型的層次結構、參數細節等。
將onnx模型上傳到在線Netron可視化工具:

簡單說明下輸出代表的含義::1代表batchsize;25200代表檢測框的個數;7代表框的詳細信息:即框中心點xy+框寬高hw+框置信度conf+框分類個數(這里是2)。

完整推理代碼

需要配置mask_classes.txt文件存儲人臉的分類標簽,并將其放置到工程目錄下(推薦)。

without-mask
mask

這里需要將yolov5s-mask.onnx放置到工程目錄下(推薦),并且將以下推理代碼拷貝到新建的cpp文件中,并執行查看結果。

#include "onnxruntime_cxx_api.h"
#include "cpu_provider_factory.h"
#include <opencv2/opencv.hpp>
#include <fstream>// 加載標簽文件獲得分類標簽
std::string labels_txt_file = "./mask_classes.txt";
std::vector<std::string> readClassNames();
std::vector<std::string> readClassNames()
{std::vector<std::string> classNames;std::ifstream fp(labels_txt_file);if (!fp.is_open()){printf("could not open file...\n");exit(-1);}std::string name;while (!fp.eof()){std::getline(fp, name);if (name.length())classNames.push_back(name);}fp.close();return classNames;
}int main(int argc, char** argv) {// 預測的目標標簽數std::vector<std::string> labels = readClassNames();// 測試圖片cv::Mat frame = cv::imread("./mask.jpg");cv::imshow("輸入圖", frame);// ******************* 1.初始化ONNXRuntime環境 *******************Ort::Env env = Ort::Env(ORT_LOGGING_LEVEL_ERROR, "YOLOV5-onnx");// ***************************************************************// ******************* 2.設置會話選項 *******************// 創建會話Ort::SessionOptions session_options;// 優化器級別:基本的圖優化級別session_options.SetGraphOptimizationLevel(ORT_ENABLE_BASIC);// 線程數:4session_options.SetIntraOpNumThreads(4);// 設備使用優先使用GPU而是才是CPUstd::cout << "onnxruntime inference try to use GPU Device" << std::endl;OrtSessionOptionsAppendExecutionProvider_CUDA(session_options, 0);OrtSessionOptionsAppendExecutionProvider_CPU(session_options, 1);// ******************************************************// ******************* 3.加載模型并創建會話 *******************// onnx訓練模型文件std::string onnxpath = "./yolov5s-mask.onnx";std::wstring modelPath = std::wstring(onnxpath.begin(), onnxpath.end());Ort::Session session_(env, modelPath.c_str(), session_options);// ************************************************************// ******************* 4.獲取模型輸入輸出信息 *******************int input_nodes_num = session_.GetInputCount();			// 輸入節點輸int output_nodes_num = session_.GetOutputCount();		// 輸出節點數std::vector<std::string> input_node_names;				// 輸入節點名稱std::vector<std::string> output_node_names;				// 輸出節點名稱Ort::AllocatorWithDefaultOptions allocator;				// 創建默認配置的分配器實例,用來分配和釋放內存		// 輸入圖像尺寸int input_h = 0;int input_w = 0;// 獲取模型輸入信息for (int i = 0; i < input_nodes_num; i++) {// 獲得輸入節點的名稱并存儲auto input_name = session_.GetInputNameAllocated(i, allocator);input_node_names.push_back(input_name.get());// 顯示輸入圖像的形狀auto inputShapeInfo = session_.GetInputTypeInfo(i).GetTensorTypeAndShapeInfo().GetShape();int ch = inputShapeInfo[1];input_h = inputShapeInfo[2];input_w = inputShapeInfo[3];std::cout << "input format: " << ch << "x" << input_h << "x" << input_w << std::endl;}// 獲取模型輸出信息int nums;int nbs;int ncs;for (int i = 0; i < output_nodes_num; i++) {// 獲得輸出節點的名稱并存儲auto output_name = session_.GetOutputNameAllocated(i, allocator);output_node_names.push_back(output_name.get());// 顯示輸出結果的形狀auto outShapeInfo = session_.GetOutputTypeInfo(i).GetTensorTypeAndShapeInfo().GetShape();nums = outShapeInfo[0];nbs = outShapeInfo[1];ncs = outShapeInfo[2];std::cout << "output format: " << nums << "x" << nbs << "x" << ncs << std::endl;}// **************************************************************// ******************* 5.輸入數據預處理 *******************// 原始圖像的寬高int w = frame.cols;int h = frame.rows;// 原始圖像與輸入圖像之間的縮放系數float x_factor = 0.0;float y_factor = 0.0;// 獲得原始圖像中寬高中的長邊,最為變換正方形的邊長int _max = std::max(h, w);	// 將原始的矩形圖像放大變換成正方形圖像,默認補零cv::Mat image = cv::Mat::zeros(cv::Size(_max, _max), CV_8UC3);cv::Rect roi(0, 0, w, h);frame.copyTo(image(roi));// 計算寬高的縮放系數,模型的輸入恒定為640×640,必須強制轉換成浮點數x_factor = image.cols / static_cast<float>(640);	y_factor = image.rows / static_cast<float>(640);// 完成歸一化:1.0 / 255.0;縮放:cv::Size(input_w, input_h);格式轉換(BGR轉RGB):truecv::Mat blob = cv::dnn::blobFromImage(image, 1.0 / 255.0, cv::Size(input_w, input_h), cv::Scalar(0, 0, 0), true, false);std::cout << blob.size[0] << "x" << blob.size[1] << "x" << blob.size[2] << "x" << blob.size[3] << std::endl;// ********************************************************// ******************* 6.推理準備 *******************// 占用內存大小,后續計算是總像素*數據類型大小size_t tpixels = 3 * input_h * input_w;std::array<int64_t, 4> input_shape_info{ 1, 3, input_h, input_w };// 準備數據輸入auto allocator_info = Ort::MemoryInfo::CreateCpu(OrtDeviceAllocator, OrtMemTypeCPU);Ort::Value input_tensor_ = Ort::Value::CreateTensor<float>(allocator_info, blob.ptr<float>(), tpixels, input_shape_info.data(), input_shape_info.size());// 模型輸入輸出所需數據(名稱及其數量),模型只認這種類型的數組const std::array<const char*, 1> inputNames = { input_node_names[0].c_str() };const std::array<const char*, 1> outNames = { output_node_names[0].c_str()};// **************************************************// ******************* 7.執行推理 *******************std::vector<Ort::Value> ort_outputs;try {ort_outputs = session_.Run(Ort::RunOptions{ nullptr }, inputNames.data(), &input_tensor_, 1, outNames.data(), outNames.size());}catch (std::exception e) {std::cout << e.what() << std::endl;}// **************************************************// ******************* 8.后處理推理結果 *******************// 1x25200x6 獲取(第一個)輸出數據并包裝成一個cv::Mat對象,為了方便后處理const float* pdata = ort_outputs[0].GetTensorMutableData<float>();cv::Mat det_output(nbs, ncs, CV_32F, (float*)pdata);std::vector<cv::Rect> boxes;		// 目標框的坐標位置std::vector<float> confidences;		// 目標框的置信度std::vector<int> classIds;			// 目標框的類別得分// 剔除置信度較低的目標框,不作處理for (int i = 0; i < det_output.rows; i++) {float confidence = det_output.at<float>(i, 4);if (confidence < 0.45) {continue;}// 獲得當前目標框的類別得分cv::Mat classes_scores = det_output.row(i).colRange(5, ncs);// 這里與圖像分類的方式一致cv::Point classIdPoint;		// 用于存儲分類中的得分最大值索引(坐標)double score;				// 用于存儲分類中的得分最大值minMaxLoc(classes_scores, 0, &score, 0, &classIdPoint);// 處理分類得分較高的目標框if (score > 0.25){	// 計算在原始圖像上,目標框的左上角坐標和寬高// 在輸入圖像上目標框的中心點坐標和寬高float cx = det_output.at<float>(i, 0);	float cy = det_output.at<float>(i, 1);float ow = det_output.at<float>(i, 2);float oh = det_output.at<float>(i, 3);//原始圖像上目標框的左上角坐標int x = static_cast<int>((cx - 0.5 * ow) * x_factor);	int y = static_cast<int>((cy - 0.5 * oh) * y_factor);//原始圖像上目標框的寬高int width = static_cast<int>(ow * x_factor);int height = static_cast<int>(oh * y_factor);// 記錄目標框信息cv::Rect box;box.x = x;box.y = y;box.width = width;box.height = height;boxes.push_back(box);classIds.push_back(classIdPoint.x);confidences.push_back(score);}}// NMS:非極大值抑制(Non-Maximum Suppression),去除同一個物體的重復多余的目標框std::vector<int> indexes;	// 剔除多余目標框后,保留的目標框的序號cv::dnn::NMSBoxes(boxes, confidences, 0.25, 0.45, indexes);// 遍歷篩選出的目標框for (size_t i = 0; i < indexes.size(); i++) {int idx = indexes[i];		// 獲取當前目標框序號int cid = classIds[idx];	// 獲取目標框分類得分// 輸入/輸出圖像:frame;目標位置信息:boxes[idx];目標框顏色: cv::Scalar(0, 0, 255);// 邊框線的厚度:4;線條類型:8;坐標點小數位數精度:0(通常為0)cv::rectangle(frame, boxes[idx], cv::Scalar(0, 0, 255), 4, 8, 0);	// 在原始圖片上框選目標區域// 輸入/輸出圖像:frame;繪制文本內容:labels[cid].c_str();文本起始位置(左下角):boxes[idx].tl();// 字體類型:cv::FONT_HERSHEY_PLAIN;字體大小縮放比例:2.5;文本顏色:cv::Scalar(255, 0, 0);文本線條的厚度:3;線條類型:8putText(frame, labels[cid].c_str(), boxes[idx].tl(), cv::FONT_HERSHEY_PLAIN, 2.5, cv::Scalar(255, 0, 0), 3, 8);	// 目標區域的類別}// ********************************************************// 在測試圖像上加上預測的目標位置和類別cv::imshow("輸入圖像", frame);cv::waitKey(0);// ******************* 9.釋放資源*******************session_options.release();session_.release();// *************************************************return 0;
}

圖片正確識別是否帶著口罩:
在這里插入圖片描述


總結

盡可能簡單、詳細的講解了C++下OnnxRuntime環境部署YOLOV5模型的過程。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/74826.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/74826.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/74826.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

深入解析 JSON-RPC:從基礎到高級應用(附調用示例)

在當今的軟件開發領域&#xff0c;遠程過程調用&#xff08;RPC&#xff09;技術是實現分布式系統間通信的關鍵手段之一。JSON-RPC&#xff0c;作為一種基于 JSON 數據格式的輕量級 RPC 協議&#xff0c;因其簡潔性和高效性而備受青睞。本文將全面深入地探討 JSON-RPC 的核心概…

抽象代數:群論

系列筆記為本學期上抽象代數課整理的&#xff0c;持續更新。 群的相關定義 群的定義 群是一個帶有滿足結合律、單位元、逆元的二元運算的集合&#xff0c;記作 ( G , ? ) \left({G, \cdot}\right) (G,?)。若群運算滿足結合律&#xff0c;則該集合構成半群。如果該半群中含…

線程同步——讀寫鎖

Linux——線程同步 讀寫鎖 目錄 一、基本概念 1.1 讀寫鎖的基本概念 1.2 讀寫鎖的優點 1.3 讀寫鎖的實現 1.4 代碼實現 一、基本概念 線程同步中的讀寫鎖&#xff08;Read-Write Lock&#xff09;&#xff0c;也常被稱為共享-獨占鎖&#xff08;Shared-Exclusive Lock&a…

全面解析PRN文件:從原理到可視化的完整指南 【標簽打印】

文章目錄 一、PRN文件概述二、PRN文件結構深度解析2.1 文件頭配置2.1 繪圖指令詳解2.3 文本處理方案2.4 條碼/二維碼實現2.5 RFID指令集 三、實戰&#xff1a;PRN可視化工具開發3.1 基于Canvas的實現方案3.2 坐標轉換關鍵算法 四、常見問題解決方案4.1 內容偏移問題4.2 中文亂碼…

C++:函數(通識版)

一、函數的基礎 1.什么是函數&#xff1f;&#xff08;獨立的功能單位&#xff09; 函數是C中封裝代碼邏輯的基本單元&#xff0c;用于執行特定任務。 作用&#xff1a;代碼復用、模塊化、提高可讀性。 2、函數的基本結構 返回類型 函數名(參數列表) {// 函數體return 返回值…

sql注入語句學習

說明 注入漏洞作為登頂過web十大漏洞多次的漏洞&#xff0c;危害性不言而喻&#xff0c;其中sql注入就是注入漏洞常用的手段。其形成的原因是由于web在接收傳參數據時&#xff0c;對數據的過濾不夠嚴格&#xff0c;將其帶入到數據庫查詢中&#xff0c;導致用戶可以通過傳參一些…

云鑰科技多通道工業相機解決方案設計

項目應用場景分析與需求挑戰 1. 應用場景 ?目標領域?&#xff1a;工業自動化檢測&#xff08;如精密零件尺寸測量、表面缺陷檢測&#xff09;、3D立體視覺&#xff08;如物體建模、位姿識別&#xff09;、動態運動追蹤&#xff08;如高速生產線監控&#xff09;等。 ?核心…

離散的數據及參數適合用什么算法做模型

離散數據和參數適用的機器學習算法取決于具體任務(分類、回歸、聚類等)、數據特點(稀疏性、類別數量等)以及業務需求。以下是針對離散數據的常用算法分類和選擇建議: 1. 分類任務(離散目標變量) 經典算法 決策樹(ID3/C4.5/CART) 直接處理離散特征,無需編碼,可解釋性…

VMware 安裝 Ubuntu 實戰分享

VMware 安裝 Ubuntu 實戰分享 VMware 是一款強大的虛擬機軟件&#xff0c;廣泛用于多操作系統環境的搭建。本文將詳細介紹如何在 VMware 中安裝 Ubuntu&#xff0c;并分享安裝過程中的常見問題及解決方法。 1. 安裝前的準備工作 (1) 系統要求 主機操作系統&#xff1a;Windo…

基于Promise鏈式調用的多層級請求性能優化

代碼優化-循環嵌套關聯請求 1. 背景 在實際開發中&#xff0c;我們經常會遇到需要嵌套關聯請求的場景&#xff0c;比如&#xff1a; 獲取項目列表獲取項目詳情獲取項目進度 2. 問題 在這種場景下&#xff0c;我們可能會遇到以下問題&#xff1a; 串行請求瀑布流&#xff…

puppeteer+express服務端導出頁面為pdf

以下是開發步驟&#xff1a; 1、創建目錄 puppeteer_demo 目錄&#xff0c;打開目錄 初始化項目&#xff08;命令為&#xff1a;npm init -y&#xff09; 頁面如&#xff1a; 初始化后&#xff0c;項目目錄會出現 package.json 文件 2、安裝 puppeteer &#xff0c;使用命令&a…

GPT-4o圖像生成功能:技術突破與隱憂并存

2025年3月25日&#xff0c;OpenAI正式推出GPT-4o原生圖像生成功能&#xff0c;宣稱其實現了“文本到圖像的終極跨越”。然而&#xff0c;這一被市場追捧的技術在短短72小時內便因用戶需求過載觸發限流&#xff0c;暴露出算力瓶頸與商業化矛盾的尖銳性。這場技術狂歡的背后&…

西域平臺商品詳情接口設計與實現?

接口描述&#xff1a; 該接口用于獲取西域平臺中指定商品的詳細信息&#xff0c;包括商品名稱、價格、庫存、描述、圖片等。 點擊獲取key和secret 接口地址&#xff1a; GET /api/product/detail 請求參數&#xff1a; 參數名 類型 是否必填 描述 productId st…

項目-蒼穹外賣(十五) Apache ECharts+數據統計

一、介紹 二、營業額統計 需求分析和設計&#xff1a; Controller: Service: /*** 營業額統計* param begindate* param enddate* return* */Overridepublic TurnoverReportVO turnoverStatistics(LocalDate begindate, LocalDate enddate) {//創建時間集合List<LocalDate&…

Postgresql導出及導入符合條件的記錄

Postgresql導出及導入符合條件的記錄 Export specific rows from a PostgreSQL table as INSERT SQL script 首先進入psql。 切換到指定資料庫後將資料表中符合條件的記錄導出成csv檔&#xff1a; \c <dbname>; COPY (SELECT * FROM <tablename> WHERE <cond…

體育比分網站開發避坑指南:如何選擇靠譜的數據服務商?(10年行業經驗總結,避免踩坑!)

作為一家專業的體育比分數據服務商&#xff0c;我們接觸過大量客戶&#xff0c;發現很多人在開發體育比分網站或接入數據API時&#xff0c;由于選擇不靠譜的服務商&#xff0c;導致項目延期、數據延遲、售后無響應、隱性收費等問題&#xff0c;最終影響運營效果&#xff0c;甚至…

離心萃取機在畢赤酵母萃取中的應用

在生物醫藥領域&#xff0c;畢赤酵母因其高效表達重組蛋白的能力&#xff0c;成為基因工程的“明星宿主”。然而&#xff0c;如何從復雜的發酵體系中高效提取目標產物&#xff0c;一直是行業痛點。離心萃取機的出現&#xff0c;憑借其高速分離、精準提純的特性&#xff0c;正在…

CNN和LSTM的計算復雜度分析

前言&#xff1a;今天做邊緣計算的時候&#xff0c;在評估模型性能的時候發現NPU計算的大部分時間都花在了LSTM上&#xff0c;使用的是Bi-LSTM&#xff08;耗時占比98%&#xff09;&#xff0c;CNN耗時很短&#xff0c;不禁會思考為什么LSTM會花費這么久時間。 首先聲明一下實…

StarRocks 中 CURRENT_TIMESTAMP 和 current_time 分區過濾問題

背景 本文基于Starrocks 3.3.5 最近在進行Starrocks 跑數據的時候&#xff0c;發現了一個SQL 掃描了所有分區的數據&#xff0c;簡化后的SQL如下&#xff1a; select date_created from tableA where date_createddate_format(current_time(), %Y-%m-%d %H:%i:%S) limit 20其…

從物理學到機器學習:用技術手段量化分析職場被動攻擊行為

從物理學到機器學習:用技術手段量化分析職場被動攻擊行為 1. 從物理系統視角看團隊協作 1.1 團隊系統的能量模型 在熱力學系統中,系統的總能量由動能和勢能組成。類比到團隊協作中,我們可以建立如下模型: class TeamEnergy:def __init__(self, members):self.kinetic = …