基于昇騰310B4的YOLOv8目標檢測推理

YOLOv8目標檢測 om 模型推理

本篇博客將手把手教你如何將 YOLOv8 目標檢測模型部署到華為昇騰 310B4 開發板上進行高效推理(其他昇騰開發版也可參考此流程)。
整個流程包括:

  • 模型格式轉換(ONNX → OM)
  • 昇騰推理環境配置
  • 推理代碼實現(圖片推理為例)
  • 結果可視化與效果展示

一、前置知識與準備

我們基于 YOLOv8 ONNX 模型,使用華為昇騰 CANN 提供的推理工具鏈完成模型轉換與部署。

項目所需環境如下:

組件版本/建議
Python3.9+
numpy1.24.4
opencv-python4.7.0.72
CANN Toolkit≥ 6.0(需含 atc, ais_bench, infer 等,開發板一般自帶)
Ascend310B4 驅動安裝并配置環境變量(開發板一般自帶)

建議使用以下命令安裝依賴:

pip install numpy==1.24.4 opencv-python==4.7.0.72

二、模型轉換:ONNX → OM

在昇騰上推理,首先需將 .onnx 模型轉換為 .om 格式。使用 CANN 提供的 atc 工具即可完成轉換,轉換過程較長。

模型轉換命令如下:

atc --model=yolov8s.onnx \--framework=5 \--output=yolov8s \--input_format=NCHW \--input_shape="images:1,3,640,640" \--log=error \--soc_version=Ascend310B4

下圖為轉換過程:
在這里插入圖片描述

📌 注意事項:

  • input_shape 必須與你模型實際輸入一致
  • soc_version 必須與開發板匹配,例如 Ascend310B1、 Ascend310B4等

查看自己的昇騰開發板型號(310B1、310B4等):

在這里插入圖片描述

轉換成功后,將生成 yolov8s.om 文件用于后續推理。


三、模型文件下載

如果你沒有合適的 YOLOv8 ONNX 模型文件,可以通過以下鏈接下載我準備好的模型文件包括 om 文件:

百度網盤鏈接: https://pan.baidu.com/s/1xpAdN7C9CS-L4XBLgBG8Kw
提取碼: 8dm8

建議選擇以下模型文件之一進行實驗:

  • yolov8n.onnx:輕量快速,適合測試
  • yolov8s.onnx:兼顧精度和速度,適合部署

你也可以使用 Ultralytics 官方提供的 YOLOv8 PyTorch 模型導出 ONNX 文件(model.export(format="onnx"))。


四、YOLOv8 OM模型推理流程

我們將使用 python + ais_bench 接口構建推理流程。推理步驟包括:

  1. 加載圖像與模型
  2. 預處理圖像(尺寸調整、歸一化等)
  3. 執行模型推理
  4. 后處理(提取框、置信度、NMS過濾)
  5. 繪制檢測結果并保存

👇 以下為推理代碼示例部分(infer_yolov8_ascend.py):


推理代碼

# -*- coding: utf-8 -*-
import cv2
import numpy as np
from ais_bench.infer.interface import InferSession# 類別定義
CLASSES = {0: 'person', 1: 'bicycle', 2: 'car', 3: 'motorcycle', 4: 'airplane', 5: 'bus', 6: 'train', 7: 'truck',8: 'boat', 9: 'traffic light', 10: 'fire hydrant', 11: 'stop sign', 12: 'parking meter', 13: 'bench',14: 'bird', 15: 'cat', 16: 'dog', 17: 'horse', 18: 'sheep', 19: 'cow', 20: 'elephant', 21: 'bear',22: 'zebra', 23: 'giraffe', 24: 'backpack', 25: 'umbrella', 26: 'handbag', 27: 'tie', 28: 'suitcase',29: 'frisbee', 30: 'skis', 31: 'snowboard', 32: 'sports ball', 33: 'kite', 34: 'baseball bat',35: 'baseball glove', 36: 'skateboard', 37: 'surfboard', 38: 'tennis racket', 39: 'bottle',40: 'wine glass', 41: 'cup', 42: 'fork', 43: 'knife', 44: 'spoon', 45: 'bowl', 46: 'banana', 47: 'apple',48: 'sandwich', 49: 'orange', 50: 'broccoli', 51: 'carrot', 52: 'hot dog', 53: 'pizza', 54: 'donut',55: 'cake', 56: 'chair', 57: 'couch', 58: 'potted plant', 59: 'bed', 60: 'dining table', 61: 'toilet',62: 'tv', 63: 'laptop', 64: 'mouse', 65: 'remote', 66: 'keyboard', 67: 'cell phone', 68: 'microwave',69: 'oven', 70: 'toaster', 71: 'sink', 72: 'refrigerator', 73: 'book', 74: 'clock', 75: 'vase',76: 'scissors', 77: 'teddy bear', 78: 'hair drier', 79: 'toothbrush'
}# 置信度閾值
CONFIDENCE = 0.4
# NMS 的 IoU 閾值
IOU = 0.45# 為每個類別分配隨機顏色
colors = np.random.uniform(0, 255, size=(len(CLASSES), 3))def draw_bounding_box(img, class_id, confidence, x, y, x_plus_w, y_plus_h):"""在圖像上繪制邊界框和類別標簽參數:img - 原始圖像class_id - 類別IDconfidence - 置信度x, y - 左上角坐標x_plus_w, y_plus_h - 右下角坐標"""label = "{} {:.2f}".format(CLASSES[class_id], confidence)color = colors[class_id]# 畫框cv2.rectangle(img, (x, y), (x_plus_w, y_plus_h), color, 2)# 獲取文本大小label_size, _ = cv2.getTextSize(label, cv2.FONT_HERSHEY_SIMPLEX, 0.5, 1)label_width, label_height = label_sizelabel_x = xlabel_y = y - 10 if y - 10 > label_height else y + 10# 背景框cv2.rectangle(img, (label_x, label_y - label_height),(label_x + label_width, label_y + label_height), color, cv2.FILLED)# 文字cv2.putText(img, label, (label_x, label_y), cv2.FONT_HERSHEY_SIMPLEX,0.5, (0, 0, 0), 1, cv2.LINE_AA)def main(session, original_image):"""加載模型,執行推理,繪制檢測框并保存結果圖像參數:session - 模型original_image - 圖片值返回:original_image - 畫框的圖片detections - 包含每個目標信息的列表"""height, width, _ = original_image.shape# 變為正方形圖像用于推理length = max(height, width)image = np.zeros((length, length, 3), np.uint8)image[0:height, 0:width] = original_image# 縮放因子scale = length / 640# 預處理圖像blob = cv2.dnn.blobFromImage(image, scalefactor=1.0 / 255, size=(640, 640), swapRB=True)# 模型推理outputs = session.infer(feeds=blob, mode="static")# 轉換輸出維度:從 (1, 84, 8400) -> (8400, 84)outputs = np.array([cv2.transpose(outputs[0][0])])rows = outputs.shape[1]boxes = []scores = []class_ids = []# 解析輸出for i in range(rows):classes_scores = outputs[0][i][4:](minScore, maxScore, minClassLoc, (x, maxClassIndex)) = cv2.minMaxLoc(classes_scores)if maxScore >= CONFIDENCE:box = [(outputs[0][i][0] - outputs[0][i][2] / 2) * scale,  # x 左上角(outputs[0][i][1] - outputs[0][i][3] / 2) * scale,  # y 左上角outputs[0][i][2] * scale,  # 寬outputs[0][i][3] * scale   # 高]boxes.append(box)scores.append(maxScore)class_ids.append(maxClassIndex)# 非極大值抑制result_boxes = cv2.dnn.NMSBoxes(boxes, scores, CONFIDENCE, IOU, 0.5)detections = []# 繪制邊界框for i in range(len(result_boxes)):index = result_boxes[i]box = boxes[index]detection = {"class_id": class_ids[index],"class_name": CLASSES[class_ids[index]],"confidence": scores[index],"box": box,"scale": scale,}detections.append(detection)draw_bounding_box(original_image,class_ids[index],scores[index],round(box[0]),round(box[1]),round(box[0] + box[2]),round(box[1] + box[3]))return original_image, detectionsif __name__ == "__main__":model_path = "yolov8s.om"# 創建推理會話session = InferSession(device_id=0, model_path=model_path)# 圖片推理input_image_path = "street.jpg"image = cv2.imread(input_image_path)draw_image, _ = main(session, image)# cv2.imshow("Image Detection", draw_image)cv2.imwrite("output_image.jpg", draw_image)cv2.waitKey(0)cv2.destroyAllWindows()

五、推理結果展示

完成推理后,程序會將檢測結果繪制在圖像上并保存,如下所示:

原圖檢測后
原圖檢測后

你可以替換為自己的圖像文件進行體驗。


六、運行方法與注意事項

  1. .om 模型與推理腳本放于同一目錄
  2. 準備一張待檢測圖片
  3. 執行命令:
python infer_yolov8_ascend.py
  1. 成功運行后,將在當前目錄輸出檢測結果圖 output_image.jpg,并彈出窗口展示檢測框。

🧯 若 cv2.imshow() 報錯,請確保本地圖形界面環境正常或注釋相關代碼,非圖形界面系統不支持顯示。


總結

本文完整介紹了基于昇騰310B4的 YOLOv8 推理部署流程,該流程也適用于視頻流檢測或攝像頭實時檢測,僅需在代碼中擴展對應輸入源即可。


延伸方向

  • 🎥 攝像頭實時檢測
  • 🎬 視頻流批量檢測

如有需要完整代碼、轉換腳本或模型下載支持,歡迎在評論區留言,我會盡快回復!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/912763.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/912763.shtml
英文地址,請注明出處:http://en.pswp.cn/news/912763.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

前端跨域問題解決Access to XMLHttpRequest at xxx from has been blocked by CORS policy

在前端開發中,跨域資源共享(CORS)是一個常見的問題。它涉及到瀏覽器安全機制,防止網頁從一個域獲取資源時被另一個域阻止。錯誤信息如“Access to XMLHttpRequest at xxx from origin has been blocked by CORS policy”是典型的跨…

[ linux-系統 ] 軟硬鏈接與動靜態庫

軟硬鏈接 介紹 軟鏈接 通過下圖可以看出軟鏈接和原始文件是兩個獨立的文件,因為軟鏈接有著自己的inode編號: 具有獨立的 inode ,也有獨立的數據塊,它的數據塊里面保存的是指向的文件的路徑,公用 inode 硬鏈接 通過…

3D 商品展示與 AR 試戴能為珠寶行業帶來一些便利?

對于珠寶行業而言,長久以來,如何讓消費者在做出購買決策之前,便能真切且直觀地領略到珠寶獨一無二的魅力,始終是橫亙在行業發展道路上的一道棘手難題。而 3D 互動營銷的橫空出世,恰似一道曙光,完美且精準地…

電子電氣架構 --- SOVD功能簡單介紹

我是穿拖鞋的漢子,魔都中堅持長期主義的汽車電子工程師。 老規矩,分享一段喜歡的文字,避免自己成為高知識低文化的工程師: 簡單,單純,喜歡獨處,獨來獨往,不易合同頻過著接地氣的生活,除了生存溫飽問題之外,沒有什么過多的欲望,表面看起來很高冷,內心熱情,如果你身…

【Java編程動手學】 Java中的運算符全解析

文章目錄 一、引言二、算術運算符1、基本概念2、具體運算符及示例 三、關系運算符1、基本概念2、具體運算符及示例 四、自增減運算符1、基本概念2、具體運算符及示例 五、邏輯運算符1、基本概念2、具體運算符及示例 六、位運算符1、基本概念2、具體運算符及示例 七、移位運算符…

【前端】1 小時實現 React 簡歷項目

近期更新完畢。僅包括核心代碼 目錄結構 yarn.lock保證開發者每次能下載到同版本依賴,一般不需要特別留意 package.json 是 Node.js 項目、前端項目、npm/yarn的配置文件。 Dockerfile 是用來 定義 Docker 鏡像構建過程的文本文件。它是一份腳本,告訴 …

python中的pydantic是什么?

Pydantic 是 Python 中一個用于數據驗證和設置管理的庫,主要通過 Python 類型注解(Type Hints)來定義數據結構,并自動驗證輸入數據的合法性。它廣泛應用于 API 開發(如 FastAPI)、配置管理、數據序列化等場…

騰訊云市場目前飽和度

首先我需要理解市場飽和度的概念。市場飽和度通常指一個產品或服務在潛在市場中的滲透程度,高飽和度意味著市場增長空間有限,低飽和度則表明還有較大發展潛力。 從搜索結果看,騰訊云目前在中國云服務市場排名第三,市場份額約為15%…

EDR、NDR、XDR工作原理和架構及區別

大家讀完覺得有幫助記得關注和點贊!!! EDR、NDR、XDR是網絡安全中關鍵的檢測與響應技術,它們在覆蓋范圍、數據源和響應機制上有顯著差異。以下是它們的工作原理和架構詳解: --- ### 🔍 一、EDR&#xff0…

vue3 + luckysheet 實現在線編輯Excel

效果圖奉上: 引入的依賴: "dependencies": {"types/jquery": "^3.5.32","types/xlsx": "^0.0.36","jquery": "^3.7.1","xlsx": "^0.18.5",}在index.html中…

Linux下MinIO分布式安裝部署

文章目錄 一、MinIO簡單說明二、MinIO分布式安裝部署1、關閉SELINUX2、開啟防火墻2.1、關閉firewall:2.2、安裝iptables防火墻 3、安裝MinIO4、添加MinIO集群控制腳本4.1添加啟動腳本4.2添加關閉腳本 5、MinIO控制臺使用 一、MinIO簡單說明 1、MinIO是一個輕量的對…

Codeforces Round 980 (Div. 2)

ABC 略 D 這個過程一定是由1向后跳的過程中穿插有幾次向前一步一步走。直到跳到一個位置后再把前面所有沒有走過的位置倒序走一遍。總分就等于最大位置的前綴和-前面所有起跳位置和。前綴和固定我們只需要求到每個位置的最小起跳和即可。對于這個向后跳和向前走的過程我們可以…

Langchain實現rag功能

RAG(檢索增強生成)的核心是通過外部知識庫增強大模型回答的準確性和針對性,其工作流程與優化策略如下: 一、RAG 核心流程 ?知識庫構建? ?文檔加載與分割?:將非結構化文檔(PDF、Markdown等)…

算法筆記上機訓練實戰指南刷題

算法筆記上機訓練實戰指南刷題記錄 文章目錄 算法筆記上機訓練實戰指南刷題記錄模擬B1001 害死人不償命的(3n1)猜想B1011 AB 和 CB1016 部分ABB1026 程序運行時間B1046劃拳B1008數組元素循環右移問題B1012 數字分類B1018 錘子剪刀布A1042 Shuffling Machine 每天兩題&#xff0…

MYSQL基礎內容

一、介紹 1.不用數據庫:使用IO流對數據進行管理 2.使用數據庫:使用SQL語句對開發的數據進行管理,能儲存上億條數據 3.MYSQL: 是流行的關系型數據庫管理系統之一,將數據保存在不同的數據表中,通過表與表之…

音視頻會議服務搭建(設計方案)-01

前言 最近在做音視頻會議系統服務搭建的工作任務,因為內容過多,我會逐篇分享相關的設計方案、開發思路、編程語言、使用的組件集合等等。如果你也有大型音視頻會議系統搭建架構的需求,希望這些可以對你有所幫助。 EchoMeet 音視頻會議系統架構…

刷leetcode hot100/準備機試--圖

圖的基礎知識【這部分建議使用acm模式】 圖論理論基礎 | 代碼隨想錄 存儲: 一般有鄰接表【適合稀疏圖】【數組 鏈表 】和鄰接矩陣【適合稠密圖】存儲方式 注意鄰接表 和 鄰接矩陣的寫法都要掌握! 鄰接矩陣 n個節點,申請n*n或者&#xf…

無代碼自動化測試工具介紹

無代碼自動化測試工具允許用戶無需編寫代碼即可創建和運行測試,通過拖拽式界面或錄制回放等可視化界面進行操作。 這些工具利用圖形用戶界面和預定義命令來創建測試,使非編程人員也能進行自動化測試。 無代碼自動化測試工具使團隊能夠: 使用直觀的拖拽界面開發和執行自動化…

python學習打卡day58

DAY 58 經典時序預測模型2 知識點回顧: 時序建模的流程時序任務經典單變量數據集ARIMA(p,d,q)模型實戰SARIMA摘要圖的理解處理不平穩的2種差分 n階差分---處理趨勢季節性差分---處理季節性 建立一個ARIMA模型&#xf…

分布式鎖的實現方式:使用 Redisson 實現分布式鎖( Spring Boot )

Redisson提供了分布式和可擴展的Java數據結構&#xff0c;包括分布式鎖的實現。 1. 添加依賴 在pom.xml中添加Redisson依賴&#xff1a; <dependency><groupId>org.redisson</groupId><artifactId>redisson-spring-boot-starter</artifactId>…