ultralytics官方更新 | 添加YOLOv10到ultralytics


💡💡💡本專欄所有程序均經過測試,可成功執行💡💡💡?


專欄目錄:《YOLOv8改進有效漲點》專欄介紹 & 專欄目錄 | 目前已有40+篇內容,內含各種Head檢測頭、損失函數Loss、Backbone、Neck、NMS等創新點改進


對YOLOv10感興趣的同學可以先看YOLOv8,因為改進方式大部分一樣,我也會盡快更新相關的教程?

論文地址:YOLOv10: Real-Time End-to-End Object Detection點擊即可跳轉

官方代碼:官方代碼倉庫點擊即可跳轉

今天看到YOLOv10已經被添加到了ultralytics的倉庫中,?也就是說,以后YOLOv8的代碼倉庫也可以下載直接運行YOLOv10。預計以后發布的YOLO系列都會被收入到這個倉庫中。

?YOLOv10啟動腳本供參考:

from ultralytics import YOLOv10 
# Load a model
model = YOLOv10("ultralytics/cfg/models/v10/yolov10n.yaml")
# train
model.train(data='dataset/data.yaml',cache=False,imgsz=640,epochs=100,batch=16,close_mosaic=0,workers=4,device='0',optimizer='SGD', # using SGDamp=False, # close ampproject='runs/train',name='exp',)

YOLOv10創新點回顧:

1. 創新點

無NMS的一致雙分配(consistent dual assignments):

YOLOv10提出了一種通過雙標簽分配而不用非極大值抑制NMS的策略。這種方法結合了一對多和一對一分配策略的優勢,提高了效率并保持了性能。

效率-精度驅動的模型設計(Holistic Efficiency-Accuracy Driven Model Design):

輕量化分類頭:在不顯著影響性能的情況下,減少了計算開銷。

空間-通道解耦下采樣:解耦空間下采樣和通道調整,優化計算成本。

基于秩的塊設計:根據各階段的內在秩適應塊設計,減少冗余,提高效率。

大核卷積和部分自注意力PSA:在不顯著增加計算成本的情況下,增強了感受野和全局建模能力。

2. 一致雙分配策略(Consistent Dual Assignments)

YOLOv10引入了一種新的雙分配策略,用于在訓練期間同時利用一對多(one-to-many)和一對一(one-to-one)標簽分配。這種方法在保持模型高效訓練的同時,擺脫了推理過程中對非極大值抑制NMS的依賴。

雙標簽分配(Dual Label Assignments)

一對多分配:在訓練期間,多個預測框被分配給一個真實物體標簽。這種策略提供了豐富的監督信號,優化效果更好。

一對一分配:僅一個預測框被分配給一個真實物體標簽,避免了NMS,但由于監督信號較弱,容易導致收斂速度慢和性能欠佳。

雙頭架構:模型在訓練期間使用兩個預測頭,一個使用一對多分配,另一個使用一對一分配。這樣,模型可以在訓練期間利用一對多分配的豐富監督信號,而在推理期間則使用一對一分配的預測結果,從而實現無NMS的高效推理。

3. 一致匹配度量(Consistent Matching Metric)

為了在訓練期間保持兩個預測頭的一致性,提出了一致匹配度量。通過調整匹配度量參數,使得一對一和一對多分配的監督信號一致,減少了訓練期間的監督差距,提升了模型的預測質量。

整體效率-精度驅動的模型設計(Holistic Efficiency-Accuracy Driven Model Design)

YOLOv10在模型架構的各個方面進行了全面優化,旨在提升效率和精度。

3.1 效率驅動的模型設計

輕量化分類頭(Lightweight Classification Head)

在YOLO系列中,分類頭和回歸頭通常共享相同的架構,但分類任務的計算開銷更大。為分類頭采用輕量級的架構,包括兩個3×3的深度可分離卷積(depthwise separable convolutions)和一個1×1卷積,以減少計算開銷。

空間-通道解耦下采樣(Spatial-Channel Decoupled Downsampling)

傳統的下采樣方法同時進行空間和通道的轉換,計算成本較高。YOLOv10首先使用逐點卷積(pointwise convolution)調整通道維度,然后使用深度卷積(depthwise convolution)進行空間下采樣。這樣可以最大限度地保留信息,同時減少計算成本。

3.2 基于秩的塊設計(Rank-Guided Block Design)

在YOLO模型中,各階段通常使用相同的基本構建塊,容易導致深層階段的計算冗余。因此根據各階段的內在秩(intrinsic rank)調整塊設計,減少冗余,采用緊湊的反向塊(Compact Inverted Block, CIB)設計,用深度卷積進行空間混合和逐點卷積進行通道混合,提高效率。

3.3 精度驅動的模型設計

大核卷積(Large-Kernel Convolution)

大核卷積的感受野較大,能夠更好地捕捉圖像中的全局信息。然而,直接在所有階段使用大核卷積可能會導致小物體特征的污染,并增加高分辨率階段的I/O開銷和延遲。因此,在深層階段使用大核深度卷積(如7×7)來擴大感受野,增強模型能力,同時使用結構重參數化技術(structural reparameterization)優化訓練。

對于小模型規模(如YOLOv10-N/S),大核卷積的使用能夠顯著提升性能,而對于大模型規模(如YOLOv10-M),其天然較大的感受野使得大核卷積的效果不明顯,因此僅在小模型中使用。

部分自注意力(Partial Self-Attention, PSA)

部分自注意力模塊通過引入全局建模能力來提升模型性能,同時保持較低的計算開銷。

自注意力(self-attention)在視覺任務中因其出色的全局建模能力而被廣泛使用,但其計算復雜度和內存占用較高。本文引入PSA模塊,通過將特征按通道分成兩部分,僅對一部分應用多頭自注意力(Multi-Head Self-Attention, MHSA),然后進行融合,增強全局建模能力,降低計算復雜度。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/35550.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/35550.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/35550.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【C++】類和對象(六)

文章目錄 二、static成員概念面試題一個題目 三、友元友元函數說明 友元類 四、內部類(了解)概念:注意:特性: 五、匿名對象 書接上回: 【C】類和對象(五)隱式類型轉換 二、static成員 01_31 03 12 01 概…

Xcode 手動添加模擬器

在Xcode中下載iOS模擬器很慢,且經常出現下載失敗,需重新從頭開始下載的問題。現了解Xcode 15 和運行環境是分離的,故闡述一下手動添加模擬器的步驟: 官網下載所需模擬器:https://developer.apple.com/download/all/?…

idea項目推送gitee/github

選擇需要的項目創建本地Git倉庫 添加到暫存區 第一次提交 或者點擊這里 寫備注并commit 推送遠程倉庫 填寫地址 解決上圖警告 右鍵打開項目,輸入 git pull origin master –allow-unrelated-historiesgit push -u origin master -f推送成功 idea項目推送github及克…

怎么用韓語說幫忙更合體,柯橋零基礎韓語培訓

1. **詳細解釋:** - **標準寫法與音譯:** - **??**(讀作 dop-da):動詞“幫助”。 - **????**(讀作 do-wa-ju-da):動詞“幫忙”,字面意思是“給予幫助”。 - **??…

PMP證書在國內已經泛濫了,大家怎么看?

目前,越來越多的人獲得了PMP證書。自1999年PMP引入中國以來,全國累計PMP考試人數接近60萬人次,通過PMP認證的人數約為42萬人。雖然這個數據看起來很大,但絕對不能說是過多。 首先,PMP在中國并不普遍。根據美國項目管理…

【源碼+文檔+調試講解】災害應急救援平臺

摘 要 災害應急救援平臺的目的是讓使用者可以更方便的將人、設備和場景更立體的連接在一起。能讓用戶以更科幻的方式使用產品,體驗高科技時代帶給人們的方便,同時也能讓用戶體會到與以往常規產品不同的體驗風格。 與安卓,iOS相比較起來&…

linux好用的分屏器byobu

什么是byobu byobu是linux下分屏器工具tmux或screen的包裝器。 安裝 sudo apt-get install byobu 啟動 emaubuntu:~$ byobu配置通知欄 按F9進入Byobu配置菜單導航到切換狀態通知選項,然后按ENTER鍵可以在選中和不選中之間切換選擇要啟用的狀態通知后&#xff…

深度學習項目實例(一)—— 實時AI換臉項目

一、前言 人工智能(AI)技術的快速發展為各個領域帶來了革命性的變化,其中之一就是人臉識別與圖像處理技術。在這之中,AI換臉技術尤其引人注目。這種技術不僅在娛樂行業中得到廣泛應用,如電影制作、視頻特效等&#xf…

static在C/C++中的作用

C語言中 static 的作用: 文件作用域的全局變量: 當static修飾一個全局變量時,這個變量只在定義它的文件內部可見,不會被其他文件訪問。 靜態局部變量: 在函數內部,static關鍵字確保局部變量的生命周期貫穿整…

目前公認最好用充電寶!四款高性價比充電寶推薦,一文看懂!

當我們在旅行途中,手機和相機等設備必不可少。長時間使用這些設備,電量很容易耗盡。此時,充電寶就能派上用場,讓我們在欣賞美景、記錄美好時光的同時,不再擔心電量不足。特別在假期出游的時候在我們玩的特別盡興的時候…

力扣2815.數組中的最大數對和

力扣2815.數組中的最大數對和 遍歷每個元素 并求其中最大的數字 將每個數字對應的最大元素存在數組中每遍歷到一個新的元素 &#xff0c;將其存在對應的數組位置中 class Solution {public:int maxSum(vector<int>& nums) {vector<int> cnt(10,INT_MIN);int…

【C++】關于虛函數的理解

深入探索C虛函數&#xff1a;原理、應用與實例分析 一、虛函數的原理二、虛函數的應用三、代碼實例分析四、總結 在C面向對象編程的世界里&#xff0c;虛函數&#xff08;Virtual Function&#xff09;扮演著至關重要的角色。它不僅實現了多態性這一核心特性&#xff0c;還使得…

查看linux服務器cpu,硬盤,內存

lscpu 查看cpu 釋義 Architecture: x86_64 // 指定系統架構&#xff0c;這里是 x86_64&#xff0c;表示一個64位系統。 CPU op-mode(s): 32-bit, 64-bit // 指示支持的 CPU 操作模式&#xff0c;顯示了32位和64位兩種模式。 Byte Order: Little…

紅酒與珠寶:璀璨與醇香的奢華交響,雙重誘惑難擋

在璀璨的燈光下&#xff0c;紅酒與珠寶各自閃耀著迷人的光芒&#xff0c;它們如同夜空中的繁星&#xff0c;交相輝映&#xff0c;共同演繹著奢華的雙重誘惑。今天&#xff0c;就讓我們一起走進這個充滿魅力的世界&#xff0c;感受紅酒與珠寶帶來的無盡魅力。 首先&#xff0c;讓…

java中自定義線程池最佳實踐

java中自定義線程池最佳實踐 在現代應用程序中&#xff0c;線程池是一種常用的技術&#xff0c;可以有效管理和復用線程資源&#xff0c;從而提升系統的并發性能和穩定性。本文將詳細介紹自定義線程池的最佳實踐&#xff0c;涵蓋從線程池大小配置、隊列選擇到拒絕策略、任務設…

基于STM32+ESP8266打造智能家居溫濕度監控系統(附源碼接線圖)

摘要: 本文將介紹如何使用STM32單片機、ESP8266 Wi-Fi模塊和Python Flask框架構建一個完整的物聯網系統&#xff0c;實現傳感器數據采集、無線傳輸、云端存儲及Web可視化展示。 關鍵詞: STM32, ESP8266, 傳感器, Flask, 物聯網, 云平臺, 數據可視化 1. 系統概述 本系統以STM…

Spring底層原理之proxyBeanMenthod實例 動態代理 反射 Bean的攔截

proxyBeanMenthod 假設我們要進行一個系統的二次開發 然后第一次開發我們實用的是XML聲明bean 二次開發的時候要用注解 我們如何把bean都加載上來呢 我們首先創建一個全新的配置類 package com.bigdata1421.config;public class SpringConfig32 { } 我們創建一個APP 加載…

Perl語言入門學習讀物

1. PERL 是什么? Perl 最初的設計者為Larry Wall&#xff0c;Perl借取了C、sed、awk、shell scripting以及很多其他程序語言的特性。Perl一般被稱為“實用報表提取語言”(PracticalExtraction andReportLanguage)&#xff0c;有時也被稱做“病態折中垃圾列表器”(Pathologica…

springboot+vue3無感知刷新token實戰

目錄 一、java后端 1、token構造實現類 ①驗證碼方式實現類 ②刷新token方式實現類 2、token相關操作&#xff1a;setCookie ①createToken ②refreshToken 二、前端&#xff08;vue3axios&#xff09; web網站中&#xff0c;前后端交互時&#xff0c;通常使用token機制…

全球最快的 JSON 文件查詢工具

本文字數&#xff1a;1684&#xff1b;估計閱讀時間&#xff1a;5分鐘 審校&#xff1a;莊曉東&#xff08;魏莊&#xff09; 本文在公眾號【ClickHouseInc】首發 介紹 在 ClickHouse&#xff0c;我們熱衷于基準測試和性能優化。所以當我第一次看到 Hacker News 上那篇“查詢大…