【AIGC】計算機視覺-YOLO系列家族

YOLO系列家族

      • (1)YOLO發展史
      • (2) YOLOX
      • (3) YOLOv6
      • (4) YOLOv7
      • (5) YOLOv8
      • (6) YOLOv9
      • (7)YOLOv10
      • (8)YOLOv11
      • (9)YOLOv12

(1)YOLO發展史

YOLO(You Only Look Once)是一種流行的物體檢測和圖像分割模型,由華盛頓大學的約瑟夫-雷德蒙(Joseph Redmon)和阿里-法哈迪(Ali Farhadi)開發。YOLO 于 2015 年推出,因其高速度和高精確度而迅速受到歡迎。

  • 2016 年發布的YOLOv2 通過納入批量歸一化、錨框和維度集群改進了原始模型。

  • 2018 年推出的YOLOv3 使用更高效的骨干網絡、多錨和空間金字塔池化(SPP)進一步增強了模型的性能。

  • 2020 年YOLOv4發布,引入了 Mosaic 數據增強、新的無錨檢測頭和新的損失函數等創新技術。

  • 2020 年YOLOv5進一步提高了模型的性能,并增加了超參數優化、集成實驗跟蹤和自動導出為常用導出格式等新功能。

  • 2021 年YOLOX由曠視科技開源,解耦頭

  • 2022 年YOLOv6由美團開源,目前已用于該公司的許多自主配送機器人。

  • 2022 年YOLOv7開源,增加了額外的任務,如 COCO 關鍵點數據集的姿勢估計。

  • 2023 年YOLOv8是YOLO 的最新版本,由Ultralytics 提供。YOLOv8 YOLOv8 支持全方位的視覺 AI 任務,包括檢測、分割、姿態估計、跟蹤和分類。這種多功能性使用戶能夠在各種應用和領域中利用YOLOv8 的功能。

  • 2024 年YOLOv9引入了可編程梯度信息(PGI)和廣義高效層聚合網絡(GELAN)等創新方法。

  • 2024年YOLOv10引入了一種雙重分配策略,消除了NMS的需求,從而實現了更快、更高效的目標檢測。

在這里插入圖片描述

  • 2024年YOLO11 新功能: 最新的 模型可在Ultralytics YOLO 檢測、分割、姿勢估計、跟蹤和分類等多項任務中提供最先進的 (SOTA) 性能,充分利用各種人工智能應用和領域的能力。

在這里插入圖片描述

  • 2025.02.18 YOLOv12發布,首次擺脫了傳統卷積神經網絡的約束,將注意力機制直接融入目標檢測框架,創新性的使用區域注意力、R-ELAN 和 FlashAttention,在提高檢測精度(mAP)的同時保持實時推理性能。

在這里插入圖片描述

YOLO家族進化史(v1-v8)

(2) YOLOX

目標檢測網絡YoloX介紹及實現

YOLOX簡述

論文地址: https://arxiv.org/abs/2107.08430

代碼倉庫: https://github.com/Megvii-BaseDetection/YOLOX

(3) YOLOv6

論文地址:

  • YOLOv6 v3.0: A Full-Scale Reloading 🔥
  • YOLOv6: A Single-Stage Object Detection Framework for Industrial Applications

代碼倉庫: https://github.com/meituan/YOLOv6

(4) YOLOv7

論文地址: YOLOv7: Trainable bag-of-freebies sets new state-of-the-art for real-time object detectors

代碼倉庫: https://github.com/WongKinYiu/yolov7

(5) YOLOv8

論文地址: /

代碼倉庫: https://github.com/ultralytics/ultralytics

(6) YOLOv9

江大白 | 目標檢測YOLOv9算法,重磅開源!

論文地址: https://arxiv.org/abs/2402.13616

代碼倉庫: https://github.com/WongKinYiu/yolov9

(7)YOLOv10

目標檢測 | yolov10 原理和介紹

論文地址: https://arxiv.org/pdf/2405.14458
代碼倉庫: https://github.com/THU-MIG/yolov10

(8)YOLOv11

YOLOv11來了,使用YOLOv11訓練自己的數據集和推理

代碼倉庫: https://github.com/ultralytics/ultralytics

(9)YOLOv12

YOLOv12問世!

YOLOv12論文詳解:以注意力機制為核心的實時目標檢測算法(附論文和源碼)

論文地址:https://arxiv.org/abs/2502.12524

代碼倉庫:https://github.com/sunsmarterjie/yolov12

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/72022.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/72022.shtml
英文地址,請注明出處:http://en.pswp.cn/web/72022.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

基于Python懂車帝汽車數據分析平臺(源碼+lw+部署文檔+講解),源碼可白嫖!

摘要 時代在飛速進步,每個行業都在努力發展現在先進技術,通過這些先進的技術來提高自己的水平和優勢,汽車數據分析平臺當然不能排除在外。本次我所開發的懂車帝汽車數據分析平臺是在實際應用和軟件工程的開發原理之上,運用Python…

Prompt 工程

一、提示原則 import openai import os import openai from dotenv import load_dotenv, find_dotenv from openai import OpenAI def get_openai_key():_ load_dotenv(find_dotenv())return os.environ[OPENAI_API_KEY]client OpenAI(api_keyget_openai_key(), # This is …

MySQL -- 數據庫基礎

1、基礎登錄操作 mysql 指定選項 選項&#xff1a; <1> -h 指定ip地址&#xff0c;即連接的主機&#xff0c;不帶時&#xff0c;默認連本機 <2> -P 指定的端口號&#xff0c;指定默認端口號&#xff08;配置文件中進行配置&#xff09; <3>-u 指定的用戶 &l…

02C#基本結構篇(D3_內部類-代碼塊-數據類型-變量-常量-字面量-運算符-流程控制語句)

目錄 一、內部類 1. 定義內部類 2. 創建內部類的實例 3. 訪問外部類的私有成員 4. 內部靜態類 5. 使用場景和優點 6. 注意事項 ------------------------------------------- 二、代碼塊 1. 控制流語句 1.1. 條件語句 1> if 語句 2> switch 語句 1.2. 循環語…

15 | 定義簡潔架構 Store 層的數據類型

提示&#xff1a; 所有體系課見專欄&#xff1a;Go 項目開發極速入門實戰課&#xff1b;歡迎加入 云原生 AI 實戰 星球&#xff0c;12 高質量體系課、20 高質量實戰項目助你在 AI 時代建立技術競爭力&#xff08;聚焦于 Go、云原生、AI Infra&#xff09;&#xff1b;本節課最終…

CSDN統計個人創作總字數

前言 不是很懂爬蟲&#xff0c;所以就叫deepseek寫了一個 用起來很簡單&#xff0c;但是有一個小問題&#xff0c;就是統計的是總字符數。代碼片會被統計進去&#xff0c;Markdown語法也會被統計進去。 不過我沒有太多需求&#xff0c;能大概統計一下滿足以下小小的好奇心和成…

React.js 基礎與進階教程

React.js 基礎與進階教程 React.js 是由 Facebook 開發的流行前端 JavaScript 庫&#xff0c;專為構建用戶界面&#xff08;UI&#xff09;設計&#xff0c;尤其適用于單頁面應用&#xff08;SPA&#xff09;。它采用組件化開發模式&#xff0c;使 UI 結構更加清晰、可維護性更…

msf(Metasploit)中Session與Channel的區別與關系解析

在 Metasploit Framework&#xff08;MSF&#xff09;中&#xff0c;Session 和 Channel 都是與目標主機的交互方式&#xff0c;但它們的作用和概念有所不同。本文將解析這兩個術語的區別。 一、Session&#xff08;會話&#xff09; Session 是指通過 Metasploit 成功利用目標…

設計模式-結構型模式-裝飾器模式

概述 裝飾器模式 : Decorator Pattern : 是一種結構型設計模式. 作用 &#xff1a; 允許你動態地給對象添加功能或職責&#xff0c;而無需修改其原始類的代碼,非常的符合 開閉原則。 實現思路 &#xff1a;通過創建一個包裝對象&#xff08;即裝飾器&#xff09;&#xff0c;來…

Qt/C++音視頻開發82-系統音量值獲取和設置/音量大小/靜音

一、前言 在音視頻開發中&#xff0c;音量的控制分兩塊&#xff0c;一個是控制播放器本身的音量&#xff0c;絕大部分場景都是需要控制這個&#xff0c;這個不會影響系統音量的設置。還有一種場景是需要控制系統的音量&#xff0c;因為播放器本身的音量是在系統音量的基礎上控…

基于深度學習的醫學CT圖像肺結節智能檢測與語音提示系統【python源碼+Pyqt5界面+數據集+訓練代碼】

《------往期經典推薦------》 一、AI應用軟件開發實戰專欄【鏈接】 項目名稱項目名稱1.【人臉識別與管理系統開發】2.【車牌識別與自動收費管理系統開發】3.【手勢識別系統開發】4.【人臉面部活體檢測系統開發】5.【圖片風格快速遷移軟件開發】6.【人臉表表情識別系統】7.【…

前端小食堂 | Day14 - Vue 3 の傳送門與懸念

&#x1f300; 今日秘技&#xff1a;Teleport 與 Suspense の時空魔法 1. Teleport 任意門 <template> <!-- &#x1f6aa; 將組件傳送到 body 末尾 --> <Teleport to"body"> <div class"modal"> <h2>重要通知&#x…

emacs使用mongosh的方便工具發布

github項目地址: GitHub - csfreebird/emacs_mongosh: 在emacs中使用mongosh快速登錄mongodb數據庫 * 用途 在emacs中使用mongosh快速登錄mongodb數據庫&#xff0c; 操作方法: M-x mongosh, 輸入數據庫名稱&#xff0c;然后就可以自動登錄&#xff0c;前提是你已經配置好了…

Linux:Ubuntu server 24.02 上搭建 ollama + dify

一、安裝Ubuntu 具體的安裝過程可以參見此鏈接&#xff1a;鏈接&#xff1a;Ubuntu Server 20.04詳細安裝教程&#xff0c;這里主要記錄一下過程中遇到的問題。 安裝時subnet如何填寫 在Ubuntu中subnet填寫255.255.255.0是錯誤的&#xff0c;其格式為 xx.xx.xx.xx/yy &#…

unordered_set 的常用函數

在 C 的標準庫中&#xff0c;std::unordered_set 是基于哈希表實現的哈希集合。下面介紹這種語言里哈希集合的常用函數。 C std::unordered_set 1. 元素操作 insert 功能&#xff1a;向哈希集合中插入元素。如果元素已經存在&#xff0c;則不會重復插入。示例代碼&#xff1a…

starrocks批量啟停腳本

#!/bin/bash # 定義 StarRocks 安裝目錄 STARROCKS_HOME"/path/to/starrocks" # 定義 FE 和 BE 節點列表 FE_NODES("fe_node1_ip" "fe_node2_ip" "fe_node3_ip") BE_NODES("be_node1_ip" "be_node2_ip" "be_…

python 提取視頻中的音頻

在Python中提取視頻中的音頻&#xff0c;你可以使用moviepy庫&#xff0c;這是一個非常強大且易于使用的庫&#xff0c;專門用于視頻編輯。以下是如何使用moviepy來提取視頻中的音頻的步驟&#xff1a; 安裝moviepy 首先&#xff0c;你需要安裝moviepy。你可以通過pip安裝它&a…

大語言模型打卡學習DAY1

學習目標&#xff1a; 語言模型的發展歷程 大模型的技術基礎 學習內容&#xff1a; 1. 語言模型的發展歷程 語言模型通常是指能夠建模自然語言文本生成概率的模型&#xff0c;從語言建模到任務求解&#xff0c;這是科學思維的一次重要躍升。2. 大語言模型技術基礎 定義&#…

boarding_passes(登機牌)表的作用

boarding_passes&#xff08;登機牌&#xff09;表的作用 boarding_passes 這張表的主要作用是記錄旅客的登機信息&#xff0c;包括&#xff1a; 票號 (ticket_no) - 關聯到 tickets 表&#xff0c;表示這張票屬于哪個旅客。航班 ID (flight_id) - 關聯到 flights 表&#xf…

Go語言為什么運行比Java快

文章目錄 前言一、核心區別二、Go Vs Java1.Go 的啟動比 Java 快&#xff1f;2.選 Go Or Java&#xff1f; 總結 前言 Go 和 Java 是兩種廣泛應用的編程語言&#xff0c;它們在語言特性、性能、生態、應用場景等方面存在顯著區別。以下是它們的核心區別&#xff0c;以及在實際…