場景文本檢測識別學習 day10（MMdetection）

場景文本檢測識別學習 day10（MMdetection）

bicheng/2025/8/18 22:02:14/文章來源:https://blog.csdn.net/u011453680/article/details/139267215

配置文件(config)

由于在大型項目中，一種模型需要分：tiny、small、big等很多種，而它們的區別主要在網絡結構，數據的加載，訓練策略等，且差別很多都很小，所以如果每個模型都手動從頭寫一份，很麻煩，為了方便，現在都是直接采用配置文件的形式來定義
如yaml文件、py文件等

MMdetection的配置文件構成

在MMdection的配置文件中，我們根據字段來定義模型訓練的各部分
配置文件的運作方式

使用MMdection來訓練自己的檢測模型

在這里插入圖片描述

coco數據集的組織形式
coco數據集的標注格式
所有標注信息存儲在一個JSON對象中，包含以下信息：images–所有原始圖像信息、annotations–所有標注信息、categories–全部物體類別信息
其中：name表示當前的物體類別，supercategories表示當前物體的超類，如car的超類為vehicle
我們將自己的數據集按照以上的格式整理好后，還需要更改模型的配置文件（有些模型是繼承coco_instance.py，需要仔細查找），如下：
重點是需要修改：數據集的路徑、batch_size、進程數
在將原始圖像輸入進模型之前，我們可能還需要對圖像進行：隨機裁剪與縮放、水平翻轉、像素值歸一化、轉換為PyTorch Tensor等操作，這些操作我們統一放在數據處理流水線，即pipeline中。對于微調訓練，通常情況是不需要進行更改的
下圖為分類的pipeline：
由于檢測有框，所以多了一個annotations，對于框也需要進行跟原始圖片一樣的操作，下圖是檢測的：

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/18052.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/18052.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/18052.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

ChatGPT原創指令大全(持續更新)

ChatGPT原創指令大全(持續更新)

隨著ChatGPT在互聯網上的使用越來越多，但很多人在使用ChatGPT的過程中會覺得得到的答案并不是很精準。究其原因其實是你給它的命令不夠準確、不夠到位。實際現在網上已經很多關于ChatGPT的網站，可以快速生成帶有快捷鍵的ChatGPT指令。但是對于不熟悉Chat…

閱讀更多...

LeetCode 2951.找出峰值：模擬（遍歷）

LeetCode 2951.找出峰值：模擬（遍歷）

【LetMeFly】2951.找出峰值：模擬（遍歷） 力扣題目鏈接：https://leetcode.cn/problems/find-the-peaks/ 給你一個下標從 0 開始的數組 mountain 。你的任務是找出數組 mountain 中的所有峰值。以數組形式返回給定數組中峰值的…

閱讀更多...

視創云展「VR直播」是什么？有哪些功能和應用場景？

視創云展「VR直播」是什么？有哪些功能和應用場景？

視創云展「VR直播」通過“3D沉浸式展廳直播高互動感”的創新玩法，使企業隨時隨地舉辦一場低成本、高互動、能獲客的元宇宙直播活動成為可能。「VR直播」能實現3D展廳內VR場景漫游，更結合音視頻交互、同屏互動等新功能，為用戶帶來更沉浸的虛擬…

閱讀更多...

Java基礎之 API 字符串

Java基礎之 API 字符串

文章目錄 API字符串String概述創建對象 java的內存模型java的常用方法(比較)練習 API 概念: APl(Application ProgrammingInterface): 應用程序編程接口簡單理解: API就是別人已經寫好的東西，我們不需要自己編寫，直接使用即可。 Java API: 指的就是J…

閱讀更多...

馬斯克的 xAI 帝國！60億融資背后的超級布局？

馬斯克的 xAI 帝國！60億融資背后的超級布局？

在全球科技競技場，每個重大融資事件都是對行業格局的一次重塑。近日，埃隆馬斯克的人工智能初創企業 xAI 成功完成了一輪規模空前的融資——60億美元，此舉無疑在業界投下了一枚震撼彈，標志著 AI 領域內一場新的競賽拉開了序幕。 …

閱讀更多...

旅游卡在哪里拿貨？千益暢行旅游卡源頭

旅游卡在哪里拿貨？千益暢行旅游卡源頭

旅游卡是一種便捷的旅行工具，它可以提供多種優惠和特惠，讓人們在旅行中更加省錢、省心。那么，在千益暢行旅游卡這里，我們該如何拿到這張神奇的旅游卡呢？ 首先，千益暢行旅游卡作為一款專為旅行愛好者打造的…

閱讀更多...

QT學習（20）：QStyle類

QT學習（20）：QStyle類

Qt包含一組QStyle子類，這些子類（QWindowsStyle，QMacStyle等）模擬Qt支持的不同平臺的樣式，默認情況下，這些樣式內置在Qt GUI模塊中，樣式也可以作為插件提供。 Qt的內置widgets使用QStyle來執行幾…

閱讀更多...

LangChain之鏈的應用（下）

LangChain之鏈的應用（下）

LangChain之鏈的應用 Chain鏈的應用配置LLMChain：簡單鏈create_stuff_documents_chain：文檔鏈create_extraction_chain：提取信息鏈LLMMathChain：數學鏈create_sql_query_chain：SQL查詢鏈連接數據庫創建并使用鏈 Sequen…

閱讀更多...

K210 數字識別教程

K210 數字識別教程

一、燒寫固件連接k210開發板，點開燒錄固件工具，選中固件，并下載二、模型訓練網站：MaixHub 1、上傳文件 2、開始標記數據添加9個標簽，命名為1~9，按鍵盤w開始標記，鍵盤D可以下一張圖片&…

閱讀更多...

計算機網絡(1

計算機網絡(1

網絡初識目錄網絡初識一. 網絡分類1. 局域網LAN(Local Area Network):2. 廣域網WAN(Wide Area Network): 二. 組建網絡的基礎設備1. 路由器2. 交換機三. 標識符協議 (protocol)一. 協議分層1. 分層的好處2. OSI七層分層3. TCP/IP五層模型(或四層) 模型(1. 物理層(可不算)(2…

閱讀更多...

6.8 LIBBPF API（七，bpf_core_read.h 函數，定義，枚舉）

6.8 LIBBPF API（七，bpf_core_read.h 函數，定義，枚舉）

一，函數 void * bpf_rdonly_cast (const void *obj, __u32 btf_id) __ksym __weak 二，定義 __CORE_RELO(src, field, info) __builtin_preserve_field_info((src)->field,BPF_FIELD_##info) __CORE_BITFIELD_PROBE_READ(dst, src, fld) bpf_probe_read_kernel( \ (v…

閱讀更多...

學習前端第四十二天（修改文檔）

學習前端第四十二天（修改文檔）

1、創建一個元素 docunment.createElement( tag )；創建一個元素節點 let div document.createElement（“div”）；創建一個div標簽 document.createTextNode（ Text ）；創建一個文本節點 let t…

閱讀更多...

Windows hook介紹與代碼演示

Windows hook介紹與代碼演示

Windows Hook 是一種機制，允許應用程序監視系統或處理特定事件。它可以攔截和更改消息，甚至可以插入到其他應用程序的消息處理機制中。Windows 提供了多種掛鉤類型，例如鍵盤掛鉤、鼠標掛鉤、消息掛鉤等。 hook代碼實現下面是一個使用 Wind…

閱讀更多...

【Zotero】【MacOS】Zotero6常用插件總結

【Zotero】【MacOS】Zotero6常用插件總結

因為目前MacOS只支持Zotero6，所以我將網上找到的教程以及自己找到適應Zotero6版本的插件做了個整合教程地址：Zotero6安裝/插件安裝教程插件地址：Zotero6_Plugs

閱讀更多...

Django教程——數據庫操作（增刪改查）

Django教程——數據庫操作（增刪改查）

在上篇文章中我們學習了Django教程——模型，這篇文章學習Django教程——數據庫操作（增刪改查）。在學習數據庫操作之前，我們需要定義好模型類，模型類代碼如下： from django.db import models class UserM…

閱讀更多...

OS復習筆記ch7-1

OS復習筆記ch7-1

存儲的基本管理需求重定位重定位(Relocation)：需要解決可執行文件中地址（指令和數據）和內存地址的對應。一般有兩種比較常見的重定位方式： 靜態重定位(static relocation)：當程序被裝入內存時，一次性…

閱讀更多...

Python pdf2imges -- pdf文件轉圖片

Python pdf2imges -- pdf文件轉圖片

pdf文件轉圖片，需要安裝PyMuPDF包，具體PyMuPDF包介紹可以參考：Python 處理 PDF 的神器 -- PyMuPDF import fitz # pip install PyMuPDF# PDF轉換為IMG統一管理 def pdf_to_images(pdf_path, img_path, filename):"""pdf_p…

閱讀更多...

Mac系統國內通過nvm快速安裝node

Mac系統國內通過nvm快速安裝node

國內通過nvm安裝node 國內nvm安裝工具地址：https://gitee.com/RubyMetric/nvm-cn 安裝命令 bash -c "$(curl -fsSL https://gitee.com/RubyMetric/nvm-cn/raw/main/install.sh)"如果按照過程中有報錯可以嘗試下載安裝腳本在瀏覽器中打開下面的鏈接htt…

閱讀更多...

【頭歌】計算機網絡DHCP服務器配置第四關配置路由器子接口答案

【頭歌】計算機網絡DHCP服務器配置第四關配置路由器子接口答案

頭歌計算機網絡DHCP服務器配置第四關配置路由器子接口操作步驟任務描述本關任務：配置路由器的子接口。操作要求在第一關的拓撲圖的基礎上，配置路由器及 PC 機，具體要求如下： 1、打開路由器物理接口 F0/0 ； 2、配置…

閱讀更多...

【科普】關于Cookie的一點知識

【科普】關于Cookie的一點知識

【科普】關于Cookie的一點知識 1. Cookie的傳輸方式2. 不設置Domain時的默認邏輯3. SameSite設置為None的風險4. 通過IP訪問時如何設置Cookie 1. Cookie的傳輸方式 Cookie是通過HTTP（超文本傳輸協議）和HTTPS（安全超文本傳輸協議）…

閱讀更多...

最新文章