場景文本檢測識別學習 day10(MMdetection)

配置文件(config)

  • 由于在大型項目中,一種模型需要分:tiny、small、big等很多種,而它們的區別主要在網絡結構,數據的加載,訓練策略等,且差別很多都很小,所以如果每個模型都手動從頭寫一份,很麻煩,為了方便,現在都是直接采用配置文件的形式來定義
  • 如yaml文件、py文件等
    在這里插入圖片描述
    在這里插入圖片描述

MMdetection的配置文件構成

  • 在MMdection的配置文件中,我們根據字段來定義模型訓練的各部分
    在這里插入圖片描述
  • 配置文件的運作方式
    在這里插入圖片描述

使用MMdection來訓練自己的檢測模型

在這里插入圖片描述

  • coco數據集的組織形式
    在這里插入圖片描述

  • coco數據集的標注格式

  • 所有標注信息存儲在一個JSON對象中,包含以下信息:images–所有原始圖像信息、annotations–所有標注信息、categories–全部物體類別信息
    在這里插入圖片描述
    在這里插入圖片描述
    在這里插入圖片描述

  • 其中:name表示當前的物體類別,supercategories表示當前物體的超類,如car的超類為vehicle

  • 我們將自己的數據集按照以上的格式整理好后,還需要更改模型的配置文件(有些模型是繼承coco_instance.py,需要仔細查找),如下:
    在這里插入圖片描述

  • 重點是需要修改:數據集的路徑、batch_size、進程數

  • 在將原始圖像輸入進模型之前,我們可能還需要對圖像進行:隨機裁剪與縮放、水平翻轉、像素值歸一化、轉換為PyTorch Tensor等操作,這些操作我們統一放在數據處理流水線,即pipeline中。對于微調訓練,通常情況是不需要進行更改的

  • 下圖為分類的pipeline:
    在這里插入圖片描述

  • 由于檢測有框,所以多了一個annotations,對于框也需要進行跟原始圖片一樣的操作,下圖是檢測的:
    在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/18052.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/18052.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/18052.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

ChatGPT原創指令大全(持續更新)

隨著ChatGPT在互聯網上的使用越來越多,但很多人在使用ChatGPT的過程中會覺得得到的答案并不是很精準。究其原因其實是你給它的命令不夠準確、不夠到位。實際現在網上已經很多關于ChatGPT的網站,可以快速生成帶有快捷鍵的ChatGPT指令。但是對于不熟悉Chat…

LeetCode 2951.找出峰值:模擬(遍歷)

【LetMeFly】2951.找出峰值:模擬(遍歷) 力扣題目鏈接:https://leetcode.cn/problems/find-the-peaks/ 給你一個下標從 0 開始的數組 mountain 。你的任務是找出數組 mountain 中的所有 峰值。 以數組形式返回給定數組中 峰值 的…

視創云展「VR直播」是什么?有哪些功能和應用場景?

視創云展「VR直播」通過“3D沉浸式展廳直播高互動感”的創新玩法,使企業隨時隨地舉辦一場低成本、高互動、能獲客的元宇宙直播活動成為可能。「VR直播」能實現3D展廳內VR場景漫游,更結合音視頻交互、同屏互動等新功能,為用戶帶來更沉浸的虛擬…

Java基礎之 API 字符串

文章目錄 API字符串String概述創建對象 java的內存模型java的常用方法(比較)練習 API 概念: APl(Application ProgrammingInterface): 應用程序編程接口 簡單理解: API就是別人已經寫好的東西,我們不需要自己編寫,直接使用即可。 Java API: 指的就是J…

馬斯克的 xAI 帝國!60億融資背后的超級布局?

在全球科技競技場,每個重大融資事件都是對行業格局的一次重塑。近日,埃隆馬斯克的人工智能初創企業 xAI 成功完成了一輪規模空前的融資——60億美元,此舉無疑在業界投下了一枚震撼彈,標志著 AI 領域內一場新的競賽拉開了序幕。 …

旅游卡在哪里拿貨?千益暢行旅游卡源頭

旅游卡是一種便捷的旅行工具,它可以提供多種優惠和特惠,讓人們在旅行中更加省錢、省心。那么,在千益暢行旅游卡這里,我們該如何拿到這張神奇的旅游卡呢? 首先,千益暢行旅游卡作為一款專為旅行愛好者打造的…

QT學習(20):QStyle類

Qt包含一組QStyle子類,這些子類(QWindowsStyle,QMacStyle等)模擬Qt支持的不同平臺的樣式,默認情況下,這些樣式內置在Qt GUI模塊中,樣式也可以作為插件提供。 Qt的內置widgets使用QStyle來執行幾…

LangChain之鏈的應用(下)

LangChain之鏈的應用 Chain鏈的應用配置LLMChain:簡單鏈create_stuff_documents_chain:文檔鏈create_extraction_chain:提取信息鏈LLMMathChain:數學鏈create_sql_query_chain:SQL查詢鏈連接數據庫創建并使用鏈 Sequen…

K210 數字識別 教程

一、燒寫固件 連接k210開發板,點開燒錄固件工具,選中固件,并下載 二、模型訓練 網站:MaixHub 1、上傳文件 2、開始標記數據 添加9個標簽,命名為1~9,按鍵盤w開始標記,鍵盤D可以下一張圖片&…

計算機網絡(1

網絡初識 目錄 網絡初識一. 網絡分類1. 局域網LAN(Local Area Network):2. 廣域網WAN(Wide Area Network): 二. 組建網絡的基礎設備1. 路由器2. 交換機 三. 標識符 協議 (protocol)一. 協議分層1. 分層的好處2. OSI七層分層3. TCP/IP五層模型(或四層) 模型(1. 物理層(可不算)(2…

6.8 LIBBPF API(七,bpf_core_read.h 函數,定義,枚舉)

一,函數 void * bpf_rdonly_cast (const void *obj, __u32 btf_id) __ksym __weak 二,定義 __CORE_RELO(src, field, info) __builtin_preserve_field_info((src)->field,BPF_FIELD_##info) __CORE_BITFIELD_PROBE_READ(dst, src, fld) bpf_probe_read_kernel( \ (v…

學習前端第四十二天(修改文檔)

1、創建一個元素 docunment.createElement( tag );創建一個元素節點 let div document.createElement(“div”);創建一個div標簽 document.createTextNode( Text );創建一個文本節點 let t…

Windows hook介紹與代碼演示

Windows Hook 是一種機制,允許應用程序監視系統或處理特定事件。它可以攔截和更改消息,甚至可以插入到其他應用程序的消息處理機制中。Windows 提供了多種掛鉤類型,例如鍵盤掛鉤、鼠標掛鉤、消息掛鉤等。 hook代碼實現 下面是一個使用 Wind…

【Zotero】【MacOS】Zotero6常用插件總結

因為目前MacOS只支持Zotero6,所以我將網上找到的教程以及自己找到適應Zotero6版本的插件做了個整合 教程地址:Zotero6安裝/插件安裝教程 插件地址:Zotero6_Plugs

Django教程——數據庫操作(增刪改查)

在上篇文章中我們學習了Django教程——模型,這篇文章學習Django教程——數據庫操作(增刪改查)。 在學習數據庫操作之前,我們需要定義好模型類,模型類代碼如下: from django.db import models class UserM…

OS復習筆記ch7-1

存儲的基本管理需求 重定位 重定位(Relocation):需要解決可執行文件中地址(指令和數據)和內存地址的對應。 一般有兩種比較常見的重定位方式: 靜態重定位(static relocation):當程序被裝入內存時,一次性…

Python pdf2imges -- pdf文件轉圖片

pdf文件轉圖片,需要安裝PyMuPDF包,具體PyMuPDF包介紹可以參考:Python 處理 PDF 的神器 -- PyMuPDF import fitz # pip install PyMuPDF# PDF轉換為IMG統一管理 def pdf_to_images(pdf_path, img_path, filename):"""pdf_p…

Mac系統國內通過nvm快速安裝node

國內通過nvm安裝node 國內nvm安裝工具 地址:https://gitee.com/RubyMetric/nvm-cn 安裝命令 bash -c "$(curl -fsSL https://gitee.com/RubyMetric/nvm-cn/raw/main/install.sh)"如果按照過程中有報錯可以嘗試下載安裝腳本 在瀏覽器中打開下面的鏈接htt…

【頭歌】計算機網絡DHCP服務器配置第四關配置路由器子接口答案

頭歌計算機網絡DHCP服務器配置第四關配置路由器子接口操作步驟 任務描述 本關任務:配置路由器的子接口。 操作要求 在第一關的拓撲圖的基礎上,配置路由器及 PC 機,具體要求如下: 1、打開路由器物理接口 F0/0 ; 2、配置…

【科普】關于Cookie的一點知識

【科普】關于Cookie的一點知識 1. Cookie的傳輸方式2. 不設置Domain時的默認邏輯3. SameSite設置為None的風險4. 通過IP訪問時如何設置Cookie 1. Cookie的傳輸方式 Cookie是通過HTTP(超文本傳輸協議)和HTTPS(安全超文本傳輸協議)…