b-up:Enzo_Mi:深度學習基礎知識

1.最近鄰差值(Neareast Neighbor Interpolation)

插值算法 | 最近鄰插值法_嗶哩嗶哩_bilibili

上圖中最后一行,第一個圖像,因為目標像素(放大后,位于第1行第0列的像素)距離它最近的原圖的像素的像素值為1,因此該目標像素取值為1。

把原圖分別進行 上采樣

方式1:最近鄰插值

方式2:雙線性插值

肉眼觀看,方式2效果更好,沒有鋸齒狀,更平滑

雖然在上采樣階段,? 使用雙線性插值可以得到比最近鄰差值效果更好的 圖片,但是對于語義分割任務并不合適。

語義分割任務只能使用最近鄰插值,因為其標注時 將目標對應像素點的值賦值為1,背景賦值為0, 邊緣賦值為255,?當通過數據增強進行圖片縮放時,使用最近鄰插值? ,得到的新圖像的語義標簽中像素值只包含 0,1,255,? ?這個三個數值對語義分割網絡訓練具有意義, 其他數字沒有意義。

當使用雙線性插值,會導致語義標簽圖像中出現? 如? ?111,126等數字,這些數字沒有意義,對網絡訓練沒有用處。

個人

疑惑:對于實例實例分割,可以使用雙線性插值嗎??

語義分割網絡訓練時,? 可能進行圖像縮放這一數據增強方法,因此只能使用 最近鄰差值 防止語義標簽出現? 非規定中的數字。?

但是對于實例實例分割,可以使用雙線性插值嗎??

最近使用YOLO-SEG, 發現將最近鄰插值替換為 雙線性插值, 精度有些提升。

2.雙線性插值(bilinear? interpolation)

插值算法 |雙線性插值法_嗶哩嗶哩_bilibili

將源圖像t0進行上采樣, 使用雙線性插值, 首先:需要將放大的圖像(t1)等比例縮小為源圖像尺寸t3。

?

縮放為源圖像尺寸大小,需要進行對齊,有兩種對齊方式:

1.角對齊:需要將?t3與t0的網格中心點對齊, 這種需要t1縮小的尺度更大

2.邊對齊,需要將t3與t0的邊對齊,這種需要t1縮小的尺度比角對齊小一些

具體可以見pytorch官網的說明

該鏈接的內容

注意:像素值分別為v1,v2,v3,v4

?代碼示例

角對齊

邊對齊

角對齊

上述兩段代碼。第一個自已編寫, 第二個是調用函數庫

注意:這里以最左上角像素點的中心點的坐標作為原點坐標(0,0),而不是邊界框的角點

邊對齊

使用pytorch函數

?

3.雙三次插值算法(Bicubic)

雙: X,Y兩個方向

三次:計算目標像素點周圍像素權重時,使用三次項公式計算周圍權重

?

與上述兩種插值方法? 初始步驟相同,將放大的圖像t1進行縮小,縮小為源圖像t0尺度t2,然后對照源圖像,計算目標像素點

上圖中, 發現t2的一個像素點在t0中,剛好位于t0中四個像素點之間的中心

?

雙三次插值,取周圍16個像素點的值進行計算

上圖:

第一行表示 一維插值

第二行:二維差值,彩色點表示原圖像素點,彩色點的高低表示該像素點的像素值,黑色點表示放大圖像中的像素點,其高低表示所計算的采樣值。

x只能表示 X或Y一個方向的距離

因此需要計算兩次權重,分別表示X,Y方向

上圖:右邊第一個小圖,

藍色點(目標點)與源圖像素的一個紅點重合, X,Y方向距離均為0, 則該源圖的像素點在X或Y方向的對應的權重為1,

右邊第二個小圖,藍色點(目標點)與源圖像素的一個紅點在X,Y距離上均為1,?則該源圖的像素點在X或Y方向的對應的權重為0

因此:參考上圖的曲線圖

在X方向距離為0,則在X方向取得權重為1;

在X方向距離為1,則在X方向取得權重為0;

在X方向距離為2,則在X方向取得權重為0;

根據距離的不同(0.5,1.5等)分別選擇權重計算公式W(x)的三個不同分段函數

?

將在X,Y方向? ?計算出的16個值相加得到3.5?

使用個人編寫程序, 以及pytorch 程序進行驗證?

4.IoU與NMS

NMS 非極大值抑制 | IoU 交并比_嗶哩嗶哩_bilibili?

?待看

。。。

參考資料

1.插值算法 | 最近鄰插值法_嗶哩嗶哩_bilibili

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/89629.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/89629.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/89629.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

微信小程序商品結算功能

整體結算流程概述微信小程序的商品結算涉及前端交互、API調用和數據管理。典型流程包括:用戶交互:用戶選擇商品、填寫地址和時間。數據獲取:從小程序緩存或后端服務器獲取訂單信息。邏輯處理:驗證參數、應用紅包折扣。提交訂單&am…

2025年7月份最新一區算法——向光生長算法

注:該算法已按照智能優化算法APP標準格式進行整改,可直接集成到APP中,方便大家與自己的算法進行對比。(近期智能優化算法APP將會迎來超級大更新!請時刻保持關注哦!)向光生長算法(Pho…

腳手架新建Vue2/Vue3項目時,項目文件內容的區別

一. package.json vue版本號不同vue2中會多一個依賴:vue-template-compiler,作用是預編譯Vue2模板為渲染函數,減少運行時開銷。vue-template-compiler與vue版本要保持一致,否則會報錯。eslintConfig中的extends不同 eslintConfig…

微信小程序入門實例_____從零開始 開發一個每天記賬的微信小程序

在前面的微信小程序實例中我們開發了體重記錄等實用小程序,今天來嘗試一個和生活消費緊密相關的 ——“每日記賬小程序”。它能幫你隨時記錄收支情況,讓每一筆花費都清晰可查。下面就跟著步驟,一步步構建這個小程序。?體驗一個開發者的快樂。…

2026python實戰——如何利用海外代理ip爬取海外數據

家人們!隨著跨境電商的發展,是不是越來越多的小伙伴們也開始搞海外的數據分析了?不過雖然我們已經整天爬蟲、數據采集打交道了,但一到海外數據,還是有不少人掉進坑里。你們是不是也遇到過以下情況:花了一堆…

Spring Boot啟動原理:從main方法到內嵌Tomcat的全過程

Spring Boot的啟動過程是一個精心設計的自動化流程,下面我將詳細闡述從main方法開始到內嵌Tomcat啟動的全過程。 1. 入口:main方法 一切始于一個簡單的main方法: SpringBootApplication public class MyApplication {public static void m…

小白學Python,網絡爬蟲篇(1)——requests庫

目錄 一、網絡爬蟲的介紹 1.網絡爬蟲庫 2.robots.txt 規則 二、requests 庫和網頁源代碼 1.requests 庫的安裝 2.網頁源代碼 三、獲取網頁資源 1.get () 函數 (1)get() 搜索信息 (2)get() 添加信息 2.返回 Response 對象…

平板可以用來辦公嗎?從文檔處理到創意創作的全面測評

在快節奏的現代職場,一個核心疑問始終縈繞在追求效率的職場人心中:平板電腦,這個輕薄便攜的設備,真的能替代筆記本電腦,成為值得信賴的辦公伙伴嗎? 答案并非簡單的“是”或“否”,而是一個充滿潛…

docker gitlab 備份 恢復 版本升級(16.1.1到18.2.0)

docker 啟動 # 在線 docker pull gitlab/gitlab-ce:latest # 離線 docker save -o gitlab-ce-latest.tar gitlab/gitlab-ce:latest docker load -i gitlab-ce-latest.tardocker run --detach \--publish 8021:80 --publish 8023:22 \ --name gitlab_test \--restart always \-…

web3 區塊鏈技術與用

#53 敲點算法題 瑞吉外賣day4 調整心態 睡眠 及精神 web3 以下是應北京大學肖臻老師《區塊鏈技術與用》公開課的完整教學大綱,綜合課程內容、技術模塊及前沿擴展,分為核心章節與專題拓展兩部分,引用自公開課資料及學員筆記。 &#x1f4…

Redis1:高并發與微服務中的鍵值存儲利器

redis中存儲的數據格式為鍵值對(Key,Value)在高并發的項目和微服務的項目會頻繁的用到redisNoSQL型數據庫1.初始Redis1.1認識NoSQLSQL:structure query language關系型數據庫結構化:有固定格式要求(表關系,…

/字符串/

字符串 個人模板 5. 最長回文子串 93. 復原 IP 地址 43. 字符串相乘 227. 基本計算器 II

我的開發日志:隨機數小程序

文章目錄前言UI設計代碼前言 為什么我要設計這個程序呢?因為我要用,懶得在網上下載了,于是干脆寫了一個。 UI設計 UI是我凹出來的,你們要使用,直接新建一個UI.ui文件,然后把下面的東西輸進去就可以了。 …

《Oracle SQL:使用 RTRIM 和 TO_CHAR 函數格式化數字并移除多余小數點》

select RTRIM(to_char(1222.11123344,fm9999990.9999),.) from dual 這條 SQL 語句主要用于對數字進行格式化處理,并移除格式化結果右側多余的小數點。下面將詳細拆解該語句的執行過程和各部分作用。語句詳細拆解1. to_char(1222.11123344,fm9999990.9999)函數功能&…

「Java案例」方法重裝求不同類型數的立方

利用方法重裝實現不同類型數值的立方計算 立方計算方法的重載實現 編寫一個程序,要求編寫重載方法xxx cube(xxx value)實現對不同類型數值計算立方。 # 源文件保存為“CubeCalculator.java” public class CubeCalculator {public static void main(String[] args) {// 測試…

API 接口開發與接入實踐:自動化采集淘寶商品數據

在電商數據分析、價格監控等場景中,自動化采集淘寶商品數據具有重要價值。本文將詳細介紹如何通過 API 接口開發實現淘寶商品數據的自動化采集,包含完整的技術方案和代碼實現。 一、淘寶 API 接入基礎 1. 接入流程概述 注冊淘寶賬號獲取 ApiKey 和 Ap…

python-pptx 的layout 布局

一、布局基礎概念 在 PowerPoint 中,布局(Layout) 決定了幻燈片的占位符(如標題、內容、圖片等)的排列方式。python-pptx 提供了對布局的編程控制。二、默認布局類型及索引 通過 prs.slide_layouts[index] 訪問&#x…

服務器mysql數據的簡單備份腳本

服務器mysql數據的簡單備份腳本 一個小型項目mysql數據庫數據的定時備份 通過crontab定時執行腳本: 0 1 * * * /home/yuyu/mysqlbak.sh備份文件加入時間戳,防止覆蓋支持刪除超過x天的備份數據文件,防止備份數據文件太多 #!/bin/bash# 配置變量 DB_HOST"127.0.…

數據分析:從數據到決策的核心邏輯與實踐指南

在數據驅動決策的時代,“數據分析” 早已不是專業分析師的專屬技能,而是每個職場人都需要掌握的基礎能力。但很多人在面對數據時,常會陷入 “羅列數據卻無結論”“指標好看卻解決不了問題” 的困境。本文將基于數據分析的核心定義、關鍵維度和…

元宇宙與Web3.0:技術特征、關系及挑戰

一、元宇宙的技術特征(2025年)1. 空間構建技術3D建模與渲染:實時渲染技術(如Unity HDRP)實現路徑追蹤光追,AI生成模型(NVIDIA Get3D)3秒生成3D場景。數字孿生技術:城市級…