深度學習在測距模型中的應用

深度學習在測距模型中的應用

news/2025/8/24 6:21:01/文章來源:https://blog.csdn.net/m0_73442527/article/details/146703750

一、單目視覺測距和雙目視覺測距簡介

1、單目視覺測距

模型：深度估計（Depth Estimation）

原理：通過深度學習模型（如MonoDepth2、MiDaS）或傳統的計算機視覺方法（如單目相機結合物體大小推斷）估計場景深度。
實現方式：
- 使用卷積神經網絡（CNN）或Transformer模型，從單張圖像預測像素級深度信息。
- 需要大量帶深度信息的標注數據進行訓練，如KITTI、NYU Depth等數據集。

2、雙目視覺測距

模型：立體匹配（Stereo Matching）

原理：基于視差計算（Disparity Calculation），通過兩個攝像頭的圖像視差計算目標距離。
計算步驟：
1. 通過SGBM（Semi-Global Block Matching）或深度學習模型（如PASMNet、GA-Net）獲取視差圖。
2. 結合攝像頭參數（基線長度、焦距）使用公式：
  
  其中：
  - d：目標距離
  - f：攝像頭焦距
  - B：攝像頭基線距離
  - disparity：視差

二、深度學習在雙目視覺測距領域的應用

1、視差圖計算階段

這是深度學習應用最廣泛的階段。傳統方法（如SGBM、BM等）在復雜場景下效果不佳。

（1）什么是視差圖？

視差圖（Disparity Map）是表示同一場景在不同視角下圖像中對應點之間水平位移的圖

每個像素值代表該點在左右圖像中的水平位移（視差值）

視差越大，表示物體距離相機越近

視差越小，表示物體距離相機越遠

（2）視差圖的特點

灰度圖像：每個像素值表示視差大小

顏色越亮：表示視差越大（物體越近）

顏色越暗：表示視差越小（物體越遠）

黑色區域：表示無法計算視差（遮擋或無效區域）

（3）深度學習方法（如PSMNet、GCNet等）可以：

更好地處理遮擋區域
提高視差計算的準確性
減少計算時間
更好地處理弱紋理區域

2、特征提取階段

使用卷積神經網絡（CNN）提取更魯棒的特征

相比傳統SIFT、SURF等特征，深度學習特征：

具有更強的表達能力

對光照變化更魯棒

計算速度更快

3、視差圖優化階段

使用深度學習模型進行視差圖的后處理可以：

填充視差空洞

平滑視差圖

提高視差圖的連續性

4、深度估計階段

直接使用端到端的深度估計網絡

例如：

MonoDepth2

DeepStereo

這些方法可以直接從雙目圖像估計深度圖

深度學習應用于測距領域的主要優勢：

精度更高：相比傳統方法，深度學習方法的精度顯著提升
魯棒性更強：對復雜場景、光照變化等具有更好的適應性
速度更快：通過GPU加速，可以實現實時處理
端到端訓練：可以直接優化最終目標

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/899491.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/899491.shtml
英文地址，請注明出處：http://en.pswp.cn/news/899491.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Linux Mem -- Slub內存分配器的幾點疑問及解答

Linux Mem -- Slub內存分配器的幾點疑問及解答

目錄 1 怎樣通過object地址獲取其對應的struct slab？ 2 struct page、struct folio和struct slab類型之間轉換，怎么保證內部關鍵數據的傳遞？ 3 怎樣判斷一個內存空間是屬于slab、page管理？ 4 struct page 結構中 __mapcou…

閱讀更多...

pip install cryptacular卡住，卡在downloading階段

pip install cryptacular卡住，卡在downloading階段

筆者安裝pip install cryptacular卡在downloading階段，但不知道為何 Collecting cryptacularCreated temporary directory: /tmp/pip-unpack-qfbl8f08http://10.170.22.41:8082 "GET http://repo.huaweicloud.com/repository/pypi/packages/42/69/34d478310d6…

閱讀更多...

Lag-Llama時間序列模型簡單實現數據預測

Lag-Llama時間序列模型簡單實現數據預測

前言： 最近在大模型預測，簡單了解了lag-llama開源項目，網上也有很多講解原理的，這里就將如何快速上手使用說一下，只懂得一點點皮毛，有錯誤的地方歡迎大佬指出。簡單介紹： Lag-Llama 是一個開…

閱讀更多...

Plastiform復制膠泥：高精度表面復制與測量的高效工具

Plastiform復制膠泥：高精度表面復制與測量的高效工具

在工業制造和質量檢測領域，表面復制和測量是確保產品質量的關鍵環節。Plastiform復制膠泥作為一種創新材料，憑借其出色的性能和多樣化的應用，為用戶提供了可靠的解決方案。它能夠快速捕捉復雜表面的細節，確保測量結果的準確性&…

閱讀更多...

AI大模型、機器學習以及AI Agent開源社區和博客

AI大模型、機器學習以及AI Agent開源社區和博客

以下梳理了適合學習 AI大模型、機器學習、AI Agent和多模態技術的英文網站、社區、官網和博客，按類別分類整理： 一、官方網站與開源平臺 1. AI大模型 (Large Language Models) ? OpenAI ? 官網: openai.com ? 內容: GPT系列模型文檔、研究論文、AP…

閱讀更多...

python 上下文管理器with

python 上下文管理器with

with 上下文管理器上下文管理器示例如下：若想不使用with關鍵字上下文管理器任何實現了 enter() 和 exit() 方法的對象都可稱之為上下文管理器，上下文管理器對象可以使用 with 關鍵字。必須同時具有__enter__和__exit__，就可以使用with語句…

閱讀更多...

買賣股票的最佳時機（121）

買賣股票的最佳時機（121）

121. 買賣股票的最佳時機 - 力扣（LeetCode） 解法： class Solution { public:int maxProfit(vector<int>& prices) {int cur_min prices[0];int max_profit 0;for (int i 1; i < prices.size(); i) {if (prices[i] > cur…

閱讀更多...

CesiumJS 本地數據瓦片加載南北兩極出現圓點問題

CesiumJS 本地數據瓦片加載南北兩極出現圓點問題

const imageryProvider new UrlTemplateImageryProvider({url: "/gisimg/{z}/{x}/{reverseY}.png",minimumLevel: 0,maximumLevel: 19})上面這段代碼是加載本地切片，但是有個致命問題就是會出現南北兩極顯示藍色圓點解決方案： 加上這句話&am…

閱讀更多...

Linux編譯器gcc/g++使用完全指南：從編譯原理到動靜態鏈接

Linux編譯器gcc/g++使用完全指南：從編譯原理到動靜態鏈接

一、gcc/g基礎認知在Linux開發環境中，gcc和g是我們最常用的編譯器工具： gcc：GNU C Compiler，專門用于編譯C語言程序g：GNU C Compiler，用于編譯C程序（也可編譯C語言） &#x1f4cc…

閱讀更多...

Vue學習筆記集--computed

Vue學習筆記集--computed

computed 在 Vue 3 的 Composition API 中，computed 用于定義響應式計算屬性它的核心特性是自動追蹤依賴、緩存計算結果（依賴未變化時不會重新計算） 基本用法 1. 定義只讀計算屬性 import { ref, computed } from vue;const count ref(…

閱讀更多...

飛致云榮獲“Alibaba Cloud Linux最佳AI鏡像服務商”稱號

飛致云榮獲“Alibaba Cloud Linux最佳AI鏡像服務商”稱號

2025年3月24日，阿里云云市場聯合龍蜥社區發布“2024年度Alibaba Cloud Linux最佳AI鏡像服務商”評選結果。經過主辦方的嚴格考量，飛致云（即杭州飛致云信息科技有限公司）憑借旗下MaxKB開源知識庫問答系統、1Panel開源面板、Halo開…

閱讀更多...

Vue如何利用Postman和Axios制作小米商城購物車----簡版

Vue如何利用Postman和Axios制作小米商城購物車----簡版

實現功能：全選、單選、購物數量顯示、合計價格顯示實現效果如下： 思路： 1.數據要利用寫在Postman里面，通過地址來調用Postman里面的數據。 2.寫完數據后，給寫的數據一個名字，然后加上一個空數組&#xf…

閱讀更多...

第一篇：系統分析師首篇

第一篇：系統分析師首篇

目錄一、目標二、計劃三、完成情況1.宏觀思維導圖2.過程中的團隊管理和其它方面的思考四、意外之喜(最少2點)1.計劃內的明確認知和思想的提升標志2.計劃外的具體事情提升內容和標志一、目標通過參加考試，訓練學習能力，而非單純以拿證為目的。 1.在復…

閱讀更多...

CSS學習筆記4——盒子模型

CSS學習筆記4——盒子模型

目錄盒子模型是什么？ 盒子模型的組成一、div標簽二、邊框屬性 1、border-style:邊框樣式 2、border-width:邊框寬度 3、border-color:邊框顏色、border：綜合設置 4、border-radius:圓角邊框 5、border-image：圖像邊框三、邊距屬性…

閱讀更多...

復現文獻中的三維重建圖像生成，包括訓練、推理和可視化

復現文獻中的三維重建圖像生成，包括訓練、推理和可視化

要復現《One - 2 - 3 - 45 Fast Single Image to 3D Objects with Consistent Multi - View Generation and 3D Diffusion (CVPR)2024》文獻中的三維重建圖像生成，包括訓練、推理和可視化，并且確保代碼能正常運行，下面是基本的實現步驟和示例…

閱讀更多...

stable diffusion 本地部署教程 2025最新版

stable diffusion 本地部署教程 2025最新版

前提： 需要環境 git git下載地址Git - Downloading Package ? 直接裝即可 python3.10.6 下載地址 Python Release Python 3.10.6 | Python.org ? 記得python環境一定要3.10.6！！！ 第一個版本項目地址https://github.…

閱讀更多...

【二刷代碼隨想錄】螺旋矩陣求解方法、推薦習題

【二刷代碼隨想錄】螺旋矩陣求解方法、推薦習題

一、求解方法 （1）按點模擬路徑在原有坐標的基準上，疊加橫縱坐標的變化值，求出下一位置，并按題完成要求。但需注意轉角的時機判斷，特別是最后即將返回上一出發點的位置。 （2）按層…

閱讀更多...

從Manus到OpenManus：AI智能體技術如何重塑未來生活場景？

從Manus到OpenManus：AI智能體技術如何重塑未來生活場景？

從Manus到OpenManus：AI智能體技術如何重塑未來生活場景？ 一、現狀：AI智能體技術面臨的三大核心矛盾 （通過分析用戶高頻痛點與市場反饋提煉） 能力與門檻的失衡 Manus展示的復雜任務處理能力（如股票分析、代…

閱讀更多...

迭代器與可迭代對象

迭代器與可迭代對象

概念層面： 可迭代對象： 一個可迭代對象是指任何可以返回一個迭代器的對象。換句話說，它實現了 __iter__() 方法比如：列表、元組、字典、字符串、集合等直接通過 for 循環使用，因為 for 循環內部會調用其 __iter__(…

閱讀更多...

總結PostgreSQL創建數據庫失敗的解決辦法

總結PostgreSQL創建數據庫失敗的解決辦法

作者：朱金燦來源：clever101的專欄系統環境是Windows 11 專業版，PostgreSQL版本是17。在運行sql語句創建數據庫時出現錯誤： 閿欒: template database \"template1\" has a collation version mismatch DETAIL: Th…

閱讀更多...

最新文章