動態物體濾除算法

圖像層面:2D圖像分割反投影到3D點云濾除

基于分割

  • 原理:通過2D語義分割(如DeepLab、Mask R-CNN)識別動態物體(車輛、行人),將分割結果反投影至3D點云中濾除。
  • 優化方向
    • 結合時序一致性(如連續幀分割結果融合)減少單幀誤分割。
    • 多模態融合:聯合RGB與深度信息提升分割精度(如RGB-D分割網絡)。
  • 挑戰:靜態物體誤標(如停靠車輛)、分割模型泛化性不足。

基于光流跟蹤

  • 原理:通過相鄰幀光流場(如RAFT、FlowNet)檢測運動物體,反投影動態點云。
  • 優化方向
    • 動態-靜態光流分離:利用運動一致性約束區分背景光流與動態物體光流。
  • 挑戰
    • 物體靜止時失效(光流接近零)。
    • 相機運動與物體運動耦合時誤判(需Ego-motion補償)。

點云層面

1. 幾何分析方法

  • 代表方法
    • RANSAC平面擬合:移除非地面點(適用于地面移動機器人)。
    • 曲率聚類:高曲率區域常為動態物體邊緣(如LeGO-LOAM)。
  • 局限:依賴場景幾何規則性,復雜非結構化場景魯棒性差。

2. 基于單幀-全局對比的方法

”這類方法的基本假設是:如果一個激光點的光路穿過了另一個激光點,那么另一個激光點就是動態點。這個假設邏輯上完全說得通,但實現起來有兩個問題:其一,入射角接近90度時的誤殺問題,如下圖所示,紅色箭頭指向的舊點因為與新點(五角星)光路很接近,會被誤殺掉,考慮到一幀激光點云本身的角度誤差、測距誤差、光斑影響等,這種誤殺會更嚴重。其二,遮擋問題,比如對于一些大型動態物體,它們完全擋住了激光雷達的視線,激光雷達沒有機會看到這些動態物體后方的靜態物體,意味著這些動態點永遠不會被新的激光點穿過,此時就絕無可能把這些動態點濾除掉了”

“誤殺問題”和“靜態點不可見”的問題。其一,誤殺問題包括但不限于點云自干擾、平行點差異導致的假陽性、遮擋點誤判、接觸點假陽性等一系列由于雷達點云的物理特性引發的誤殺問題。其二,靜態點不可見的問題相較于誤殺問題會少見一些,但更加難以解決,例如當存在動態障礙物一直遮擋了部分或者全部的激光雷達的視線,則雷達沒有機會看到這些動態障礙物后方的靜態物體信息以至于動態障礙物點云永遠不會被識別和濾除掉。

基于可見性(Ray-Casting)

  • 問題深化
    • 誤殺問題:入射角接近90°時,點云噪聲導致光線路徑誤差(解決方案:加入角度閾值約束,如剔除入射角>80°的射線)。
    • 靜態點不可見:動態物體長期遮擋導致漏檢(解決方案:引入概率觀測模型,長期未更新的柵格標記為"可能動態")。
  • 優化方法
    • 多幀射線聚合(如SUMA++):統計多幀光線穿透情況,降低單幀噪聲影響。
    • 自適應閾值:根據點云密度動態調整射線判定容差。

基于柵格濾除(Voxel-based)

結合柵格地圖(例如概率占據柵格、八叉樹柵格,etc),識別與區分靜態和動態點的基本原理:激光點云所落在的柵格處hits計數+1或者占據概率上升,激光光束穿過的所有柵格misses計數+1或者空閑概率上升,通過統計同一柵格中hits和misses數量差值或者占據概率,以判斷柵格中包含的點云是否需要濾除。

  • 代表作
    • DUFOMap:使用概率占據柵格,通過貝葉斯更新Hit/Miss概率。
    • OctoMap:八叉樹結構高效管理大規模場景。
  • 優化方向
    • 運動概率傳播:將動態點概率傳遞至相鄰柵格(如DynSLAM)。
    • 多分辨率柵格:近處高精度、遠處低精度,平衡效率與效果。

基于扇形柵格高度比對

代表作 ERASORS

  • 算法流程:首先,通過常規的激光SLAM手段獲得了原始點云地圖后,回放數據以query scan的位姿為中心從地圖中截取對應的submap,再將兩者按照圓柱坐標系的方式劃分成一個個 bin;隨后,為兩者的每一個 bin 計算占據狀態描述子(點云高度差);接下來,找出 submap 中那些描述子之比<0.2 的 bin,作為潛在的動態 bin,也就是 query scan 中bin 的高度差遠小于submap中 bin 的高度差;最后,在每一個潛在動態 bin 中用主成分分析法擬合地平面,將地平面以上的點作為動態點濾除;

  • 流程優化

    1. 高度描述子改進:引入高度分布直方圖替代單一高度差,避免地形起伏誤判。
    2. 動態點判定:聯合高度差與點云密度(如ΔH<0.2Hmap\Delta H < 0.2H_{\text{map}}ΔH<0.2Hmap?且密度比<0.5<0.5<0.5)。
  • 局限:高架橋、斜坡地形易誤殺靜態點。

基于深度圖比對

代表作 Revert

  • 算法流程:單幀點云和原始點云地圖都根據傳感器位姿投影為深度圖,通過比對對應深度圖像素的差異來濾除動態點
  • 優化策略
    • 畸變補償:在深度圖生成前進行點云運動畸變校正(如IMU輔助去畸變)。
    • 邊緣保護:使用雙邊濾波平滑深度圖,保留物體邊緣。

弊端

  • 對SLAM位姿精度敏感,一點偏差都會造成投影誤差,進而造成誤殺和漏殺,這一點尤其容易發生在物體的邊緣處和細長物體(如路燈桿)上。
  • 對點云畸變敏感。同樣的道理,運動畸變造成一個點落在了它本不屬于的位置上,引入誤差
  • 容易誤殺地面點 當入射光線貼近地面時,部分地面點(紅色箭頭所指的點云)因為靠近五角星點的光路,會被認為遮擋了query scan中的點,從而被誤殺!這種現象在大入射角時尤其明顯。

3. 基于點云分割的方法

基于分割的方法中當前比較主流的是基于深度學習的語義分割方法,通過前期的點云特征訓練,在使用過程中直接標注出點云中的動態障礙物信息部分,在定位和建圖算法中根據點云中的標注直接過濾即可,雖然濾除的內容僅限于前期訓練得到的模型且容易有假陽性和假陰性的問題,但其方法勝在簡單高效。另一類傳統的點云分割的方法則基于聚類的模式,如快速點特征直方圖 ( fast point feature histograms, FPFH )、基于確定視角下的特征分布直方圖VFH(viewpoint feature histogram),用以在靜態聚類中區分出動態聚類,此類方法能夠改善計算成本提高實時性從而得到廣泛研究,再者就是基于區域(逆)生長以分割混雜著動態和靜態點云的目標,識別出動態點云目標以便于后期濾除等。

深度學習語義分割

  • 代表網絡
    • RangeNet++(Range圖像分割):實時性強,適合車載平臺。
    • Cylinder3D(圓柱體分割):解決點云稀疏性問題。
  • 動態物體擴展
    • 時序分割:如4D-SPNet融合多幀點云時序特征。
    • 弱監督學習:減少標注依賴(如Self-supervised動態點檢測)。

傳統聚類分割

  • 特征優化
    • FPFH+VFH融合:結合局部與視角不變特征,提升聚類魯棒性。
    • 圖神經網絡分割:構建點云圖結構,利用鄰域關系優化聚類(如Point-GNN)。
  • 動態目標提取
    • 區域生長+運動一致性:從靜態背景中分離運動聚類(如DetectDyn)。

核心挑戰與解決趨勢

挑戰原因解決思路
SLAM位姿敏感一點偏差都會造成投影誤差,進而造成誤殺和漏殺,這一點尤其容易發生在物體的邊緣處和細長物體(如路燈桿)上。緊耦合優化:動態濾除與位姿估計聯合迭代(如LIO-SAM的動態點濾波模塊)
運動畸變影響同樣的道理,運動畸變造成一個點落在了它本不屬于的位置上,引入誤差在線畸變校正:IMU/輪速計輔助運動補償
地面點誤殺當入射光線貼近地面時,部分地面點因為靠近光路,會被認為遮擋了query scan中的點,從而被誤殺!這種現象在大入射角時尤其明顯。地面優先分割:先提取地面再處理非地面點(如Patchwork++地面分割)
靜態點不可見長期地圖管理:設置柵格"遺忘機制",超時未觀測區域重置為未知
復雜動態場景多方法融合:語義分割+幾何分析+時序跟蹤(如Panoptic-SLAM)

未來研究方向

  1. 端到端動態濾除:訓練網絡直接從點云/圖像輸出動態概率(如MotionNet)。
  2. 事件相機輔助:利用事件相機高動態特性檢測運動物體。
  3. 仿真-現實遷移:在CARLA等仿真平臺生成標注數據,解決真實場景標注匱乏問題。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/90510.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/90510.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/90510.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Redisson是如何實現分布式鎖的?

Redisson 如何實現分布式鎖&#xff1f;&#xff08;核心原理與思考&#xff09; Redisson 是一個功能強大的 Redis 客戶端&#xff0c;它提供了許多分布式對象和服務&#xff0c;其中就包括分布式鎖。Redisson 的分布式鎖是基于 Redis 的 Lua 腳本實現的&#xff0c;這保證了操…

Java 導出word 實現餅狀圖導出--可編輯數據

&#x1f4ca; 支持圖表導出功能&#xff01; 支持將 柱狀圖、折線圖 圖表以 Word 文檔格式導出&#xff0c;并保留圖例、坐標軸、顏色、數據標簽等完整信息。 如需使用該功能&#xff0c;請私聊我&#xff0c;備注 “導出柱狀圖 / 折線圖”。 生成的效果圖如下&#xff1a;示例…

AI大模型平臺

在科技浪潮迅猛推進的當下&#xff0c;AI大模型平臺宛如一顆璀璨的新星&#xff0c;強勢闖入大眾視野&#xff0c;以其獨特的魅力和強大的功能&#xff0c;深刻地變革著我們生活與工作的每一處角落。從日常智能助手的貼心陪伴&#xff0c;到專業內容創作的靈感激發&#xff1b;…

C# Console App生成的 dll文件

在使用 dotnet 8.0 創建一個 C# console app后&#xff0c;執行完編譯操作&#xff0c;會發現除了生成可執行文件外&#xff0c;還生成一個 dll文件。 $ls ConsoleApp1 ConsoleApp1.dll ConsoleApp1.runtimeconfig.json ConsoleApp1.deps.json ConsoleApp1.pdb $ …

【AI】環境——深度學習cuda+pytorch配置

文章目錄關鍵組件及關系顯卡驅動GPU DriverCUDACUDA ToolkitcuDNNPytorch各組件版本選擇驅動程序CUDA查看驅動及CUDA的最大支持版本CUDA Toolkit選自定義安裝檢驗無法識別nvcccuDNNcondapip換源conda管理py包conda 換源查看列表、創建、克隆、激活、刪除conda包管理包安裝原則設…

觀眾信息設置與統計(視頻高級分析與統計功能)

Web播放器&#xff08;POLYV-html5-player&#xff09;支持設置觀眾信息參數&#xff0c;設置后在播放器上報的觀看日志中會附帶觀眾信息&#xff0c;這樣用戶就可以通過管理后臺的統計頁面或服務端API來查看特定觀眾的視頻觀看情況了。 一、觀眾信息設置 播放器設置觀眾信息參…

《數據庫》 MySQL庫表操作

1. SQL語句基礎 1.2 SQL簡介 SQL&#xff1a;結構化查詢語言(Structured Query Language)&#xff0c;在關系型數據庫上執行數據操作、數據檢索以及數據維護的標準語言。使用SQL語句&#xff0c;程序員和數據庫管理員可以完成如下的任務 改變數據庫的結構 更改系統的安全設置…

DSP的基礎平臺搭建

1、CCS6.0的安裝安裝步驟這里就不說了&#xff0c;只談論最可能遇到的問題&#xff1a;可以看到為需要關閉防火墻和掃描&#xff1b;在這里將其都關閉&#xff0c;然后可以斷掉網絡&#xff0c;關閉聯想管家&#xff0c;可能還是會出現防火墻提示&#xff0c;但是可以安裝&…

下一代防火墻-終端安全防護

實驗設備1、 山石網科&#xff08;hillstone&#xff09;系列下一代防火墻&#xff08;實訓平臺v1.0中hillstone設備&#xff09;2、 三層交換機一臺&#xff08;實訓平臺v1.0中cisco vios l2設備&#xff09;3、 二層交換機一臺&#xff08;實訓平臺v1.0中cisco iol switch設備…

Scala實現網頁數據采集示例

Scala 可以輕松實現簡單的數據采集任務&#xff0c;結合 Akka HTTP&#xff08;高效HTTP客戶端&#xff09;和 Jsoup&#xff08;HTML解析庫&#xff09;是常見方案。Scala因為受眾比較少&#xff0c;而且隨著這兩年python的熱門語言&#xff0c;更讓Scala不為人知&#xff0c;…

【IO復用】五種IO模型

文章目錄五種IO模型Linux設計哲學BIONIOAIOSIOIO多路復用五種IO模型 Linux設計哲學 在linux系統中&#xff0c;實際上所有的I/O設備都被抽象為了文件這個概念&#xff0c;一切皆文件&#xff0c;磁盤、網絡數據、終端&#xff0c;甚至進程間通信工具管道pipe等都被當做文件對…

FeatherScan v4.0 – 適用于Linux的全自動內網信息收集工具

前言 在平時滲透打靶的時候&#xff0c;經常要自己手工輸入命令&#xff0c;做各種基本的信息收集&#xff0c;非常的繁瑣&#xff0c;所以自研了一款工具&#xff0c;這款工具沒有接入AI&#xff0c;因為不合適&#xff0c;接入了AI的話在一些不能上網的環境下進行信息收集&a…

如何精準篩選優質SEO服務資源?

核心要點&#xff1a; 中小企業選擇SEO服務常陷困惑——效果難量化、承諾不透明、策略模糊化。本文剖析核心痛點&#xff0c;拆解技術合規性、策略透明度、行業經驗匹配度等關鍵篩選維度&#xff0c;提供一套清晰的評估路徑&#xff0c;助您在復雜市場中找到真正專業的合作伙伴…

在教育領域中,如何通過用戶ID跑馬燈來對視頻進行加密?

文章目錄前言一、什么是用戶跑馬燈二、用代碼如何實現用戶ID跑馬燈的功能三、如何通過用戶ID跑馬燈來對視頻進行加密&#xff1f;總結前言 在教育領域&#xff0c;優質視頻課程易遭非法傳播。為強化版權保護與責任追溯&#xff0c;引入基于用戶ID的跑馬燈水印技術成為有效手段…

MCP協議:AI時代的“萬能插座”如何重構IT生態與未來

MCP協議&#xff1a;AI時代的“萬能插座”如何重構IT生態與未來 在人工智能技術爆炸式發展的浪潮中&#xff0c;一個名為Model Context Protocol&#xff08;MCP&#xff09; 的技術協議正以驚人的速度重塑IT行業的底層邏輯。2024年11月由Anthropic首次發布&#xff0c;MCP在短…

同步,異步復位問題

1.同步復位的基本原理是&#xff0c;復位信號僅在時鐘的有效邊沿影響或重置觸發器的狀態。復位的主要目標之一是使 ASIC 在仿真時進入已知狀態。由于復位樹的扇出較大&#xff0c;復位信號相對于時鐘周期可能成為 “晚到信號”。即使復位信號會通過復位緩沖樹進行緩沖&#xff…

數組和指針回顧,練習與解析

代碼見&#xff1a;登錄 - Gitee.com 1.數組和指針練習與解析 1.1數組名 1.sizeof(數組名)&#xff0c;這里的數組名表示整個數組&#xff0c;計算的是整個數組的大小。 2.&數組名&#xff0c;這里的數組名表示整個數組&#xff0c;取出的是整個數組的地址。 3.除此之…

【牛客刷題】活動安排

文章目錄一、題目介紹二、解題思路2.1 核心問題2.2 貪心策略2.3 正確性證明三、算法分析3.1 為什么按結束時間排序&#xff1f;3.2 復雜度分析3.3 算法流程圖解3.3.1 流程圖說明3.3.2 關鍵步驟說明四、模擬演練五、完整代碼一、題目介紹 活動安排 題目描述 給定 nnn 個活動&am…

第1講:C語言常見概念

目錄 一、什么是C語言&#xff1f; 二、C語言的歷史與成就 三、編譯器選擇&#xff08;VS2022&#xff09; 1、編譯與鏈接 2、編譯器對比 3、VS2022的優缺點 四、VS項目與源文件、頭文件介紹 五、第一個C語言程序 六、main函數 七、printf和庫函數 八、關鍵字介紹 …

WinUI3入門18:從APP打開商店鏈接以及實現內購

初級代碼游戲的專欄介紹與文章目錄-CSDN博客 我的github&#xff1a;codetoys&#xff0c;所有代碼都將會位于ctfc庫中。已經放入庫中我會指出在庫中的位置。 這些代碼大部分以Linux為目標但部分代碼是純C的&#xff0c;可以在任何平臺上使用。 源碼指引&#xff1a;github源…