KITTI數據集

KITTI數據集是由德國卡爾斯魯厄理工學院 Karlsruhe Institute of Technology (KIT) 和美國芝加哥豐田技術研究院 Toyota Technological Institute at Chicago (TTI-C) 于2012年聯合創辦,是目前國際上最為常用的自動駕駛場景下的計算機視覺算法評測數據集之一。該數據集用于評測立體圖像(stereo),光流(optical flow),視覺測距(visual odometry),3D物體檢測(object detection)和3D跟蹤(tracking)等計算機視覺技術在車載環境下的性能。KITTI數據集包含市區、鄉村和高速公路等場景采集的真實圖像數據,每張圖像中最多達15輛車和30個行人,還有各種程度的遮擋與截斷。 KITTI數據集針對3D目標檢測任務提供了14999張圖像以及對應的點云,其中7481組用于訓練,7518組用于測試,針對場景中的汽車、行人、自行車三類物體進行標注,共計80256個標記對象。

一、核心任務 1:視覺 / 激光雷達里程計(Odometry)


里程計任務的核心是評估算法通過傳感器數據(圖像、LiDAR)估計車輛相對位姿(平移 + 旋轉)?的精度,重點關注累計誤差。KITTI 提供了 00-10 共 11 個序列的標注(包含真實軌跡的 6DoF 位姿),評價指標分為平移誤差(Translational Error)?和旋轉誤差(Rotational Error)?,且按不同軌跡長度(段)統計,以反映誤差隨距離的累積特性。

1. 平移誤差(關鍵指標)

衡量估計軌跡與真實軌跡在三維空間中的位置偏差,通常以 “每 100 米軌跡的平均平移誤差” 為核心報告指標,具體計算方式如下:

  • 公式:對軌跡中連續的關鍵幀,計算估計位置?T^i??與真實位置?Ti??的歐氏距離,再按軌跡段長度(如 10m、20m、50m、100m、200m、500m)統計平均誤差。
  • 報告形式
    • 表格中常以?t100m?(每 100 米平均平移誤差,單位:m)作為核心指標,誤差越小表示精度越高;
    • 同時提供不同段長(如 10m→500m)的誤差曲線,反映誤差累積速度(如 SLAM 算法的漂移程度)。
2. 旋轉誤差

衡量估計軌跡與真實軌跡在姿態(角度)上的偏差,同樣按軌跡段長度統計:

  • 公式:計算估計旋轉矩陣?R^i??與真實旋轉矩陣?Ri??的夾角(通過矩陣跡運算:θ=arccos(2tr(R^iT?Ri?)?1?)),再轉換為 “每 100 米軌跡的平均旋轉誤差”(單位:°/100m)。
  • 意義:旋轉誤差直接影響車輛航向估計的準確性,對路徑規劃和避障至關重要。
3. 軌跡可視化

除數值指標外,KITTI 要求將估計軌跡與真實軌跡在三維 / 二維平面(如 x-y 平面)疊加可視化,直觀展示算法的漂移趨勢(如是否隨距離逐漸偏離真實軌跡)。

二、核心任務 2:3D 目標檢測(3D Object Detection)

3D 目標檢測的核心是評估算法從傳感器數據中檢測并定位三維目標(如汽車、行人、 cyclists)?的精度,需同時考慮 “檢測是否準確” 和 “定位是否精準”,KITTI 采用平均精度(Average Precision, AP)?作為核心指標,并按目標類別和難度分級。

1. 目標類別與難度分級

KITTI 將目標分為 3 類,且每類按 “遮擋程度” 和 “截斷程度” 分為 3 個難度等級(Easy/Moderate/Hard):

  • 類別:Car(汽車)、Pedestrian(行人)、Cyclist(騎行者);
  • 難度標準
    • Easy:遮擋率<10%,截斷率<15%;
    • Moderate:遮擋率 10%-40%,截斷率 15%-40%;
    • Hard:遮擋率 40%-60%,截斷率 40%-50%(最接近真實復雜場景)。
2. 核心指標:3D AP 與 BEV AP

KITTI 不直接使用 2D 檢測的 IoU(交并比),而是定義3D IoU?和?BEV IoU(鳥瞰圖 IoU),并基于此計算 AP:

  • 3D IoU:計算預測的 3D bounding box 與真實 3D bounding box 的體積交并比(反映三維空間中的定位精度);
  • BEV IoU:將 3D bounding box 投影到地面平面(x-y 平面),計算投影后 2D 框的面積交并比(反映平面位置精度,對自動駕駛路徑規劃更關鍵);
  • AP 計算
    1. 對每個類別和難度,按 “預測置信度” 從高到低排序檢測結果;
    2. 設定 IoU 閾值(KITTI 標準:Car→0.7,Pedestrian/Cyclist→0.5),統計 “真陽性(TP)” 和 “假陽性(FP)”;
    3. 繪制 “精確率 - 召回率(Precision-Recall, PR)曲線”,計算 PR 曲線下的面積(即 AP)。
  • 報告形式:需分別報告 3 類目標在 3 個難度等級下的?3D AP?和?BEV AP,AP 越高表示檢測與定位精度越好(如 “Car Moderate 3D AP=85%” 表示汽車中等難度場景下的 3D 檢測平均精度為 85%)。
3. 輔助指標:定位誤差

除 AP 外,KITTI 還會統計3D bounding box 的定位誤差,包括:

  • 平移誤差(Δx, Δy, Δz):預測框中心與真實框中心在 x/y/z 軸上的偏差(單位:m);
  • 旋轉誤差(Δθ):預測框航向角與真實框航向角的偏差(單位:°);
  • 尺寸誤差(Δl, Δw, Δh):預測框長 / 寬 / 高與真實框的偏差(單位:m)。

三、核心任務 3:立體匹配(Stereo Matching)

立體匹配的核心是評估算法從雙目圖像中計算視差圖(Disparity Map)?的精度(視差用于推導深度),KITTI 提供了高分辨率雙目圖像的真實視差標注(通過 LiDAR 數據校準),評價指標聚焦 “視差估計誤差”。

1. 核心指標:視差誤差率(Disparity Error Rate)

統計 “估計視差與真實視差的偏差超過閾值” 的像素比例,按像素的 “有效性” 和 “視差范圍” 分級:

  • 有效像素定義:排除遮擋區域、無紋理區域、邊界區域等 “無效像素”,僅統計 “有效像素” 的誤差;
  • 誤差閾值
    • 相對誤差:d∣d^?d∣?>0.05(d 為真實視差,d^為估計視差);
    • 絕對誤差:∣d^?d∣>3(單位:像素);
    • 滿足任一閾值即判定為 “誤差像素”。
  • 報告形式:按視差范圍(如 d<10、10≤d<20、d≥20)統計誤差率,誤差率越低表示視差估計越精準。
2. 輔助指標:平均絕對誤差(MAE)

計算所有有效像素的 “估計視差 - 真實視差” 的絕對值的平均值,反映整體視差估計的偏差程度(單位:像素)。

四、其他任務的評價指標

KITTI 還支持光流估計、語義分割等任務,其指標與領域通用標準一致:

  • 光流估計:采用端點誤差(Endpoint Error, EPE)—— 估計光流向量與真實光流向量的歐氏距離,統計平均 EPE 和 EPE>3 的像素比例;
  • 語義分割:采用交并比(mIoU,均值交并比)—— 計算每個類別的 IoU,再取所有類別的平均值,反映分割結果與真實標簽的重合度。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/923480.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/923480.shtml
英文地址,請注明出處:http://en.pswp.cn/news/923480.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

rk3568移植WebRTC AudioProcessing

前言: 大家好,我是飛一樣的成長,今天這篇文章主要想分享音頻3A的內容。在之前有網友找我怎么移植原生的webrtc到rk3568/rk3588上,當時我自己也沒有移植過,后面折騰了一個禮拜才搞定,當時遇到的最大問題&…

介紹一下 RetNet

RetNet(Retention Network)是微軟亞洲研究院于 2023 年提出的一種新型序列建模架構,旨在解決 Transformer 架構在長序列處理中存在的計算復雜度高、內存占用大、推理速度慢等核心問題。它通過創新的 “循環注意力機制”,實現了 “…

CANopen - PDO映射

CiA402為什么不放到一個PDO中。而是分成幾個PDO? 簡短答案:裝不下 解耦時序。 PDO負載上限:經典CAN的每個PDO只有8字節。TargetPosition(607A:0032bit) ProfileVelocity(60FF:0032bit) ModesOfOperation(6060:008bit) 共9字節,單個PDO放不…

北理工提出僅依賴機載傳感器針對IAP的控制與狀態估計框架

近日,度量用戶、北京理工大學俞玉樹老師團隊在IEEE RAL,IEEE TRO和IEEE TASE期刊上分別發表論文,研究著力于解決多飛行器集聯平臺(Integrated Aerial Platforms, IAPs)的相對位姿和全局定位問題,提出IAP的控…

13年測試老鳥,性能測試-618與雙11大促銷壓測(二)

目錄:導讀 前言一、Python編程入門到精通二、接口自動化項目實戰三、Web自動化項目實戰四、App自動化項目實戰五、一線大廠簡歷六、測試開發DevOps體系七、常用自動化測試工具八、JMeter性能測試九、總結(尾部小驚喜) 前言 1、準備工作 準備…

StreamCap(直播錄制) v1.0.2 綠色版

StreamCap 是一個基于FFmpeg和StreamGet的多平臺直播流錄制客戶端,覆蓋 40 國內外主流直播平臺,支持批量錄制、循環監控、定時監控和自動轉碼等功能。軟件特色 多端支持:支持Windows/MacOS/Web運行。循環監控:實時監控直播間狀態&…

OpenCV:圖像拼接(SIFT 特征匹配 + 透視變換)

目錄 一、核心技術原理與對應 API 解析 1.1 SIFT 特征檢測與描述(尺度不變特征提取) 1.1.1 灰度圖轉換:cv2.cvtColor(image, cv2.COLOR_BGR2GRAY) 1.1.2 SIFT 檢測器初始化:cv2.SIFT_create() 1.1.3 特征點檢測與描述符計算&…

日語學習-日語知識點小記-進階-JLPT-N1階段藍寶書,共120語法(10):91-100語法+考え方13

日語學習-日語知識點小記-進階-JLPT-N1階段藍寶書,共120語法(10):91-100語法1、前言(1)情況說明(2)工程師的信仰(3)高級語法N1語法和難點2、知識點-語法&…

繼承與組合:C++面向對象的核心

C 繼承:從基礎到實戰,徹底搞懂面向對象的 “代碼復用術” 在面向對象編程(OOP)的世界里,“繼承” 是實現代碼復用的核心機制 —— 就像現實中孩子會繼承父母的特征,C 的子類也能 “繼承” 父類的成員&#…

Matplotlib定制:精解顏色、字體、線型與標記

Matplotlib定制:精解顏色、字體、線型與標記導語 Matplotlib 是 Python 數據可視化領域的基石。雖然它的默認樣式足以滿足快速分析的需求,但要創作出具有專業水準、信息清晰、視覺美觀的圖表,就必須掌握其強大的定制功能。本文將深入探討 Mat…

Qt開發經驗 --- Qt監聽文件/文件夾改變(17)

文章目錄[toc]1 概述2 演示效果3 簡單使用示例4 帶界面的使用示例5 源代碼地址更多精彩內容👉內容導航 👈👉Qt開發經驗 👈1 概述 QT實現實時監控文件的創建、修改、刪除操作 跟蹤文件夾內容的增刪改變化 可用于文件發生變化時自…

數據分析:合并一

🔷 DA37:統計運動會項目報名人數(僅輸出有人報名的項目)? 題目描述給定兩個 CSV 文件:items.csv:包含項目信息(item_id, item_name, location)signup.csv:包含員工報名信…

WWW‘25一通讀 |圖Anomaly/OOD檢測相關文章(1)

寫在前面:進入新一輪學習階段,從閱讀開始。 本文分享的是WWW2025收錄的與作者研究相近的graph-based xx相關paper的閱讀筆記,含個人理解,僅供參考😄 0x01 HEI:利用不變性原理實現異配圖結構分布偏移學習 J…

static_cast:C++類型系統的“正經翻譯官”

1. 背景與核心概念 1.1 C的“類型安全”哲學 想象一下,你所在的世界突然失去了所有規則:文字可以隨意變成數字,人可以瞬間變成椅子,汽車能飛上天變成飛機… 這聽起來像是瘋狂的夢境,但對于早期C語言來說,這…

【嵌入式原理系列-第八篇】USART從原理到配置全解析

目錄 一.通信領域基礎知識介紹 1.1 串行和并行通信 1.2 同步和異步傳輸 1.3 串口和COM口 1.4 通信協議標準以及物理層定義 1.5 物理層協議之TTL / RS-232 / RS-485 二.USART介紹 2.1 USART特點介紹 2.2 UART和TTL / RS-232 / RS-485 2.3 USART硬線流控介紹 2.4 USAR…

MariaDB介紹和MariaDB包安裝

文章目錄MariaDB介紹和安裝1.MariaDB介紹1.1 起源與背景1.2 核心特性1.2.1 高度兼容 MySQL1.2.2 優化的存儲引擎1.2.3 企業級功能增強1.2.4 性能優化1.2.5 安全增強1.3 社區與生態1.4 應用場景1.5 總結2.MariaDB安裝2.1 主機初始化2.1.1 設置網卡名2.1.2 設置ip地址2.1.3 配置鏡…

雙指針與滑動窗口算法精講:從原理到高頻面試題實戰

引言:算法選擇的十字路口 在算法面試中,雙指針和滑動窗口如同兩把瑞士軍刀,能高效解決80%以上的數組和字符串問題。本文將深入解析這兩種技術的核心差異,結合力扣高頻題目,提供可直接復用的代碼。 一、算法核心思想解析…

蘋果MAC、MacBook air和pro安裝windows雙系統與iOS分發

文章目錄1. main1.1 準備工作1.2 啟動轉換助理1.3 Windows安裝1.4 蘋果電腦安裝Windows雙系統切換2. 蘋果(iOS)分發/上架2.1 上架App Store2.2 上架TestFlight2.3 webClip免簽上架2.4 超級簽名2.5 企業證書2.6 app分發系統Reference1. main 蘋果電腦安裝windows雙系統 https:…

ArcGIS定向影像(1)——非傳統影像輕量級解決方案

常常聽到這樣的需求,ArcGIS能讓用戶自己低成本的做出谷歌街景嗎?現在 _ArcGIS Pro 3.2 和 ArcGIS Enterprise 11.2 _能夠讓用戶不使用任何插件和擴展的情況下完成街景數據集的構建,數據管理,發布服務和調用的完整解決方案。非常體…

uni-app 網絡之封裝實戰HTTP請求框架

前言在uniapp開發中,網絡請求是每個應用都必不可少的功能模塊。一個優秀的網絡請求封裝不僅能提高開發效率,還能增強代碼的可維護性和可擴展性。本文將基于實際項目經驗,詳細介紹如何封裝一個高效、可維護的Uniapp網絡請求框架,并…