在計算機視覺的多目標跟蹤(MOT)任務中,卡爾曼濾波(KF)和高斯混合概率假設密度(GM-PHD)濾波器是兩種經典的狀態估計方法,但它們的原理和應用場景存在顯著差異。以下是兩者的核心機制和對比:
1. 卡爾曼濾波(KF)
核心思想
? 狀態估計:基于線性動態模型和高斯噪聲假設,通過“預測-更新”循環迭代估計目標的狀態(如位置、速度)。
? 恒定速度模型(CV模型):假設目標在短時間內運動速度恒定,適用于簡單運動場景。
工作流程(以目標跟蹤為例)
-
預測(Predict):
? 根據上一時刻的狀態 x k ? 1 \mathbf{x}_{k-1} xk?1?和狀態轉移矩陣 F \mathbf{F} F,預測當前狀態 x k ? \mathbf{x}_k^- xk??和協方差 P k ? \mathbf{P}_k^- Pk??。
? 例如:
x k ? = F x k ? 1 , F = [ 1 0 Δ t 0 0 1 0 Δ t 0 0 1 0 0 0 0 1 ] \mathbf{x}_k^- = \mathbf{F} \mathbf{x}_{k-1}, \quad \mathbf{F} = \begin{bmatrix} 1 & 0 & \Delta t & 0 \\ 0 & 1 & 0 & \Delta t \\ 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 \end{bmatrix} xk??=Fxk?1?,F= ?1000?0100?Δt010?0Δt01? ?
(狀態向量通常為 x = [ x , y , v x , v y ] ? \mathbf{x} = [x, y, v_x, v_y]^\top x=[x,y,vx?,vy?]?, Δ t \Delta t Δt為時間間隔) -
更新(Update):
? 將預測狀態與當前幀的檢測結果(觀測 z k \mathbf{z}_k zk?)融合,通過卡爾曼增益 K \mathbf{K} K修正狀態和協方差。
? 更新公式:
x k = x k ? + K ( z k ? H x k ? ) \mathbf{x}_k = \mathbf{x}_k^- + \mathbf{K}(\mathbf{z}_k - \mathbf{H} \mathbf{x}_k^-) xk?=xk??+K(zk??Hxk??)
( H \mathbf{H} H為觀測矩陣,將狀態映射到觀測空間) -
數據關聯:
? 通常與匈牙利算法或IoU匹配結合,將檢測框與預測狀態關聯。
優點
? 計算高效,適合實時系統。
? 對線性高斯運動模型表現穩定。
局限性
? 依賴線性模型,難以處理復雜運動(如急轉彎)。
? 需手動設計狀態向量和噪聲參數。
2. 高斯混合概率假設密度(GM-PHD)濾波器
核心思想
? 多目標貝葉斯濾波:直接估計所有目標的聯合概率密度(PHD),避免顯式數據關聯。
? 隨機有限集(RFS):將目標和觀測建模為隨機集合,處理目標出現、消失和雜波。
工作流程
-
預測步驟:
? 根據上一時刻的PHD(高斯混合形式)和運動模型,預測當前PHD。
? 例如:
D k ∣ k ? 1 ( x ) = ∑ i w k ? 1 ( i ) N ( x ; F μ k ? 1 ( i ) , Q + F P k ? 1 ( i ) F ? ) D_{k|k-1}(\mathbf{x}) = \sum_{i} w_{k-1}^{(i)} \mathcal{N}(\mathbf{x}; \mathbf{F} \mathbf{\mu}_{k-1}^{(i)}, \mathbf{Q} + \mathbf{F} \mathbf{P}_{k-1}^{(i)} \mathbf{F}^\top) Dk∣k?1?(x)=i∑?wk?1(i)?N(x;Fμk?1(i)?,Q+FPk?1(i)?F?)
( w k ? 1 ( i ) w_{k-1}^{(i)} wk?1(i)?為權重, Q \mathbf{Q} Q為過程噪聲) -
更新步驟:
? 將當前幀的觀測 z k \mathbf{z}_k zk?與預測PHD融合,計算后驗PHD。
? 更新公式(考慮漏檢和雜波):
D k ( x ) = ( 1 ? p D ) D k ∣ k ? 1 ( x ) + ∑ z ∈ Z k p D D k ∣ k ? 1 ( x ) g ( z ∣ x ) λ c ( z ) + ∫ p D g ( z ∣ ξ ) D k ∣ k ? 1 ( ξ ) d ξ D_k(\mathbf{x}) = (1 - p_D) D_{k|k-1}(\mathbf{x}) + \sum_{\mathbf{z} \in \mathbf{Z}_k} \frac{p_D D_{k|k-1}(\mathbf{x}) g(\mathbf{z}|\mathbf{x})}{\lambda_c(\mathbf{z}) + \int p_D g(\mathbf{z}|\mathbf{\xi}) D_{k|k-1}(\mathbf{\xi}) d\mathbf{\xi}} Dk?(x)=(1?pD?)Dk∣k?1?(x)+z∈Zk?∑?λc?(z)+∫pD?g(z∣ξ)Dk∣k?1?(ξ)dξpD?Dk∣k?1?(x)g(z∣x)?
( p D p_D pD?為檢測概率, λ c \lambda_c λc?為雜波強度) -
目標提取:
? 從后驗PHD中提取高斯分量,保留權重大于閾值的分量作為目標狀態估計。
優點
? 自動處理目標數量的變化(新生、消失)。
? 無需顯式數據關聯,適合高雜波場景。
局限性
? 計算復雜度高于KF(尤其高斯分量多時)。
? 需調參(如雜波強度、檢測概率)。
3. 對比總結
特性 | 卡爾曼濾波(KF) | GM-PHD濾波器 |
---|---|---|
適用場景 | 線性運動、目標數量固定 | 目標數量動態變化、高雜波環境 |
數據關聯 | 需顯式匹配(如匈牙利算法) | 隱式處理(通過PHD融合) |
計算效率 | 高效(適合實時) | 較高(高斯分量多時慢) |
參數依賴 | 運動模型、噪聲協方差 | 雜波模型、檢測概率 |
典型應用 | SORT、DeepSORT | MOT中的雜波場景(如雷達跟蹤) |
4. 現代改進與聯合方法
? KF的擴展:
? EKF/UKF:處理非線性運動(如轉彎模型)。
? 自適應KF:動態調整噪聲參數。
? GM-PHD的改進:
? LMB/PHD:結合標簽管理,避免ID切換。
? 聯合檢測跟蹤(如FairMOT、CenterTrack):
? 將檢測、運動估計、關聯模型端到端訓練,平衡精度與效率。