為什么 sim(3) 中的尺度 s 與旋轉 R 相乘，而不是平移 t？

在視覺 SLAM 和三維重建中，相似變換 sim(3) 是一個關鍵數學模型，它可以表示三維空間中物體的旋轉、平移與尺度變化。但許多初學者和研究者在面對 sim(3) 變換時都會提出一個非常有代表性的問題：

?既然 sim(3) 中的尺度 s 是用來恢復真實物理尺度的，那為什么 s 只作用在旋轉 R 上，而不是也作用在平移 t 上？

這篇文章將從變換結構、幾何邏輯和 SLAM 系統中尺度不確定性的本質三個角度，深入分析這個問題。

在歐式變換 SE(3) 中，我們熟悉的剛性變換形式是：

$\begin{bmatrix} R & t \\ 0 & 1 \end{bmatrix}, \quad x' = R x + t$

這個變換會保持物體的形狀與尺度，不會改變兩點之間的距離。

而在相似變換 sim(3) 中，我們引入了尺度因子 s，變換形式為：

$\begin{bmatrix} sR & t \\ 0 & 1 \end{bmatrix}, \quad x' = sR x + t$

這里的 s 和 R 是共同作用于點 x 的，而 t 是直接疊加的平移項。

核心結論：

sim(3) 改變了物體的尺度（邊長變了），但保持了形狀（角度、比例不變）。

很多人會自然地想象成：

$x^{'} = s R x + s t$

但這實際上破壞了 sim(3) 的群結構，并且在數學和幾何邏輯上都不合理：

若將變換寫成：

$\begin{bmatrix} sR & st \\ 0 & 1 \end{bmatrix}$

我們可以提取一個因子 s：

$\cdot \begin{bmatrix} R & t \\ 0 & \frac{1}{s} \end{bmatrix}$

這不再是一個仿射變換，也不符合 Lie 群 sim(3) 的封閉性和組合規律。

如果你也對 t 進行縮放，反而失去了 t 的原始幾何意義。

在實際系統中（尤其是單目 SLAM），恢復出來的 t 本身只是“方向”或“相對距離”：

$t^=1st\hat{t} = \frac{1}{s} t$

也就是說：我們無法從圖像中知道 t 的真實長度，只能恢復方向，尺度信息則全都被 s 吸收了。

所以：

sim(3) 中的 t 只是一個相對位移量，而不是可用于恢復物理尺度的“基線”向量。

下面這張圖展示了 Se(3) 與 sim(3) 的核心區別：

圖中也強調：s 與 R 一起作用于物體本體，而 t 控制變換后的“相對擺放位置”

不同類型的 SLAM 系統，對尺度 s 的恢復能力不同：

在 sim(3) 中，尺度 s 是用來縮放物體自身的幾何結構，而 t 是物體變換后的位置偏移，兩者語義不同、作用不同，因此 s 只能乘在 R 上，不能乘在 t 上。

參考

怎么解釋相似變換sim(3)中的尺度？

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/pingmian/92957.shtml
繁體地址，請注明出處：http://hk.pswp.cn/pingmian/92957.shtml
英文地址，請注明出處：http://en.pswp.cn/pingmian/92957.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！