在本節中,我們首先對 DTW 方法中如何應用翹曲約束以及如何在時間序列的簽名表示中實現這些約束進行一些一般性觀察。然后,我們研究了增強時間序列以實現更有效的簽名特征表示的各種方法,最后我們提出了三種不同的選項來使用簽名特征進行時間序列分類。
Notations and Definitions
對于圖 3(a) 中的 DTW 情況,時間序列 X 和 Y 周圍的綠色圓圈分別代表可以通過扭曲獲得的時間序列集合。這些時間序列在 DTW 下被視為等效,并形成等效類。此外,一旦我們找到一個時間序列 Z,它都屬于 X 和 Y 的翹曲等價類,我們就可以立即推斷 X 和 Y 實際上共享相同的等價類。
然而,在實踐中,我們可能不想將 X 與其整個 warping 等價類匹配,因此我們可能會對允許的 warping 數量施加一些限制。如果我們使用“硬”約束,例如最大 warping 窗口大小(數據點可以從其原始時間位置翹曲多遠),那么受約束的 DTW 在不受約束的。
如圖 3(a) 中的紅色省略號所示。我們也可以選擇應用“軟”約束,其中翹曲懲罰隨翹曲距離而變化(例如,如 Amerced DTW [18]),在這種情況下,我們不再定義等價關系,而是強制時間序列之間的接近性,這些時間序列可以以較低的成本相互扭曲(我們將在下一小節中重新討論如何定義此成本)。圖 3(a) 中的紫色“光暈”說明了當我們遠離 X 和 Y 時翹曲“容易”的衰減。
對于圖 3(b) 中的路徑簽名情況,路徑簽名本身直接表示整個 warping 等效類。對于任何可以從 X 扭曲的路徑,它們在簽名空間中與 X 共享完全相同的路徑簽名。因此,如果 X 不能被時間扭曲成 Y,那么它們必須具有不同的路徑簽名。雖然不能保證簽名之間的距離直接反映了 X 和 Y 之間的時間扭曲距離,但正如我們稍后將看到的,我們至少可以憑經驗驗證簽名空間中Sx,Sy之間的距離(或它的轉換)與路徑空間中的 DTW 距離密切相關。
我們現在可以看到,路徑簽名為彈性距離提供了一種替代彈性距離的方法,用于描述翹曲變換下的時間翹曲等效性或接近性。在接下來的章節中,我們將討論如何選擇合適的增強來約束翹曲,以及如何利用特征特征進行時間序列分類。
Constrained Time Warping
在本節中,我們研究了將約束應用于彈性距離測量(尤其是 DTW)的不同方式,如何使用路徑簽名實現類似的效果,以及如何使用路徑簽名更容易實現一些 warping 約束。正如我們在上一小節中看到的,翹曲約束可以是“硬”的,即對翹曲量有上限,也可以是“軟”的,即更多的翹曲會產生更高的成本。例如,經典的 Sakoe 帶 [41] 或 Itakura 平行四邊形 [20] 是硬約束,而軟約束在距離優化問題中可能表示為罰項:
現在,我們將注意力轉向 warping 約束之間的另一種區別——全局 warp 約束與局部 warp 約束。大多數基于翹曲窗口的彈性距離約束都會對時間翹曲產生全局的絕對約束,如圖 4 所示。在這里,我們使用局部 warping 來指代小連續間隔內的形狀變形,并使用全局 warping 作為每個 warping 點行進的時間距離的量度。很明顯,經典 DTW 算法和其他彈性距離測量中的翹曲窗口約束是絕對約束,它限制了允許數據點從其原始位置移動的距離。
圖 4,但排除了像情況 B 這樣的極端翹曲。然而,讓我們也考慮一下情況 C,其中對于時間序列的每一部分,形狀變形量都很小,但它的一個特征在時間上已經移動了很長的距離。從某種意義上說,總時間扭曲仍然“很小”,在某些用例中,我們可能希望對 C 型時間扭曲不同的序列進行分類,例如,兩組相同運動類型的體育鍛煉跟蹤數據,但在動作之間任意停頓。因為情況 C 產生的絕對時間扭曲很大,所以具有全局約束(如約束窗口)的彈性距離無法捕獲我們想要的相似性關系。
如果我們考慮軟約束,那么全局 warp 約束的合理成本函數將是
這只是將每個點在 Warping 下行進的時間距離相加。同樣,局部 warp 約束的成本函數為
這進一步通過曲線的“平坦度”來加權翹曲懲罰,其中曲線的“不有趣”部分(例如平坦區域)比具有有趣形狀特征的部分更容易翹曲。
然而,直接扭曲成本懲罰并不是我們實現軟局部約束的唯一方法。人們可能已經觀察到,通過將時間維度附加到曲線本身可以很容易地恢復全局 warping 約束,因此 warping 成本 自動包含在兩點之間的距離中。因此,時間增強等同于應用全局 warp 約束。我們可以對局部 warping 使用相同的增強技巧嗎?
事實上,局部約束問題的一個直接解決方案是在 “shape descriptor” 特征向量中 “fossiliized” 局部數據點關系,然后對特征序列進行無約束的彈性距離比較。derivative DTW 或 shapeDTW [51] 等方法采用了這種方法。其他可能的局部形狀描述符包括時間延遲嵌入、時間延遲 PCA (TD-PCA) 變換、小波變換等。事實上,可以證明在溫和的假設下,導數 DTW 或 DTW 隨時間延遲嵌入的作用等價于等式 (6) 中的成本函數(見附錄)。圖 5 提供了此概念的圖示。
我們在這里的主要觀察是,如果我們改用路徑簽名來描述時間扭曲相似性,這種增強技巧仍然適用。我們可以首先使用時間增強和/或局部形狀描述符來轉換原始時間序列,這會將時間序列提升為一個增強序列,該序列在小時間扭曲下輕微變形,在大扭曲下嚴重變形。假設簽名轉換是連續的,如果兩個增強序列彼此非常接近,則它們的簽名也應該彼此接近。
基于簽名和基于 DTW 的彈性相似性比較之間的一個主要區別是,路徑簽名方法是一種自上而下的方法,而 DTW 是自下而上的方法。給定一個時間序列 X,它的最低階簽名項首先捕獲 X 的一般、大規模形狀,然后當我們添加更高階的簽名項時,可以解析更精細的局部細節。因此,對于路徑簽名,比局部小尺度模式更容易捕獲大規模模式(例如圖 5 中整個模式的位移)。然而,對于 DTW 來說,情況正好相反——對于小的 warping 窗口,我們只能在一個小的局部社區內匹配模式,而要匹配具有明顯絕對 warp 的大尺度模式,我們需要大大擴展 warping 窗口,甚至求助于不受約束的 DTW 匹配。這種區別意味著存在彈性相似性問題,其中使用路徑簽名本質上比使用 DTW 更容易解決,反之亦然。