transformer位置編碼研究相關的綜述、論文

在這里插入圖片描述

《利用位置編碼實現長度外推》 （騰訊云開發者社區, 2024）
- 系統分析絕對/相對位置編碼（APE/RPE）在長序列外推中的技術演進，涵蓋RoPE、Alibi、Xpos等優化方案，討論位置插值、NTK-aware縮放等擴展方法。
《Handling Very Long Contexts in Neural Machine Translation》 （Peng et al., 2024）
- 聚焦機器翻譯中的長上下文處理，對比RoPE、動態NTK、FIRE等編碼策略與注意力機制的協同優化。
《A Review of Location Encoding for GeoAI》 （Mai et al., 2022）
- 從地理AI視角總結位置編碼的通用方法，分類單點編碼與聚合編碼模型，分析多尺度、方向感知等特性。

《Attention is All You Need》 （Vaswani et al., 2017）
- 開創性工作：首次提出正弦函數固定位置編碼（公式：$ PE_{(pos,2i)} = \sin(pos/10000^{2i/d}) $, $ PE_{(pos,2i+1)} = \cos $），解決Transformer無時序感知問題。
《Self-Attention with Relative Position Representations》 （Shaw et al., 2018）
- 引入相對位置編碼，通過偏移量建模詞間距離，在翻譯任務中顯著提升效果（+1.3 BLEU）。
《Transformer-XL》 （Dai et al., 2019）
- 提出片段遞歸機制與改進的位置編碼方案，解決長依賴斷裂問題，支持超長序列建模。

旋轉位置編碼（RoPE）
- Su et al., 2021：通過復數旋轉嵌入實現相對位置感知，提升外推能力（被BERT、LLaMA等廣泛采用）。
- 《ComRoPE》 ：參數化旋轉角度矩陣，平衡計算效率與表達能力（對比見表7）。
《HoPE》 （Chen et al., 2025）
- 提出無衰減位置編碼，解決RoPE長程依賴衰減問題，增強上下文建模。

《Algebraic Positional Encodings》 （Kogkalidis et al.）
- 基于代數結構構建通用位置編碼，支持樹形/圖結構數據，在翻譯與圖像任務中驗證有效性。
《Wavelet Positional Encoding》 （岡佑依等, 2025）
- 小波變換替代正弦函數，增強噪聲魯棒性與多尺度分解能力，長序列外推優于RoPE。

計算機視覺
- ViT（Dosovitskiy et al., 2020）：采用可學習位置編碼，可視化顯示相鄰圖像塊編碼相似性（行列結構）。
- 《Dyadic Mamba》 （Tanke et al., 2025）：擴散模型中位置編碼增強人體動作生成的時序一致性。
地理信息科學
- 《CSP》 （Mai et al., 2023）：自監督對比學習框架下，球面位置編碼提升地理空間表征學習。
神經科學交叉
- 丁鼐團隊（2025）：論證大腦序列加工機制與Transformer位置編碼的相似性，揭示神經振蕩編碼原理。

方法分類與特性

類型	代表方法	優勢	局限
絕對位置編碼 (APE)	正弦函數 (Vaswani)	簡單、無需訓練	外推能力弱
相對位置編碼 (RPE)	RoPE, Alibi	長程依賴建模強	計算復雜度高
條件編碼 (CPE)	深度卷積 (周新民)	適應任意輸入尺寸	任務依賴性強

性能對比
- 行人重識別任務：相對位置編碼（RPE）比絕對編碼（APE）在CUHK03數據集上mAP提升1% 。
- 小目標檢測：條件位置編碼（CPE）優于局部增強編碼（LePE），特征融合更高效 [[29]-[31]]。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/89436.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/89436.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/89436.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！