PR-2025《Scaled Robust Linear Embedding with Adaptive Neighbors Preserving》

核心思想分析

這篇論文的核心思想在于解決線性嵌入(linear embedding)與非線性流形結構之間的不匹配問題。傳統方法通過保留樣本點間的親和關系來提取數據的本質結構,但這種方法在某些情況下無法有效捕捉到數據的全局或局部特性。此外,線性嵌入假設數據具有全局線性結構,這種假設容易受到不同局部區域耦合以及空間尺度差異的影響,導致嵌入結果失真。

為了解決這些問題,作者提出了一種基于自適應鄰域保持的彈性線性嵌入方法(Scaled Robust Linear Embedding with Adaptive Neighbors Preserving, SLE)。SLE 引入了基于局部統計特性的自適應權重機制,以實現對流形數據的靈活嵌入。這些自適應權重可以被視為局部流形結構的彈性變形系數,能夠動態調整局部鄰域的大小,從而減少由于線性嵌入與非線性嵌入之間的差距帶來的影響。


目標函數

SLE 的目標函數旨在最小化以下表達式:

min ? p , S , W ∑ i = 1 n p i ( ∑ j = 1 n ∥ W T x i ? W T x j ∥ 2 ) + β ∑ i , j = 1 n ∥ W T x i ? W T x j ∥ 2 s i j \min_{p,S,W} \sum_{i=1}^n p_i \left( \sum_{j=1}^n \|W^T x_i - W^T x_j\|^2 \right) + \beta \sum_{i,j=1}^n \|W^T x_i - W^T x_j\|^2 s_{ij} p,S,Wmin?i=1n?pi?(j=1n?WTxi??WTxj?2)+βi,j=1n?WTxi??WTxj?2sij?

其中:

  • p p p 是基于局部統計特征的自適應權重向量。
  • S S S 是相似度矩陣, s i j s_{ij} sij? 表示樣本 x i x_i xi? x j x_j xj? 之間的相似度。
  • W W W 是投影矩陣,用于將高維數據映射到低維子空間。
  • β \beta β 是正則化參數,控制相似度矩陣的稀疏性。

約束條件包括:

  • s i T 1 = 1 s_i^T 1 = 1 siT?1=1, s i j ≥ 0 s_{ij} \geq 0 sij?0
  • p ≥ 0 p \geq 0 p0, p T 1 n = 1 p^T 1_n = 1 pT1n?=1
  • W T S t W = I W^T S_t W = I WTSt?W=I, 其中 S t = X H X T S_t = X H X^T St?=XHXT 是散點矩陣。
  • R a n k ( L a ) = n ? c Rank(L_a) = n - c Rank(La?)=n?c, 其中 L a = D ? ( S + S T ) / 2 L_a = D - (S + S^T)/2 La?=D?(S+ST)/2 是拉普拉斯矩陣。

目標函數的優化過程

目標函數的優化通過交替更新四個變量 W W W, F F F, p p p, 和 S S S 來實現:

  1. 更新 W W W
    固定 S S S, F F F, 和 p p p,求解如下問題:
    min ? W T S t W = I ∑ i = 1 n p i ( ∑ j = 1 n ∥ W T x i ? W T x j ∥ 2 ) + β ∑ i , j = 1 n ∥ W T x i ? W T x j ∥ 2 s i j \min_{W^T S_t W = I} \sum_{i=1}^n p_i \left( \sum_{j=1}^n \|W^T x_i - W^T x_j\|^2 \right) + \beta \sum_{i,j=1}^n \|W^T x_i - W^T x_j\|^2 s_{ij} WTSt?W=Imin?i=1n?pi?(j=1n?WTxi??WTxj?2)+βi,j=1n?WTxi??WTxj?2sij?
    使用拉格朗日乘數法將其轉化為無約束優化問題,并通過特征值分解求解最優解。

  2. 更新 F F F
    固定 W W W, S S S, 和 p p p,求解如下問題:
    min ? F T F = I 2 λ T r ( F L a F T ) \min_{F^T F = I} 2\lambda Tr(F L_a F^T) FTF=Imin?2λTr(FLa?FT)
    最優解由拉普拉斯矩陣 L a L_a La? 的前 c c c 個最小特征值對應的特征向量組成。

  3. 更新 S S S
    固定 W W W, F F F, 和 p p p,求解如下問題:
    min ? s i T 1 = 1 , s i j ≥ 0 ∑ j = 1 n d i x j s i j + λ d i f j s i j + ? i s i j 2 \min_{s_i^T 1 = 1, s_{ij} \geq 0} \sum_{j=1}^n d_{ixj} s_{ij} + \lambda dif_j s_{ij} + \phi_i s_{ij}^2 siT?1=1,sij?0min?j=1n?dixj?sij?+λdifj?sij?+?i?sij2?
    每個節點 i i i 獨立求解,使用拉格朗日乘數法得到最優解。

  4. 更新 p p p
    固定 S S S, F F F, 和 W W W,求解如下問題:
    min ? p 1 2 ∥ p + d s 2 α ∥ 2 ? η ( p T 1 n ? 1 ) ? ω T p \min_p \frac{1}{2} \|p + \frac{d_s}{2\alpha}\|^2 - \eta(p^T 1_n - 1) - \omega^T p pmin?21?p+2αds??2?η(pT1n??1)?ωTp
    通過拉格朗日乘數法求解最優解。


主要貢獻點

  1. 自適應權重機制:引入基于局部統計特征的自適應權重,動態調整局部鄰域的大小,從而減少高方差區域對線性嵌入的影響。
  2. 集成優化框架:將彈性變形系數學習、相似度學習和子空間學習集成到一個統一的優化框架中,保證三者的聯合最優。
  3. 高效優化算法:提出了一種高效的替代優化算法,并進行了理論上的計算復雜度和收斂性分析。
  4. 實驗驗證:在人工和真實數據集上進行了廣泛的實驗,驗證了 SLE 在揭示和保持數據本質結構方面的強大能力。

實驗結果

實驗結果表明,SLE 在多個合成和真實數據集上均表現出色。具體而言:

  1. 聚類性能:SLE 在 ACC 和 NMI 指標上優于多種先進的聚類算法,如 K-means、R-Cut、N-Cut、NMF、SSR、PCAN、DUDR、KaUDDR 等。
  2. 投影可視化:在 Jaffe 面部數據集上的 2D 投影可視化顯示,SLE 能夠清晰地分離不同的類別,而其他方法的結果存在重疊或離散的問題。
  3. 敏感性分析:SLE 對參數 β \beta β, L L L, 和 k k k 的變化具有較好的魯棒性,能夠在較寬的參數范圍內保持穩定的性能。
  4. 收斂性分析:算法在 20 次迭代內即可收斂,符合理論分析的結果。

算法實現過程

  1. 初始化:初始化自適應權重 p p p、相似度矩陣 S S S 和投影矩陣 W W W
  2. 迭代優化
    • 更新 W W W:通過特征值分解求解最優投影矩陣。
    • 更新 S S S:使用拉格朗日乘數法求解每個節點的最優相似度。
    • 更新 p p p:通過拉格朗日乘數法求解最優自適應權重。
    • 更新 F F F:求解拉普拉斯矩陣的特征向量。
  3. 構建拉普拉斯矩陣:根據當前的相似度矩陣構建拉普拉斯矩陣。
  4. 調整參數 λ \lambda λ:根據零特征值的數量動態調整 λ \lambda λ 的值。
  5. 終止條件:當算法收斂時停止迭代。

通過上述步驟,SLE 能夠有效地在低維空間中保留數據的本質結構,同時處理噪聲和異常值的影響。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/87060.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/87060.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/87060.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Redis-漸進式遍歷

之前使用的keys查找key,一次獲取到了所有的key,當key較多時,這個操作就有可能造成Redis服務器阻塞.特別是keys *操作. 于是可以通過漸進式遍歷,每次獲取部分key,通過多次遍歷,既查詢到了所有的key,又不會卡死服務器. 漸進式遍歷不是通過一個命令獲取到所有元素的,而是由一組命…

ISP Pipeline(3):Lens Shading Correction 鏡頭陰影校正

上一篇文章講的是:ISP Pipeline(2): Black Level Compensation:ISP Pipeline(2):Black Level Compensation 黑電平補償-CSDN博客 視頻:(4) Lens Shading Correction | Image Signal…

什么是WebAssembly(WASM)

WebAssembly(WASM) 是一種高性能的低級編程語言字節碼格式,可在網頁和非網頁環境中運行,支持多語言編譯,運行速度接近原生代碼。它在區塊鏈中的作用是:作為智能合約的執行引擎,被多條非以太坊鏈…

【C++】inline的作用

一、inline的作用 1.1函數內聯 作用?:建議編譯器將函數調用替換為函數體代碼,減少函數調用的開銷(壓棧/跳轉)。?注意?:這只是對編譯器的建議,編譯器可能忽略(如函數體過大或遞歸&#xff0…

代碼隨想錄|圖論|04廣度優先搜索理論基礎

廣搜的使用場景 廣搜的搜索方式就適合于解決兩個點之間的最短路徑問題。 因為廣搜是從起點出發,以起始點為中心一圈一圈進行搜索,一旦遇到終點,記錄之前走過的節點就是一條最短路。 當然,也有一些問題是廣搜 和 深搜都可以解決…

Xposed框架深度解析:Android系統級Hook實戰指南

引言:Android系統定制化的革命性突破 在移動安全研究和系統優化領域,傳統的APP修改方案面臨??三重技術瓶頸??: ??逆向工程壁壘??:APK重打包方案需處理簽名校驗、代碼混淆等防護,平均耗時增加200%??兼容性挑戰??:Android碎片化導致設備適配率不足65%??功能…

大模型在通訊網絡中的系統性應用架構

一、網絡架構智能化重構?? ??1.1 空天地一體化組網優化?? 智能拓撲動態調整??:大模型通過分析衛星軌道數據、地面基站負載及用戶分布,實時優化天地一體化網絡拓撲。例如,在用戶密集區域(如城市中心)自動增強低…

軟件測試進階:Python 高級特性與數據庫優化(第二階段 Day6)

在掌握 SQL 復雜查詢和 Python 數據庫基礎操作后,第六天將深入探索Python 高級編程特性與數據庫性能優化。通過掌握 Python 的模塊與包管理、裝飾器等高級語法,結合數據庫索引優化、慢查詢分析等技術,提升測試工具開發與數據處理效率。 一、…

【NLP】自然語言項目設計04

目錄 04模型驗證 代碼架構核心設計說明 05運行推理 代碼架構核心設計說明 項目展望 項目簡介 訓練一個模型,實現歌詞仿寫生成 任務類型:文本生成; 數據集是一份歌詞語料,訓練一個模型仿寫歌詞。 要求 1.清洗數據。歌詞語料…

數據結構1 ——數據結構的基本概念+一點點算法

數據結構算法程序設計 什么是數據結構 數據(data):符號集合,處理對象。 數據元素(data element),由數據項(data item) 組成。 關鍵字(key)識別…

每日八股文7.1

每日八股-7.1 網絡1.能說說 TCP 報文頭部都包含哪些關鍵字段嗎?2.TCP 是如何確保數據傳輸的可靠性的?你能詳細談談嗎?3.你能解釋一下 TCP 滑動窗口是如何設計的?它主要解決了什么問題?4.TCP 協議的擁塞控制是如何實現的…

高性能 List 轉 Map 解決方案(10,000 元素)

文章目錄 前言一、問題背景:為什么List轉Map如此重要?二、基礎方法對比:Stream vs For循環三、性能優化關鍵點四、面試回答技巧 前言 遇到一個有意思的面試題,如標題所說,當10,000條數據的List需要轉Map,如…

今日行情明日機會——20250701

上證指數縮量收陽線,形成日線上漲中繼,個股上漲和下跌總體持平。 深證指數量能持續放大,即將回補缺口位,短線注意周三或周四的調整。 2025年7月1日漲停股主要行業方向分析 1. 芯片(17家漲停,國產替代&…

P1312 [NOIP 2011 提高組] Mayan 游戲

題目描述 Mayan puzzle 是最近流行起來的一個游戲。游戲界面是一個 7 7 7 行 5 \times5 5 列的棋盤,上面堆放著一些方塊,方塊不能懸空堆放,即方塊必須放在最下面一行,或者放在其他方塊之上。游戲通關是指在規定的步數內消除所有…

Spring Boot 2 多模塊項目中配置文件的加載順序

Spring Boot 2 多模塊項目中配置文件的加載順序 在 Spring Boot 2 多模塊項目中,配置文件的加載遵循特定的順序規則。了解這些規則對于正確管理多模塊應用的配置至關重要。 一、默認配置文件加載順序 Spring Boot 會按照以下順序加載 application.properties 或 …

邊界的藝術:支持向量機與統計學習時代的王者

當揚勒丘恩的卷積神經網絡LeNet在90年代初于手寫數字識別領域綻放光芒,卻因計算與數據的桎梏未能點燃更廣泛的燎原之火時,人工智能,特別是其子領域機器學習,正步入一個理論深化與方法論多元化的關鍵時期。經歷了符號主義通用智能探…

js filter()

listType(queryParams.value).then(response > {filterTable.value response.rows.slice(1); // 只顯示前3條數據;filterTable.value filterTable.value.filter(item > {return wnSensorsList.value.some(sensorsgroup > {return sensorsgroup.sensorType item.cod…

Python 庫 包 nltk (Natural Language Toolkit)

文章目錄 🧰 一、nltk 的主要功能? 文本處理功能? 內置語料庫(Corpora) 📦 二、安裝與使用1. 安裝 nltk2. 下載語料庫(第一次使用時需要下載) 🔍 三、常用功能示例示例 1:分詞示例…

設計模式之房產中介——代理模式

手撕設計模式之房產中介——代理模式 1.業務需求 ? 大家好,我是菠菜啊,好久不見,今天給大家帶來的是——代理模式。老規矩,在介紹這期內容前,我們先來看看這樣的需求:我們有一套房產需要出售&#xff0c…

Unity進階課程【六】Android、ios、Pad 終端設備打包局域網IP調試、USB調試、性能檢測、控制臺打印日志等、C#

Unity打包 Android、ios、Pad 終端設備局域網IP調試、USB調試 今天咱們繼續進階課程,定期更新,有想學習的不懂的地方也可以告訴我。 提示:內容純個人編寫,歡迎評論點贊,來指正我。 文章目錄 Unity打包 Android、ios、P…