核方法總結(三)———核主成分(kernel PCA)學習筆記

一、核主成分

? ? 1.1 和PCA的區別

? ? ? ? ?PCA (主成分分析)對應一個線性高斯模型(參考書的第二章),其基本假設是數據由一個符合正態分布的隱變量通過一個線性映射得到,因此可很好描述符合高斯分布的數據。然而在很多實際應用中數據的正態性不能保證,這時用PCA建模通常會產生較大偏差。這時可以設計一個合理的非線性映射,將原始數據映射到特征空間,使數據在該空間的映射具有高斯性,在這個基礎可進行有效的PCA建模。即通過核函數間接映射到特征空間再間接進行建模,所以稱為核主成分分析;

? ? ? ?1.2 推導過程

? ? ? ? ?定義原始數據空間樣本為\left \{ x_{n} \right \},非線性映射為\phi \left ( x \right ),且在原始空間和特征空間滿足如下歸一化條件。

? ? ? ? ? ?\sum _{n}{x_{n}} = 0 \sum _{n}{\phi (x_{n})} = 0? ?1------(1)

? ? ? 在映射空間的協方差矩陣可寫作:

? 1----(2)

上式中,假設\phi \left ( x_{n} \right )有m維,則\phi \left ( x_{n} \right )\phi \left ( x_{n} \right )^{T}有m*m維。其中,在特征空間中求主成分v等價于求S^{\phi }的特征向量:

S^{\phi }v = \lambda v? ?1----(3)

整理以上兩式可得:

1-----(4)

其中:\alpha = \frac{1}{N\mu }\Phi ^{T}\nu?, 是一個N維向量,其中每一維對應一個數據點與特征向量v的內積,同時,上式說明在特征空間的特征向量v由所有數據樣本的向量加權平均得到,權重為\alpha,轉化為對偶問題。將?v = \Phi \alpha?代回式 1 ----(4)? :

? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ??1----(5)、1-----(6)、1----(7)

其中 K為gram陣,?上式1—(7)右項左移,可以看出K選擇合適的核函數,會使K不等于空矩陣,因而可以推出:

K\alpha = \lambda N\alpha? ?1——(8) 為1——(7)式的必要條件

考慮特征向量v應滿足v^{T}v?=1 ,而 v=\Phi \alpha,有:

1-----(9)

將1---(8)式左乘\alpha ^{T}并代入上式,有:

\lambda N\alpha ^{T}\alpha =1? ?1----(10)

? ? \alpha可以通過下式求解:

? ?1------(11)

? ? 上式求解特征向量的方法是,求解左式的特征向量,再取\alpha?=??\alpha \sqrt{\frac{1}{\lambda N}}?就可以求得滿足約束的特征向量。解出\alpha后,即可基于1—(4)式得到在特征空間的主成分向量。和標準PCA類似,我們可以求得多個主成分,組成主成分向量集{v_{i}}。

? ? 基于{v_{i}}可對任意測試樣本x降維,且等價于在特征空間中計算\phi \left ( x_{} \right )在各個主成分v_{i}上的投影,計算如下:

? ?1———(12)

上式?\alpha _{i,n}?表示特征向量v_{i}對應的權重的第n維(n=1.....N)。

? ? ? ? 雖然我們的目的是在特征空間進行主成分提取并給予得到的主成分對數據進行降維,但不需要在特征空間進行操作,所有計算都在原始空間中以核函數方式進行,計算得到的結果等價于在特征空間中進行。這使得可以在非常復雜的特征空間中對數據進行PCA建模,從而解決了原始數據的非高斯化問題,使PCA具有靈活性和可擴展性。

二、總結

? ? ??本文是學習《機器學習導論》(清華大學出版社,中文版,王東,2021年)的摘錄總結或筆記。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/38423.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/38423.shtml
英文地址,請注明出處:http://en.pswp.cn/web/38423.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

ViewBinding的使用(因為kotlin-android-extensions插件的淘汰)

書籍: 《第一行代碼 Android》第三版 開發環境: Android Studio Jellyfish | 2023.3.1 問題: 3.2.4在Activity中使用Toast章節中使用到了kotlin-android-extensions插件,但是該插件已經淘汰,根據網上了解,目前使用了新的技術VewBinding替…

UE4_材質_材質節點_DepthFade

一、DepthFade參數 DepthFade(深度消退)表達式用來隱藏半透明對象與不透明對象相交時出現的不美觀接縫。 項目說明屬性消退距離(Fade Distance)這是應該發生消退的全局空間距離。未連接 FadeDistance(FadeDistance&a…

【數據分析“三劍客”】—— Pandas

Pandas Pandas 是基于NumPy的一種工具,該工具是為解決數據分析任務而創建的, Pandas提供了大量能使我們快速便捷地處理數據的函數和方法。Pandas與出色的 Jupyter工具包和其他庫相結合,Python中用于進行數據分析的環境在性能、生產率和協作能力方面都是…

光照老化試驗箱:材料耐久性的“時間加速器”

光照老化試驗箱:材料耐久性的“時間加速器”概述 光照老化試驗箱是一種模擬自然光照條件下材料老化過程的設備,廣泛應用于材料科學領域的耐久性能評估。通過模擬日光中的紫外線、熱輻射等環境因素,加速材料老化過程,以此來驗證材…

redhawk:tech file與lefdef layer name不匹配問題

我正在「拾陸樓」和朋友們討論有趣的話題,你?起來吧? 拾陸樓知識星球入口 一些工藝廠商給的redhawk tech file是加密的,讀完tech file再讀lef/def會報錯,根本不知道問題在哪,他們一般會搭配給一個layer map&#xff…

分解+降維+預測!多重創新!直接寫核心!EMD-KPCA-Transformer多變量時間序列光伏功率預測

分解降維預測!多重創新!直接寫核心!EMD-KPCA-Transformer多變量時間序列光伏功率預測 目錄 分解降維預測!多重創新!直接寫核心!EMD-KPCA-Transformer多變量時間序列光伏功率預測效果一覽基本介紹程序設計參…

【簡單講解神經網絡訓練中batch的作用】

🎥博主:程序員不想YY啊 💫CSDN優質創作者,CSDN實力新星,CSDN博客專家 🤗點贊🎈收藏?再看💫養成習慣 ?希望本文對您有所裨益,如有不足之處,歡迎在評論區提出…

Maven依賴解析過程詳細講解

Maven依賴解析是一個遞歸的過程,涉及從項目的POM文件開始,逐步解析直接依賴和傳遞依賴。以下是詳細的解析過程: 讀取項目的POM文件: Maven首先讀取項目的POM文件 (pom.xml),該文件定義了項目的直接依賴。 解析直接依賴…

STM32第十五課:LCD屏幕及應用

文章目錄 需求一、LCD顯示屏二、全屏圖片三、數據顯示1.顯示歡迎詞2.顯示溫濕度3.顯示當前時間 四、需求實現代碼 需求 1.在LCD屏上顯示一張全屏圖片。 2.在LCD屏上顯示當前時間,溫度,濕度。 一、LCD顯示屏 液晶顯示器,簡稱 LCD(Liquid Cry…

node_sqlite3.node is not a valid win32 application

electron打包報錯 使用electron在linux平臺打包含有sqlite3的項目為win32應用時在運行階段,有時會遇到下面的錯誤 node_sqlite3.node is not a valid win32 application出現該錯誤的原因主要是在64bit的linux環境中,sqlite3默認build出來的二進制文件不…

【Windows】Visual Studio Installer下載緩慢解決辦法

【Windows】Visual Studio Installer下載緩慢解決辦法 1.背景2.分析3.結果 1.背景 使用visual studio在線安裝包進行IDE安裝,發現下載幾乎停滯,網速幾乎為零。 經過排查并不是因為實際網絡帶寬導致。 這里涉及DNS知識; DNS(Dom…

消防認證-防火卷簾

一、消防認證 消防認證是指消防產品符合國家相關技術要求和標準,且通過了國家認證認可監督管理委員會審批,獲得消防認證資質的認證機構頒發的證書,消防產品具有完好的防火功能,是住房和城鄉建設領域驗收的重要指標。 二、認證依據…

TP8 JS(html2canvas) 把DIV內容生成二維碼并與背景圖、文字組合生成分享海報

方法一:前端JS生成(推薦) 注意: 1.這個網頁只能截圖圖片效果代碼,其它任何html效果都不能有,不然截圖就不準確 2.如果要生成的圖片DIV內容中引用了第三個方的圖片,就是不使用同一個域名下的圖片,需要把后…

Python爬取淘寶商品評價信息實戰:從零到一的高效教程

引言:揭秘淘寶數據金礦 在電商領域,用戶評價是衡量產品優劣的金標準。作為Python爬蟲工程師,掌握從淘寶這座數據金礦中挖掘寶貴評價信息的技能至關重要。本文將帶你手把手實操,用Python爬蟲技術獲取淘寶商品的評價信息&#xff0…

Docker多階段構建Node.js應用程序

Node.js 應用程序 創建一個目錄來存放你的項目文件,然后在該目錄下創建以下文件。 package.json {"name": "docker-node-test","version": "1.0.0","description": "A simple Node.js app for Docker mu…

【折騰筆記】使用 PicList + Lsky Pro 對圖片進行雙重壓縮

前言 因為服務器的帶寬比較小,為了提高網站的訪問速度,網站內的圖片進行壓縮是必不可少的。另外將圖片轉換成WebP的格式可以減小文件大小、加快加載速度、支持高級特性(如透明度和動畫),以及減少存儲需求,為網站提供了顯著的性能。需要提前安裝好PicList客戶端和Lsky Pr…

最快33天錄用!一投就中的醫學4區SCI,幾乎不退稿~

【SciencePub學術】今天小編給大家推薦2本生物醫學領域的SCI,此期刊為我處目前合作的重點期刊!影響因子0-3.0之間,最重要的是審稿周期較短,對急投的學者較為友好! 醫學醫藥類SCI 01 / 期刊概況 【期刊簡介】IF&…

那些好用的 Vue3 的工具搭子!!【送源碼】

2020 年 9 月 18 日 Vue3 的正式發布已經過去了大約 3 年 9 個月左右!!! 隨著 Vue3 版本的逐漸成熟,我們的前端世界也迎來了一系列令人振奮的更新和工具。Vue 生態圈的持續擴大,無疑為前端開發人員帶來了前所未有的便…

通過pycharm使用git和github的步驟

一、在Pycharm工具中配置集成Git和GitHub。 1.集成Git。 打開Pycharm, 點擊File-->Settins-->Version Control-->Git 然后在 Path to Git executable中選擇本地的git.exe路徑。如下圖: 2.集成GitHub 打開Pycharm, 點擊File-->Settins-->Version…

探索未來遠程調試新紀元——《串口網口遠程調試軟件》:無縫連接,高效調試

文章目錄 前言一、無縫連接,突破距離限制二、高效調試,提升工作效率三、安全可靠,保護數據安全四、用戶友好,簡化操作流程五、軟件地址六、遠程調試軟件 七、基本操作1、訂閱主題2、連接3、串口調試4、網口調試 八、軟件地址結束語…