【課堂筆記】核方法和Mercer定理

文章目錄

  • Kernal
    • 引入
    • 定義
    • Mercer定理
      • 描述
      • 有限情形證明
      • 一般情形證明

Kernal

引入

??在實際數據中常常遇到不可線性分割的情況,此時通常需要將其映射到高維空間中,使其變得線性可分。例如二維數據:
在這里插入圖片描述

通過映射 ? ( x 1 , x 2 ) = ( x 1 2 , 2 x 1 x 2 , x 2 2 ) \phi(x_1, x_2) = (x_1^2, \sqrt{2}x_1x_2, x_2^2) ?(x1?,x2?)=(x12?,2 ?x1?x2?,x22?),將數據投影到三維空間,下面展示的是一個二維投影(三維畫不出來):
在這里插入圖片描述
??于是我們可以找到一個超平面(如 x 1 2 + x 2 2 = c x_1^2 + x_2^2 = c x12?+x22?=c)來把兩類數據分開。這種投影方法被稱為顯式投影法,即構造出一個函數 ? ( x ) \phi(x) ?(x)將數據從原始空間投影到高維空間。

??在一些模型中(如SVM),需要計算高維空間下數據點之間的內積 x 1 ? x 2 x_1^\top x_2 x1??x2?,反映數據點之間的相似度。然而將數據點投影后再計算會產生許多時間花費和空間花費。那有沒有什么方法能直接計算出內積,跳過投影的過程呢?~~有的兄弟,有的。~~于是核方法誕生了。

定義

??核方法(Kernel Methods)是一類機器學習算法,旨在通過將數據從原始空間隱式映射到高維特征空間來解決非線性問題,同時利用核函數高效計算特征空間中的內積,而無需顯式計算高維特征向量。
??設輸入空間為 X \mathcal{X} X,如下形式的函數稱為核函數:
K : X × X → R \mathcal{K}: \mathcal{X} \times \mathcal{X} \to \mathbb{R} K:X×XR
滿足其對應的Gram矩陣正定的半正定的,這保證了核函數在數學上定義了一個有效的內積空間。
??則這個核函數一定能寫成某個高維空間的內積 K ( x , x ′ ) = ? ( x ) ? ? ( x ′ ) \mathcal{K}(x,x') = \phi(x)^\top\phi(x') K(x,x)=?(x)??(x),這由Mercer定理支持。

Mercer定理

描述

??如果核函數 K : X × X → R \mathcal{K}: \mathcal{X} \times \mathcal{X} \to \mathbb{R} K:X×XR滿足Mercer條件,即正定性,則存在一個映射 ? : X → H \phi: \mathcal{X} \to \mathcal{H} ?:XH,將 x x x映射到某個希爾伯特空間,使得:
K ( x , x ′ ) = ? ( x ) T ? ( x ′ ) \mathcal{K}(x, x') = \phi(x)^T\phi(x') K(x,x)=?(x)T?(x)

有限情形證明

先在有限數據集 { x 1 , . . . , x N } ? X \set{x_1, ..., x_N} \subset \mathcal{X} {x1?,...,xN?}?X上證明:由于 K \mathcal{K} K是對稱正定矩陣,則可以分解為
K = U ? Λ U Λ = diag? ( λ 1 , . . . , λ N ) , λ i ≥ 0 \mathcal{K} = U^\top\Lambda U \\ \Lambda = \text{diag }(\lambda_1, ..., \lambda_N), \lambda_i \ge 0 \\ K=U?ΛUΛ=diag?(λ1?,...,λN?),λi?0
U U U是正交矩陣, U ? U = I U^\top U=I U?U=I,列向量 u 1 , . . . , u N u_1, ..., u_N u1?,...,uN?是特征向量。
定義特征映射為 ? : X → R N \phi:\mathcal{X} \to \mathbb{R}^N ?:XRN為:
? ( x i ) = Λ 1 / 2 u i \phi(x_i) = \Lambda^{1/2}u_i ?(xi?)=Λ1/2ui?
其中 Λ 1 / 2 = diag? ( λ 1 , . . . , λ N ) \Lambda^{1/2} = \text{diag }\left(\sqrt{\lambda_1}, ..., \sqrt{\lambda_N}\right) Λ1/2=diag?(λ1? ?,...,λN? ?)
驗證內積:
? ( x i ) ? ? ( x j ) = u i ? Λ u j = K ( x i , x j ) \phi(x_i)^\top\phi(x_j) = u_i^\top \Lambda u_j = \mathcal{K}(x_i, x_j) ?(xi?)??(xj?)=ui??Λuj?=K(xi?,xj?)
補充:若 K \mathcal{K} K的秩 r < N r < N r<N,(可能有零特征值),特征空間的維度可以降為 r r r,即只保留非零特征值對應的分量。
這證明了對于有限數據集,核函數可以通過特征分解構造一個有限維特征空間的內積。

一般情形證明

??為了嚴謹性,對于一般核函數 K ( x , x ′ ) \mathcal{K}(x, x') K(x,x),輸入空間 X \mathcal{X} X可能是連續的(如 X = R d \mathcal{X} = \mathbb{R}^d X=Rd或緊致域),且核函數可能定義在無窮多點上。Mercer定理的完整形式需要函數空間的理論,特別是再生核希爾伯特空間(RKHS)
??假設:
(1) X \mathcal{X} X是緊致集
(2) K ( x , x ′ ) \mathcal{K}(x, x') K(x,x)是對稱的、連續的,且滿足Mercer條件(正定性)。
(3)正定性在連續情形下定義為:對于任意平方可積函數 f ∈ L 2 ( X ) f \in \mathcal{L}^2(\mathcal{X}) fL2(X),有:
? X × X f ( x ) K ( x , x ′ ) f ( x ′ ) d x d x ′ ≥ 0 \iint_{\mathcal{X} \times \mathcal{X}} f(x)\mathcal{K}(x, x')f(x')dxdx' \ge 0 ?X×X?f(x)K(x,x)f(x)dxdx0
??然后對 K \mathcal{K} K進行特征展開,核函數 K ( x , x ′ ) \mathcal{K}(x, x') K(x,x)作為一個對稱正定算子,可以通過特征值分解表示。定義積分算子:
( T K f ) ( x ) = ∫ X K ( x , x ′ ) f ( x ′ ) d x ′ (T_Kf)(x) = \int_\mathcal{X}\mathcal{K}(x, x')f(x')dx' (TK?f)(x)=X?K(x,x)f(x)dx
T K T_K TK?是一個緊致、自我伴隨的算子(因為 K \mathcal{K} K對稱且連續)。根據希爾伯特-施密特理論, T K T_K TK?有可數個特征值 λ i ≥ 0 \lambda_i \ge 0 λi?0和對應的特征函數 ψ i ( x ) \psi_i(x) ψi?(x),滿足:
T K ψ i = λ i ψ i , ∫ X K ( x , x ′ ) ψ i ( x ′ ) d x ′ = λ i ψ i T_K \psi_i = \lambda_i\psi_i, \int_\mathcal{X}\mathcal{K}(x, x')\psi_i(x')dx' = \lambda_i\psi_i TK?ψi?=λi?ψi?,X?K(x,x)ψi?(x)dx=λi?ψi?
特征函數 { ψ i } \left\{\psi_i\right \} {ψi?}構成了 L 2 ( X ) \mathcal{L}^2(\mathcal{X}) L2(X)的正交基,滿足:
∫ X ψ i ( x ) ψ j ( x ) d x = δ i j \int_\mathcal{X}\psi_i(x)\psi_j(x)dx = \delta_{ij} X?ψi?(x)ψj?(x)dx=δij?
核函數可以表示為特征展開:
K ( x , x ′ ) = ∑ ∞ i = 1 λ i ψ i ( x ) ψ i ( x ′ ) \mathcal{K}(x,x') = \underset{i=1}{\overset{\infty}{\sum}}\lambda_i\psi_i(x)\psi_i(x') K(x,x)=i=1??λi?ψi?(x)ψi?(x)
這一級數在 X × X \mathcal{X} \times \mathcal{X} X×X上均勻收斂(因為 K \mathcal{K} K連續且 X \mathcal{X} X緊致)

然后我們構造特征映射 ? : X → H \phi: \mathcal{X} \to \mathcal{H} ?:XH,其中 H \mathcal{H} H是希爾伯特空間(通常是 l 2 l^2 l2,無窮維序列空間),可以理解為無限維的歐幾里得空間。
? ( x ) = ( λ 1 ψ 1 ( x ) , λ 1 ψ 2 ( x ) , . . . ) \phi(x) = \left(\sqrt{\lambda_1}\psi_1(x), \sqrt{\lambda_1}\psi_2(x), ... \right) ?(x)=(λ1? ?ψ1?(x),λ1? ?ψ2?(x),...)
每個 ? ( x ) \phi(x) ?(x)是一個無窮序列,其分量為 λ i ψ i ( x ) \sqrt{\lambda_i}\psi_i(x) λi? ?ψi?(x)
H \mathcal{H} H中的內積定義為:
? ( x ) ? ? ( x ′ ) = ∑ ∞ i = 1 ( λ i ψ i ( x ) ) ( λ i ψ i ( x ′ ) ) = ∑ ∞ i = 1 λ i ψ i ( x ) ψ i ( x ′ ) = K ( x , x ′ ) \phi(x)^\top\phi(x') = \underset{i=1}{\overset{\infty}{\sum}}\left(\sqrt{\lambda_i}\psi_i(x)\right)\left(\sqrt{\lambda_i}\psi_i(x')\right)=\underset{i=1}{\overset{\infty}{\sum}}\lambda_i\psi_i(x)\psi_i(x') = \mathcal{K}(x,x') ?(x)??(x)=i=1??(λi? ?ψi?(x))(λi? ?ψi?(x))=i=1??λi?ψi?(x)ψi?(x)=K(x,x)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/80803.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/80803.shtml
英文地址,請注明出處:http://en.pswp.cn/web/80803.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

談談未來iOS越獄或巨魔是否會消失

2024年10月的預測&#xff0c;先說結論&#xff1a; 巨魔iOS17.1消失概率為99%。 因為巨魔強依賴的漏洞就是一個簽名漏洞&#xff0c;攻擊面有限又經過2輪修復&#xff0c;第3次出現漏洞的概率極低。而越獄的話由于系統組件和服務較多&#xff0c;所以出現漏洞概率高攻擊面多&…

根據當前日期計算并選取上一個月和上一個季度的日期范圍,用于日期控件的快捷選取功能

1.選擇月份范圍 代碼如下&#xff1a; <el-date-picker v-model"value" type"monthrange" align"right" unlink-panels range-separator"至"start-placeholder"開始月份" end-placeholder"結束月份" :picker-…

用戶棧的高效解析邏輯

一、背景 在之前的博客 內核邏輯里抓取用戶棧的幾種方法-CSDN博客 里&#xff0c;介紹了使用內核邏輯進行用戶棧的函數地址的抓取邏輯&#xff0c;但是并沒有涉及如何解析出函數符號的邏輯。 就如perf工具一樣&#xff0c;它也是分為兩個步驟&#xff0c;一個步驟是內核態抓取…

vue3 el-table 行號

在 Vue 3 中&#xff0c;使用 Element Plus 的 <el-table> 組件來創建表格時&#xff0c;如果你想添加行號&#xff08;即每一行的編號&#xff09;&#xff0c;可以通過自定義列來實現。下面是如何實現的步驟&#xff1a; 1. 安裝 Element Plus 首先&#xff0c;確保你…

Linux:進程信號---信號的保存與處理

文章目錄 1. 信號的保存1.1 信號的狀態管理 2. 信號的處理2.1 用戶態與內核態2.2 信號處理和捕捉的內核原理2.3 sigaction函數 3. 可重入函數4. Volatile5. SIGCHLD信號 序&#xff1a;在上一章中&#xff0c;我們對信號的概念及其識別的底層原理有了一定認識&#xff0c;也知道…

UML 圖的細分類別及其應用

統一建模語言&#xff08;UML&#xff0c;Unified Modeling Language&#xff09;是一種用于軟件系統建模的標準化語言&#xff0c;廣泛應用于軟件工程領域。UML 圖分為多種類別&#xff0c;每種圖都有其特定的用途和特點。本文將詳細介紹 UML 圖的細分類別&#xff0c;包括 類…

「極簡」扣子(coze)教程 | 小程序UI設計進階!控件可見性設置

大師兄在上一期的內容中對用戶的UI做了一些簡單的介紹。這期大師兄繼續介紹UI設計上的進階小技巧&#xff0c;幫我們獲得更好的使用體驗。 扣子&#xff08;coze&#xff09;編程 「極簡」扣子(coze)教程 | 3分鐘學會小程序UI設計&#xff01;從零開始創建頁面和瓷片按鈕 「極…

2025年滲透測試面試題總結-快手[實習]安全工程師(題目+回答)

網絡安全領域各種資源&#xff0c;學習文檔&#xff0c;以及工具分享、前沿信息分享、POC、EXP分享。不定期分享各種好玩的項目及好用的工具&#xff0c;歡迎關注。 目錄 快手[實習]安全工程師 一面問題分析與詳細回答 1. 自我介紹 4. 項目問題與解決 7. 防止SQL注入&…

WordPress Madara插件存在文件包含漏洞(CVE-2025-4524)

免責聲明 本文檔所述漏洞詳情及復現方法僅限用于合法授權的安全研究和學術教育用途。任何個人或組織不得利用本文內容從事未經許可的滲透測試、網絡攻擊或其他違法行為。使用者應確保其行為符合相關法律法規,并取得目標系統的明確授權。 對于因不當使用本文信息而造成的任何直…

互聯網大廠Java面試場景:從Spring Boot到分布式緩存技術的探討

互聯網大廠Java面試場景&#xff1a;從Spring Boot到分布式緩存技術的探討 場景描述 互聯網大廠某次Java開發崗面試&#xff0c;主考官是一位嚴肅的技術專家&#xff0c;而應聘者則是搞笑的程序員“碼農明哥”。面試圍繞音視頻場景的技術解決方案展開&#xff0c;探討從Sprin…

leetcode hot100刷題日記——8.合并區間

class Solution { public:vector<vector<int>> merge(vector<vector<int>>& intervals) {if(intervals.empty()){//復習empty函數啊&#xff0c;日記1有的return {};}// 按照區間的起始位置進行排序sort(intervals.begin(), intervals.end());vect…

Unity中GPU Instancing使用整理

GPU Instancing是一種繪制調用優化方法,可在單個繪制調用中渲染具有相同材質Mesh的多個副本(實例),可用于繪制在場景中多次出現的幾何體(例如,樹木或灌木叢),在同一繪制調用中渲染相同的網格,每個實例可以具有不同的屬性(如 Color 或 Scale),渲染多個實例的繪制調用…

【后端】【UV】【Django】 `uv` 管理的項目中搭建一個 Django 項目

&#x1f680; 一步步搭建 Django 項目&#xff08;適用于 uv pyproject.toml 項目結構&#xff09; &#x1f9f1; 第 1 步&#xff1a;初始化一個 uv 項目&#xff08;如果還沒建好&#xff09; uv init django-project # 創建項目&#xff0c;類似npm create vue?? 第 …

Linux操作系統之進程(二):進程狀態

目錄 前言 一、補充知識點 1、并行與并發 2、時間片 3、 等待的本質 4、掛起 二. 進程的基本狀態 三、代碼演示 1、R與S 2、T 3、Z 四、孤兒進程 總結&#xff1a; 前言 在操作系統中&#xff0c;進程是程序執行的基本單位。每個進程都有自己的狀態&#xff0c;這些…

大數據技術全景解析:HDFS、HBase、MapReduce 與 Chukwa

大數據技術全景解析&#xff1a;HDFS、HBase、MapReduce 與 Chukwa 在當今這個信息爆炸的時代&#xff0c;大數據已經成為企業競爭力的重要組成部分。從電商的用戶行為分析到金融的風險控制&#xff0c;從醫療健康的數據挖掘到智能制造的實時監控&#xff0c;大數據技術無處不…

學習 Android(十一)Service

簡介 在 Android 中&#xff0c;Service 是一種無界面的組件&#xff0c;用于在后臺執行長期運行或跨進程的任務&#xff0c;如播放音樂、網絡下載或與遠程服務通信 。Service 可分為“啟動型&#xff08;Started&#xff09;”和“綁定型&#xff08;Bound&#xff09;”兩大…

投標環節:如何科學、合理地介紹 Elasticsearch 國產化替代方案——Easysearch?

一、Easysearch 定義 Easysearch 是由極限科技&#xff08;INFINI Labs&#xff09;自主研發的分布式搜索型數據庫&#xff0c;作為 Elasticsearch 的國產化替代方案&#xff0c;基于 Elasticsearch 7.10.2 開源版本深度優化[1]。 插一句&#xff1a;Elasticsearch 7.10.2 是里…

NVC++ 介紹與使用指南

文章目錄 NVC 介紹與使用指南NVC 簡介安裝 NVC基本使用編譯純 C 程序編譯 CUDA C 程序 關鍵編譯選項示例代碼使用標準并行算法 (STDPAR)混合 CUDA 和 C 優勢與限制優勢限制 調試與優化 NVC 介紹與使用指南 NVC 是 NVIDIA 提供的基于 LLVM 的 C 編譯器&#xff0c;專為 GPU 加速…

Veo 3 可以生成視頻,并附帶配樂

谷歌最新的視頻生成 AI 模型 Veo 3 可以創建與其生成的剪輯相配的音頻。 周二&#xff0c;在谷歌 I/O 2025 開發者大會上&#xff0c;谷歌發布了 Veo 3。該公司聲稱&#xff0c;這款產品可以生成音效、背景噪音&#xff0c;甚至對話&#xff0c;為其制作的視頻增添配樂。谷歌表…

Android本地語音識別引擎深度對比與集成指南:Vosk vs SherpaOnnx

技術選型對比矩陣 對比維度VoskSherpaOnnx核心架構基于Kaldi二次開發ONNX Runtime + K2新一代架構模型格式專用格式(需專用工具轉換)ONNX標準格式(跨框架通用)中文識別精度89.2% (TDNN模型)92.7% (Zipformer流式模型)內存占用60-150MB30-80MB遲表現320-500ms180-300ms多線程…