本文重點
在學習支持向量機算法之前,我們要繼續學習一些數學基礎,本文我們將學習核函數的概念。當數據線性不可分的時候,此時就需要核函數出場了,它可以將低維不可分的數據映射到高維可分數據,此時就可以完成數據分類了。
核函數的定義
核函數K(x, y)定義為兩個數據點x和y在某個高維空間中的相似性度量。具體地,如果有一個非線性映射函數φ(x),將輸入空間的數據點x映射到高維特征空間F中,即φ(x)∈F,那么核函數K(x, y)就等于這兩個映射后的數據點在高維特征空間中的內積,即K(x, y) = φ(x) · φ(y)。
在支持向量機(SVM)中,如果求解過程只用到內積運算,而在低維輸入空間中存在一個函數K(x, x'),它恰好等于在高維空間中這個內積,即K(x, x') = φ(x) · φ(x'),那么就可以避免計算復雜的非線性變換φ(x),而直接通過函數K(x, x')得到非線性變換的內積,從而大大簡化了計算。這樣的函數K(x, x')就稱為核函數。
核函數的分類
核函數有多種類型,常見的有以下幾種: