主成分分析法 PCA 是什么
主成分分析法(Principal Component Analysis,簡稱PCA)是一種數據降維與特征提取方法,核心思想是通過線性變換將高維數據映射到低維空間,在盡可能保留原始數據“信息量”(即方差)的同時,減少數據維度,消除特征間的相關性。
主成分分析法(PCA)是一種通過線性變換將高維數據映射到低維空間的降維方法,核心是保留數據中方差最大的方向(主成分),在減少維度的同時保留主要信息。
一、舉例說明計算過程(以二維數據降維到一維為例)
假設我們有3個樣本的二維數據(比如“語文成績”和“數學成績”):
樣本數據:X=[123456]\mathbf{X} = \begin{bmatrix} 1 & 2 \\ 3 & 4 \\ 5 & 6 \end{bmatrix}X=