本文重點
在現實世界中,我們經常會遇到高維數據。例如,圖像數據通常具有很高的維度,每個像素點都可以看作是一個維度。高維數據不僅會帶來計算和存儲上的困難,還可能會導致 “維數災難”,即隨著維度的增加,數據的稀疏性和噪聲也會增加,從而影響數據分析的效果。因此,我們需要一種方法來降低數據的維度,提取數據的關鍵特征,同時盡可能地保留數據的信息。
降維的核心----坐標變換
將一個5*3的矩陣降維到4*3,如何才可以呢?要想完成這個操作,需要使用一個4*5的矩陣(降維矩陣)
(4*5)*(5*3)=(4*3)
樣本矩陣(5*3)的每一列表示一個樣本,而降維矩陣(4*5)的每一行表示一個基,也就是說要想將一個維度為5的向量降低到4維,需要尋找一個新的基,這個基的維度是4,也就是說原始向量變換為新基下的坐標,核心還是坐標變換。
基于矩陣乘法的矩陣降維方法
基于矩陣乘法的矩陣降維方法主要有主成分分析(PCA)和奇異值分解(SVD)等。
主成分分析(PCA)