【Sklearn】基于線性判別法的數據分類預測(Excel可直接替換數據)
- 1.模型原理
- 2.模型參數
- 3.文件結構
- 4.Excel數據
- 5.下載地址
- 6.完整代碼
- 7.運行結果
1.模型原理
線性判別分析(Linear Discriminant Analysis,簡稱LDA)是一種經典的模式識別和分類方法,它的目標是找到一個投影,將數據投影到低維空間,使得不同類別的樣本在投影后的空間中有最大的類別間距,同時最小化類內方差。
模型原理如下:
-
假設有d維的數據,分為K個類別。我們的目標是找到一個投影方向(一個長度為d的權重向量w),使得在這個方向上的投影可以最大化類別間的差異,最小化類內的方差。
-
定義類內散度矩陣(Within-Class Scatter Matrix)Sw和類間散度矩陣(Between-Class Scatter Matrix)Sb:
- 類內散度矩陣Sw表示各個類別內部數據的分散程度,計算方法是每個類別的數據與其類別均值的差的協方差之和。
- 類間散度矩陣Sb表示不同類別之間的數據分散程度,計算方法是各個類別均值與總體均值的差的協方差加權和。