機器學習 | Python實現KNN(K近鄰)模型實踐
目錄
- 機器學習 | Python實現KNN(K近鄰)模型實踐
- 基本介紹
- 模型原理
- 源碼設計
- 學習小結
- 參考資料
基本介紹
一句話就可以概括出KNN(K最近鄰算法)的算法原理:綜合k個“鄰居”的標簽值作為新樣本的預測值。更具體來講KNN分類過程,給定一個訓練數據集,對新的樣本Xu,在訓練數據集中找到與該樣本距離最鄰近的K(下圖k=5)個樣本,以這K個樣本的最多數所屬類別(標簽)作為新實例Xu的預測類別。
模型原理
- 距離度量
KNN算法用距離去度量兩兩樣本間的臨近程度,最終為新實例樣本確認出最臨近的K個實例樣本(這也是算法的關鍵步驟),常用的距離度量方法有曼哈頓距離、歐幾里得距離。曼哈頓、歐幾里得距離的計算方法很簡單&#