機器學習第十六講：K-means → 自動把超市顧客分成不同消費群體

資料取自《零基礎學機器學習》。
查看總目錄：學習大綱

關于DeepSeek本地部署指南可以看下我之前寫的文章：DeepSeek R1本地與線上滿血版部署：超詳細手把手指南

K-means是一種用于自動將相似數據分組的無監督學習算法。下面用超市顧客分組的例子詳細講解：

假設你有一堆散落的商品要分類擺放，但不知道應該分幾類。K-means的解決步驟是：

案例背景：某超市收集了200名顧客的：

選擇關鍵特征：這里選年收入和消費分數，就像選"尺子"來度量顧客差異 [^1]

示例數據片段：
| 顧客ID | 年收入 | 消費分數 |
|--------|--------|----------|
| 001 | 38 | 82 |
| 002 | 43 | 78 |
確定分組數量K：用手肘法找最佳分組數 [^3]
- 原理：計算不同K值時的總誤差（各點到中心的距離和）
- 圖示：當誤差下降變緩時，就像人手臂的"肘關節"，選這個K值
```
# 代碼示例（Python）
cost = []
for k in 1到10:用K-means分組記錄當前總誤差
plt.plot(cost)  # 找肘部拐點
```
生成4個消費群體（當K=4時）[^1][2]
- 簇1（藍）：高收入-高消費 → 重點維護的VIP客戶
- 簇2（綠）：中等收入-高消費 → 高潛力客戶
- 簇3（紅）：低收入-低消費 → 普通客戶
- 簇4（青）：高收入-低消費 → 需提升消費意愿

適用場景 ? 銀行客戶分群/新聞主題聚類/市場細分 [^5-3]
優點：簡單高效，適合處理大型數據集
缺點：需要人工確定K值，對異常值敏感

生活類比：就像給圖書館散落的書籍分類，先估計大概有幾個主題區，不斷調整書架位置直到形成自然的圖書集群 [^3]

目錄：總目錄
上篇文章：機器學習第十五講：決策樹全面講解：像玩"20個問題"游戲猜身份🎮
下篇文章：機器學習第十七講：PCA → 把100維數據壓縮成3D視圖仍保持主要特征

[^1-3]《零基礎學機器學習》第一章第三節類型劃分
[^5-3]《零基礎學機器學習》第五章第五節聚類算法
[^1][2][^3]參見客戶聚類案例代碼（《零基礎學機器學習》第十章教學用例）

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/80596.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/80596.shtml
英文地址，請注明出處：http://en.pswp.cn/web/80596.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！