機器學習第三講:監督學習 → 帶答案的學習冊,如預測房價時需要歷史價格數據
資料取自《零基礎學機器學習》。
查看總目錄:學習大綱
關于DeepSeek本地部署指南可以看下我之前寫的文章:DeepSeek R1本地與線上滿血版部署:超詳細手把手指南
一、理解核心比喻:練習冊與參考答案 📚
教材中的經典比喻1:
監督學習就像學生使用「題目+答案」的練習冊:
- 學習階段:對著題目做練習 → 對照答案改錯 → 找到解題思路
- 考試階段:面對新題時能用學到的思路解答
映射到監督學習:
二、房價預測全流程拆解 🏠(教材第三章典型案例2)
通過房屋特征預測售價的完整過程:
關鍵技術點:
- 特征工程(Feature Engineering)
將原始數據轉化為可理解的指標(如將地址轉化為"距地鐵站距離") - 損失函數(Loss Function)
相當于錯題本,計算預測價與實際價的差距(例如預測310萬實際300萬 → 記10萬誤差) - 梯度下降(Gradient Descent)
像學生調整解題方法,逐步減少錯誤(每次調整讓預測誤差更小)
三、深入理解訓練過程 🔄
以學生數學備考類比(教材第三章訓練流程解析3):
運行邏輯對比:
學生備考 | 機器學習模型訓練 |
---|---|
每道題有標準答案 | 每個數據樣本都有標簽 |
錯題重點復習 | 損失函數提示誤差方向 |
定期模擬考 | 驗證集測試泛化能力 |
四、實戰應用與限制 🚧
-
經典應用場景
- 醫療診斷(輸入癥狀 → 輸出疾病類型)
- 股票預測(輸入行情數據 → 輸出明日漲跌概率)
-
關鍵限制(教材第三章注意事項4)
- 數據依賴性:新開發的市中心樓盤若歷史數據不足,預測可能失準
- 冷啟動問題:沒有過往成交記錄的區域需要其他方法補充
- 過擬合風險:像學生死記硬背習題答案,遇到變形題就出錯
五、算法選擇策略 ??
針對不同問題規模選擇工具(教材第三章方法選型指南5):
六、一句話總結監督學習本質 💎
監督學習就是讓計算機通過觀察大量「題目+標準答案」,自己總結出從問題到答案的解決規律,并在遇到新問題時應用這個規律做出預測(教材第三章核心定義1)
目錄:總目錄
上篇文章:機器學習第二講:對比傳統編程:解決復雜規則場景
《零基礎學機器學習》第三章第一節:“監督學習基礎概念”,P.89 ?? ??
《零基礎學機器學習》第三章案例3-2:“房價預測實戰”,P.102-105 ??
《零基礎學機器學習》第三章第四節:“訓練過程解析”,P.116-118 ??
《零基礎學機器學習》第三章注意事項:“監督學習的局限性”,P.135 ??
《零基礎學機器學習》第三章方法選擇矩陣,P.127 ??