機器學習第八講:向量/矩陣 → 數據表格的數學表達,如Excel表格轉數字陣列
資料取自《零基礎學機器學習》。
查看總目錄:學習大綱
關于DeepSeek本地部署指南可以看下我之前寫的文章:DeepSeek R1本地與線上滿血版部署:超詳細手把手指南
一、爬山GPS導航儀比喻 🧭(教材第八章引入案例1)
類比過程:
這個導航過程就是微積分中的「梯度下降」算法原理
二、火箭發射最佳角度解密 🚀
需求場景2:尋找發射角度θ使飛行高度最大
設高度公式:
H ( θ ) = v 2 sin ? 2 θ 2 g H(θ) = \frac{v^2 \sin^2θ}{2g} H(θ)=2gv2sin2θ?
求導找極值:
① 求導: d H d θ = v 2 sin ? 2 θ g \frac{dH}{dθ} = \frac{v^2 \sin2θ}{g} dθdH?=gv2sin2θ?
② 令導數為0: sin ? 2 θ = 0 \sin2θ=0 sin2θ=0 ? θ = 4 5 ° θ=45^\circ θ=45°
graph LRA[初始角度30°] --> B[導數為正→需增大角度]C[角度50°] --> D[導數為負→需減小角度]B & D --> E[最優解45°]
三、核心運算工具箱 ??
-
導數:變化率的顯微鏡
# 代碼示例:計算函數在x=2處的導數 def f(x):return 3*x**2 + 2*x +1 h = 0.0001 # 極微小變化量 derivative = (f(2+h) - f(2))/h # 計算結果≈14
-
梯度下降流程圖(教材第八章圖例3)
四、AI訓練實戰模擬 🤖
場景:訓練智能秤自動校正誤差
損失函數: L ( w ) = ( 真實重量 ? w × 感應值 ) 2 L(w) = (真實重量 - w×感應值)^2 L(w)=(真實重量?w×感應值)2
梯度下降步驟:
- 初始化權重w=0.8
- 計算梯度: d L d w = ? 2 ( 真實值 ? w × 感應值 ) × 感應值 \frac{dL}{dw} = -2(真實值 - w×感應值)×感應值 dwdL?=?2(真實值?w×感應值)×感應值
- 更新公式: w 新 = w ? 學習率 × 梯度 w_{新} = w - 學習率×梯度 w新?=w?學習率×梯度
- 重復直到梯度接近于0
五、現實世界優化舞臺 🌍
應用領域 | 優化目標 | 微積分工具 |
---|---|---|
電商定價策略 | 利潤最大化 | 多元函數偏導數 |
物流路徑規劃 | 運輸成本最小化 | 路徑積分優化 |
手機自動亮度 | 耗電與舒適度的最佳平衡 | 約束條件極值 |
疫苗劑量試驗 | 效果與副作用平衡點 | 微分方程平穩點 |
六、常見翻車現場警示 🚧(教材第八章誤區4)
-
步長災難
-
局部最優陷阱
就像掉進火山口以為到達地球最低點,實際還有馬里亞納海溝 -
維度詛咒
優化手機參數時涉及1000個變量 → 搜索空間比宇宙原子還多
七、高階技巧補給站 ??
動量加速法(教材第八章進階內容5):
應用對比:
方法 | 迭代次數 | 收斂效果 |
---|---|---|
基礎梯度下降 | 1500次 | 輕微震蕩 |
動量加速法 | 400次 | 平穩快速 |
八、知識精髓總結 💎
微積分是量化決策的數學引擎,通過動態感知變化趨勢引導系統不斷逼近全局最優解(教材第八章核心結論1)
(典型案例:Tesla自動駕駛系統通過微分方程實時優化行駛軌跡🚗)
目錄:總目錄
上篇文章:機器學習第七講:概率統計 → 預測可能性,下雨概率70%就是典型應用
下篇文章:機器學習第九講:缺失值填補 → 補全問卷漏填的題目,保證數據完整性
《零基礎學機器學習》第八章第一節"最優化本質",P.385 ?? ??
《零基礎學機器學習》第八章案例8-3"航天器參數優化",P.402 ??
《零基礎學機器學習》第八章圖8-7梯度下降流程圖,P.414 ??
《零基礎學機器學習》第八章"優化算法陷阱",P.427 ??
《零基礎學機器學習》第八章動量加速推導,P.435 ??