?十五個作業
?不同類型的Functions
兩大類任務
一個是Regression(回歸) 一個是? Classification(分類)
一個是給出一個數值,一個是從類別中選擇一個
還有一類任務 Structured Learning 機器要學會創造文件?
機器學習預測頻道第二天的觀看人數的三個步驟
1,我們要寫出一個帶有未知參數的函數
猜測 y = b + wX1
w 是 weight
b 是 bias
2,Define Loss from Training Data 定義一個損失函數
Loss :how good a set of values is.
預估的結果和真實的結果的差距
計算差距?
真實的值叫做label
把三年每一天的誤差都加起來
然后求一個均值 : L
L越大,?這一組參數越不好
L越小,這一組參數越好
計算誤差的公式有很多
?MAE,MSE,交叉熵
將計算的Loss畫一個等高線圖,越靠近藍色就代表參數設置的越好,Loss越小
?
?3,一個未知數 Gradient Descent 梯度下降
只有一個w的時候的圖像
選擇一個初始的點W0,隨機的選擇
計算W對Loss的微分,計算切線斜率,?
自己需要自己設置的東西是 超參數 hyperparameters
向左或者向右走的步伐就是 learning rate? 自己決定
什么時候停下來,算出微分是0,或者更新次數達到已設置的值
容易出現Local minnima的問題
還有梯度消失和梯度爆炸
?3,兩個未知數 Gradient Descent 梯度下降
機器學習的三個步驟
1,寫一個函數
2,定義一個loss函數,損失函數
3,optimization
?Linear models
Linear model也許太過簡單了
由于model的限制叫做 Model Bias
我們需要寫一個更復雜的,有位置參數的function
就算是曲線,也可以用piecewise linear?
?怎么把藍色function寫出來呢
有一個就是sigmod function
x? -> max? ? y -> c
x -> -max? y -> 0
改變 w b c 的區別如圖
?所以紅的得線可以用每個藍色sigmod 函數加起來,再別忘了一個常數constant? b,就是橙色函數