1.基于模型的學習
?????? 根據以往的學習經驗,建立起輸入輸出的模型,然后預測輸入,并且將輸入帶入到模型中,進而預測出輸出的結果,這種學習稱為基于模型的學習
2.機器學習的過程
1)數據收集:通過爬蟲、設備采集等方式進行數據的采集
2)數據清洗:對數據進行規范化,誤差大、無意義的數據我們得刪除
3)選擇模型:建立解決問題的算法
4)訓練模型:將建立的模型進行訓練,使其達到最優
5)模型評估:對模型進行驗證
6)測試模型:在測試環境下對模型進行測試驗證
7)應用模型
8)模型維護
3.機器學習的基本問題
1)回歸問題:根據某種性能最佳的模型,將未知的輸入輸出帶入模型,得到連續的輸出
2)分類問題:同上,得到離散的輸出
3)聚類問題
4.機器學習的核心問題
1)建模問題:根據已知條件得到模型,如根據離散點得到y=x
2)評估問題:損失函數=預測值-真實值,將損失函數(loss function)優化到最小,則說明預測值最接近真實值;
①均方差=真實值與預測值的差的平方和再處于真實值的個數,均方差E即為損失函數,對其求導,當導數為0時,即得到損失函數取得函數極值時自變量的值
②交叉熵
3)優化問題:通過對數據的反復錘煉,梯度下降法
loss function = f(x,y)
?
5.線性回歸
1)概念:一種通過已知自變量和因變量的關系,創建一個最優的線性關系模型,如下圖,求出w0、w1,函數,隨機給一個未知的x,就可以求出對應的f(x)值
2)思想:創建模型,找到最優的參數,而得到最優參數的方法,有迭代法和梯度下山法
以下是一個做線性回歸的代碼示例
樣本:
代碼:
?
?
?
?
?
?
?
?
?
?
?