1.學習問題的分類
- 有監督的學習
- 分類
- 回歸
- 無監督學習
- 聚類
- 密度估計:確定輸入空間中的數據的分布
- 可視化:把高位空間中的數據投影到二維或三維空間
- 強化學習
- 不給定最優輸出的示例,而是通過試錯發現最優輸出
2.泛化versus過度擬合
背景引入:多項式曲線擬合
目標函數:
損失函數:最小平方和
- 泛化:正確預測不同于用于訓練的數據的新觀察的能力
- 過擬合:目標函數的模型y過度擬合訓練數據,如果存在一個可選的模型y‘滿足
,
但是
其中,是訓練數據上的誤差,而
是整個數據分布上的誤差
- 欠擬合
3.用于模型比較的測試集
- 測試集:一個獨立的數據集,可以獲得泛化性能對M的依賴的一些定量的領悟。
- root-mean-square(RMS) error 均方根誤差
- 除以N使得我們能夠在平等的基礎上比較不同大小的數據集
- 開放確保
與目標變量t具有同樣的尺度和量綱
4.Regularization正則化
- 一種常用于控制過擬合現象的技術
- 給誤差函數添加一個懲罰項,以阻止系數達到大的值
- 其中
- 并且系數λ控制正則化項與平方和誤差項相比的相對重要性。
5.驗證集
達成模型復雜度的適合的值的一種簡單方法,通過把可用的數據劃分成:
- 一個訓練集,用于確定系數w
- 一個驗證集,也叫做hold-out set,用于優化模型復雜度(要么M,要么λ)
訓練集:確定模型參數w
測試集:評價模型泛化性質
驗證集:調節模型超參M
6.Gaussian Distribution 高斯分布
單個實值變量x的情形,高斯分布定義為
式中??是均值(mean),
?是方差(variance),方差的平方根?
叫做標準誤(standard deviation),方差的倒數?
?叫做精度(precision)。
7.Gaussian Parameter Estimation
- 數據集
,表示標量x的N個觀察。
- 數據獨立地從同一個高斯分布采樣得到,均值和方差未知。
- 利用數據集確定高斯分布的參數。
- 由于數據集
獨立同分布,因此,給定μ和方差σ2,數據集的概率(似然)
8.Maximum(Log) Likelihood 最大似然估計
- 對數似然函數
- 最大似然解
- 樣本均值??
- 樣本方差?
- 樣本均值??
9.Limitations of the Maximum Likelihood Approach
- 系統地低估分布的方差
? (有估計偏差)
- 和過擬合有密切關系