有監督學習
目標:建立一個模型(函數),來描述輸入(x)和輸出(y)之間的映射關系。
價值:模型訓練完成后,新的輸入,模型會給出預測值輸出。
- 注意點:
1.要有足夠的訓練樣本
2.輸入和輸出之間有關聯關系
3.輸入和輸出可以數值化表示
有監督學習的應用
- 文本分類
輸入:文本
輸出:類別 - 機器翻譯
輸入:A語言文本
輸出:B語言文本 - 圖像識別
輸入:圖像
輸出:類別 - 語音識別
輸入:音頻
輸出:文本
無監督學習
目標:提供無標注數據,使用算法對數據分析處理,得到結論
無監督學習的應用
- 聚類
- 降維
- 找特征值
常用概念
- 過擬合
模型失去了泛化能力。模型再訓練集和驗證集上表現好,在測試集上表現差,一般是過擬合。 - 欠擬合
模型沒能在輸入和輸出之間建立起合理的映射。輸入訓練集,輸出預測與標注結果依然相差很大。 - 評價指標
準確率
召回率
F1值
Topk
總結
機器學習本質:從已知數據中找規律,用來預測未知的樣本。
深度學習:是機器學習的一種方法。