機器學習概述
機器學習的本質
- 機器學習是為了設計解決問題的算法。
- 為輸入與輸出建立某種映射:
-
類似于函數關系:
Y = f ( X ) Y=f(X) Y=f(X)
-
不同的映射方法體現了不同的思想。
-
- 為輸入與輸出建立某種映射:
相關概念
- 深度學習是機器學習的一個分支
- 深度學習是深層次化的神經網絡。
- 神經網絡是機器學習的組成部分。
- 數據挖掘 Data Mining
- 機器學習方法在大數據庫中的應用稱為數據挖掘
- 模式識別 Pattern Recognition
模式:對應一個實體的類別。- 識別的效果依賴于分類模型的種類和模型的訓練;分類模型的訓練就是一種機器學習過程
經典應用
- 關聯性:
- 多個事件之間的關聯。關聯規則(Association Rule)。體現統計學上的條件概率 P ( Y ∣ X ) P(Y|X) P(Y∣X)。
- 分類
- 回歸分析
機器學習的種類
- 有監督學習
- 學習過程沒有指導,提供先驗信息。
- 貝葉斯模型、支持向量機、決策樹、神經網絡。
- 主要用于分類和回歸分析。
- 無監督學習
- 學習過程沒有任何指導。
- 輸入的學習樣本沒有任何先驗知識。
- 統計學中稱之為密度估計(density estimation)。
- 數據挖掘中稱之為聚類(clusting)。
- 強化學習
- 通過學習選擇能達到其目標的最優動作。
- 從環境到行為映射的學習,以使獎勵信號(強化信號)函數值最大。
- 單個動作不重要,重要的是策略,即達到目標的正確動作的序列。