目錄:
- 一、監督學習:
- 1.什么是監督學習:
- 2.監督學習類型:
- 二、無監督學習
- 1.什么是無監督學習:
- 2.無監督學習類型:
一、監督學習:
1.什么是監督學習:
- 當前創造市場價值的機器學習中99%都是監督學習。
- 監督學習是指學習從input到output映射的算法,監督學習的關鍵是開發者提供供模型訓練的示例。
- 在訓練階段開發者需給定輸入input和正確的輸出output供模型訓練,模型從輸入、輸出對中學習之后,在預測階段模型只需接收輸入未知input就會給出合理的預測值output。
2.監督學習類型:
- 分類 Classification 有限種預測結果
- 回歸 Regression 無限種預測結果
- 區別:分類問題預測輸出的是有限集合(輸入腫瘤數據預測A、B、C類[有限類型]腫瘤);回歸問題預測輸出的是無限集合(輸入負荷數據預測用電量值[∈R])。
二、無監督學習
1.什么是無監督學習:
- 無監督學習是指開發者僅提供input輸入,而不給定output真實值標簽,由模型自主學習input中的數據集,給出數據中可能存在的模式或結構。
- 例如:監督學習給出input:腫瘤大小、患者年齡,output:腫瘤類型,模型學習Input和output后再對未知的input預測其output。而無監督學習給出input:腫瘤大小、患者年齡,不提供output,模型僅學習input來獲取數據中的一些模式(模型學習后可能會將數據分為好幾組)。
- 再例如:在監督學習時候,我可能會對模型說:“我現在給你歷史病人的腫瘤數據input和這些腫瘤分別是什么類型的真實output,你需要學習他們,以便于你能幫我預測今天剛來檢查腫瘤的病人,即給你他們的腫瘤數據你能幫我預測今天的病人腫瘤的類型”;在非監督學習的時候,我可能會說:“我現在給你歷史病人的腫瘤數據input,這些數據太多太雜亂了,你能學習一下然后找到這些歷史腫瘤數據中的相關性并將他們歸類嗎”。
- 監督學習需提供input和output,非監督學習僅提供input。監督學習和無監督學習的區別就在于是否提供output真實值標簽供模型學習,是否帶有對未知數據的預測性質。
2.無監督學習類型:
- 聚類 Clustering:模型根據開發者提供的input(而不提供標簽)根據數據的相似度將數據分成多個組,例如谷歌通過聚類算法可以將每天的上萬條新聞按照詞條和相關度歸類顯示。(這里注意區分與監督學習中的分類問題區別,即有無標簽,是否帶有對未知數據的預測性質)
- 異常檢測 Anomaly detection
- 降維 Dimensionality reduction
- 區別:聚類問題