概論:
機器學習是對研究問題進行模型假設,利用計算機從訓練數據中學習得到模型參數,并最終對數據進行預測和分析,其基礎主要是歸納和統計。
深度學習是一種實現機器學習的技術,是機器學習重要的分支。其源于人工神經網絡的研究。深度學習的模型結構是一種含多隱層的神經網絡。通過組合低層特征形成更加抽象的高層特征。
一.機器學習
二.從簡單線性分類器到深度學習
1.簡單線性分類器
2.深度學習
三、數據集及其拆分
(1)lris(鳶尾花)數據集
打開UCI Machine Learning Repository,下載Iris數據集
上述樣本標簽分為:
(2)類別標簽
ground turth:可翻譯為地面實況。在機器學習領域一般用于表示真實值、標準答案等,表示通過直接觀察收集到的真實結果。
gold standard:可譯為金標準。醫學上一般指診斷疾病公認的最可靠的方法。
在機器學習領域,更傾向于使用“ground truth”。</