1.明確概念:人工智能>機器學習>深度學習,三者的關系是包含關系,如圖所示:
人工智能(AI),很寬泛的概念,是研發用于模擬,延展和擴展人的智能的理論,方法,技術及應用系統的一門新的技術科學。而機器學習(Machine Learning)是當前比較有效的實現人工智能的方式。深度學習(DL)是機器學習算法中最熱門的分支,這些年取得顯著進展,并替代了大多數傳統機器學習算法。
2.機器學習的實現原理:
機器學習的實現可以分為兩步:訓練和預測,類似與歸納和演繹;
歸納(訓練):從具體案例中抽象出一般規律,機器學習中的“訓練”也是如此,從模型輸入x和模型輸出y中學習y和x的關系,某種規律體現為表達式;
演繹(預測):從一般規律推導出具體案例的結果,基于訓練得到y與x的關系,出現新的輸入x計算得出y,通過模型計算輸出和真實的輸出一致,則說明模型有效;
機器學習的實施方法:機器思考過程中確定模型的三個關鍵要素:假設,評價,優化;
合理的假設可以最大化解釋已知數據,因此,模型有效的基本條件是 能夠擬合已知的樣本;
衡量模型預測值和真實值差距的評價函數也被稱為損失函數;
最小化損失是模型的優化目標,實現最小化損失的方法稱為優化算法。
模型假設,評價函數(損失/優化目標)和優化算法是構成模型的三個關鍵要素;
機器執行學習任務的框架體現了其學習的本質是“參數估計”;
3.深度學習
相比傳統的機器學習算法,深度學習做出了哪些改進呢?其實兩者在理論結構上是一致的,即:模型假設、評價函數和優化算法,其根本差別在于假設的復雜度。
神經網絡的基本概念
人工神經網絡包括多個神經網絡層,如:卷積層、全連接層、LSTM等,每一層又包括很多神經元,超過三層的非線性神經網絡都可以被稱為深度神經網絡。通俗的講,深度學習的模型可以視為是輸入到輸出的映射函數,如圖像到高級語義(美女)的映射,足夠深的神經網絡理論上可以擬合任何復雜的函數。因此神經網絡非常適合學習樣本數據的內在規律和表示層次,對文字、圖像和語音任務有很好的適用性。這幾個領域的任務是人工智能的基礎模塊,因此深度學習被稱為實現人工智能的基礎也就不足為奇了。
神經網絡的基本結構:
- 神經元:?神經網絡中每個節點稱為神經元,由兩部分組成:
- 加權和:將所有輸入加權求和。
- 非線性變換(激活函數):加權和的結果經過一個非線性函數變換,讓神經元計算具備非線性的能力。
- 多層連接:?大量這樣的節點按照不同的層次排布,形成多層的結構連接起來,即稱為神經網絡。
- 前向計算:?從輸入計算輸出的過程,順序從網絡前至后。
- 計算圖:?以圖形化的方式展現神經網絡的計算邏輯又稱為計算圖,也可以將神經網絡的計算圖以公式的方式表達:
Y=f3(f2(f1(w1?x1+w2?x2+w3?x3+b)+…)…)…)Y=f3?(f2?(f1?(w1??x1?+w2??x2?+w3??x3?+b)+…)…)…)
由此可見,神經網絡并沒有那么神秘,它的本質是一個含有很多參數的“大公式”。如果大家感覺這些概念仍過于抽象,理解的不夠透徹,先不用著急,下一章會以“房價預測”為例,演示使用Python實現神經網絡模型的細節。