人工智能的兩大任務——預測和決策
預測包括對輸入目標的模式識別、標簽分類、回歸、預測未來數據、聚類
決策需要機器產生行動,改變狀態,如下圍棋、自動駕駛
支持人工智能的四大類技術
搜索——結合算法探索分支的好壞,從而做出決策,如下棋
推理——基于給定的知識歸納出規律完成證明、知識問答
學習——通過經驗數據對目標優化的自動化過程,如人臉識別
博弈——多個人工智能體的交互,如足球配合
可以這樣子說“學習是系統基于數據來提升既定指標分數的過程”
機器學習的三大類——監督學習、無監督學習、強化學習
監督學習:數據實例有(x,y)即特征x和標簽y,根據特征來預測標簽,由損失函數來定義性能指標。如人臉識別,關注這個人臉圖像是否準確預測對應的身份
無監督學習:沒有標簽y了,主要關注數據的分布,包含的模式。如關注人臉圖像的分布,判斷這個圖像是否包含人臉
強化學習:關注人工智能的決策問題,尋找更好的決策過程
機器學習模型的泛化能力是什么呢?
泛化能力:描述一個只能模型在沒有見過的數據上的預測能力,用泛化誤差來衡量模型的泛化能力,也就是說機器學習模型見過很多數據,對于新的數據也可以預測,就是因為經驗豐富,見過很多數據的底氣!這個叫做統計泛化能力
機器學習的模型天賦
也就是說面對不同的任務需要選擇較為準確的模型來做,怎么選擇模型呢,就要看機器學習模型的特點,也叫歸納偏置,字面大概意思就是說他們的歸納的一個偏好。也就是是模型對問題的假設是這樣子的,如果你的數據也是這樣子,那這個模型很適合。
ps:如果歸納偏置更強的模型可以更好的發現數據的模式。
神經網絡對同分布領域的數據歸納偏置高,所以在處理圖像和語音很適合,但是樹模型對混合離散的數據偏置高,就很適合做風險預測什么的。
機器學習的限制
數據限制,數據量可能很難滿足
泛化能力的限制:可能統計泛化能力不太完全滿足需要,需要組合泛化能力
使用形態限制:因為我們現在主要的是通過輸入數據訓練模型,輸出訓練好的模型