1.計算機認識圖像的方式:都是數字。例如一個 128X128 的3通道的圖片 是由 ?128X128X3個數字 組成的。
2.面臨的難點:一幅圖可以說明。
?
3.分類器
A:Nearest Neighbor Classifier:與CNN無關,但是可以幫助我們理解一下分類器。僅用標簽比較。
L1 ?distance:d1(I1,I2)=相減求和,
L2 distance:d2(I1,I2)=相減平方,求和 開方。
B:k - Nearest Neighbor Classifier ?:找出代表性的,K是尋找能夠代表標簽的數目。這樣的話就更加具有抵抗性。減輕無關東西的影響。
?KNN 與 NN的比較
參數k的選擇
超參數的概念:不是利用l1范數 ,L2范數。用點積等其他方法來決定的參數。
測試集是不能用來參與調優的。
從訓練集中抽取一部分調優,稱為驗證集(validation set)、、
交叉驗證:如果訓練集太小,把訓練集分成5分,交叉訓練。
3.1分類器的優缺點:測試時間不夠短,
需要記住所有的訓練數據,與測試數據比較,這樣子就很浪費空間。需要將測試數據一個一個比較,計算量大、、
?