二分類
1. 核心定義
二分類任務是監督學習中最基礎的問題類型,其目標是將樣本劃分為兩個互斥類別。設樣本特征空間為 X ? R n \mathcal{X} \subseteq \mathbb{R}^n X?Rn,輸出空間為 Y = { 0 , 1 } \mathcal{Y} = \{0,1\} Y={0,1},學習目標為建立映射關系:
f : X → Y f: \mathcal{X} \to \mathcal{Y} f:X→Y
1.1以識別貓咪為例
在計算機中,這張圖片需要三個矩陣進行表示,分別對應紅、綠、藍三種通道,如果它是一張像素為64的圖片,則每個矩陣為64*64的矩陣,分別對應紅、綠、藍三種顏色的強度值。定義特征向量 x \mathcal{x} x來表示這張圖片:把這三個向量中的所有像素取出放入同一個矩陣中,則這個特征向量的維度是64 * 64 * 3,也就是nx=64 * 64 * 3。
符號定義說明:
x \mathcal{x} x :表示一個輸入數據,維度為(nx,1)
y \mathcal{y} y :表示一個輸出結果,取值為(0,1)
( x ( i ) , y ( i ) \mathbf{x}^{(i)},\mathbf{y}^{(i)} x(i),y(i)):表示第i組數據,此處默認為訓練數據。(測試數據)
X=[ x ( 1 ) , x ( 2 ) , . . . , x ( m ) \mathbf{x}^{(1)},\mathbf{x}^{(2)},...,\mathbf{x}^{(m)} x(1),x(2),...,x(m)]: 表示所有訓練數據的輸入值,放在一個(nx,m)的矩陣中。
Y=[ y ( 1 ) , y ( 2 ) , . . . , y ( m ) \mathbf{y}^{(1)},\mathbf{y}^{(2)},...,\mathbf{y}^{(m)} y(1),y(2),...,y(m)]: 表示所有訓練數據的輸出值,放在一個(1,m)的矩陣中。
( x , y \mathcal{x},\mathcal{y} x,y ):表示單個樣本。
Mtrain:表示由m個單獨的樣本組成訓練集; {( x ( 1 ) , y ( 1 ) \mathbf{x}^{(1)},\mathbf{y}^{(1)} x(1),y(1)), x ( 2 ) , y ( 2 ) \mathbf{x}^{(2)},\mathbf{y}^{(2)} x(2),y(2),…, x ( m ) , y ( m ) \mathbf{x}^{(m)},\mathbf{y}^{(m)} x(m),y(m)};(Mtest)