- 卷積操作原理:
- 特征向量與遍歷:假設已知特征向量(如藍天白云、綠油油草地特征),在輸入圖像的各個區域進行遍歷,通過計算內積判斷該區域是否有想要的特征。
- 內積計算特征:內積為 0 表示兩個向量垂直,關系不好,無想要的特征;夾角越小,內積越大,代表區域中有想要的特征,可根據內積大小賦予不同特征值。
- 特征圖生成:多個特征(如藍天白云和綠油油草地特征)分別與輸入圖像各區域算內積,得到的值組合成特征圖。
- 卷積核與權重:
- 卷積核概念:卷積核也叫權重,不是人為確定,可隨機初始化,代表嘗試提取的特征。
- 權重更新:通過反向傳播更新權重,依據當前特征預測結果與實際標簽的損失來調整特征提取。
- 卷積計算的參數:
- 輸入數據:輸入圖像數據有長、寬和顏色通道(如 7×7×3)。
- 卷積核參數:卷積核數值隨機初始化,大小(如 3×3、5×5 等)可自定義,通道數必須與輸入通道數相同。
- 內積計算:對應位置相乘再求和,算完內積后加偏置得到特征值。
- 步長與卷積核大小:步長越小,得到特征個數越多;卷積核通常用 3×3,較為高效、參數少且英偉達對其優化好。
- 邊界填充:為使邊界特征利用更公平,在輸入數據周邊加 0 進行邊界填充。
- 卷積層特征變化:
- 局部到全局:第一層卷