model.classifier 通常指模型的分類頭 是什么,詳細舉例說明在什么部位,發揮什么作用
在深度學習模型中,分類頭(Classifier Head)是指模型末端用于完成分類任務的組件,通常是一個或多個全連接層(線性層)。它的作用是將模型提取的高層語義特征映射到具體的分類標簽空間。
一、分類頭的技術本質
1. 結構組成
- 核心組件:一個或多個全連接層(
nn.Linear
),可能包含激活函數(如ReLU)、Dropout層等正則化組件。 - 輸入:模型主干(Backbone)輸出的特征向量(如BERT的
CLS
token embedding、CNN的全局池化特征)。 - 輸出:分類概率分布(通過Softmax激活)或未歸一化的對數概率(Logits)。