LLM 置信度增強:是否可以增強最后的隱藏層(非logits層)
表征工程是提取隱藏層狀態表征,LLM的置信度增強是優化的logist數值
要回答“是否可以增強最后的隱藏層(非logits層)以及是否有意義”,需要結合大語言模型的結構特性、你當前的任務(情感分析)以及“隱藏層增強”的核心目標來分析。
結論是:技術上完全可行,且在特定場景下有明確意義,但效果需結合實驗驗證,且需注意與中間層增強的差異。結果不優秀,
一、先明確概念:“最后的隱藏層”指什么?
使用的Qwen2等Transformer架構的大語言模型中:
- 中間隱藏層:指Transformer層(
model.model.layers[0]
到model.model.layers[-2]
)的輸出,負責逐步從文本中提取特征(從低級的詞法特征到中級的句法特征)。 - 最后的隱藏層:指最后一個Transformer層(
model.model.layers[-1]
)的輸出,是輸入到輸出層(如logits層)之前的最終隱藏狀態。它包含最高級、最整合的語義特征****(如情感傾向、整體語義等),直接影響后續輸出。