LLM 中的 溫度怎么控制隨機性的?
在LLM的解碼過程中,溫度(Temperature)通過調整token概率分布的“陡峭程度”來控制隨機性:溫度越低,概率分布越陡峭(高概率token的優勢越明顯),隨機性越低;溫度越高,分布越平緩(高低概率token的差異被縮小),隨機性越高。
溫度,top p top k 超參數都是在最后一層控制logist的
一、溫度控制隨機性的核心原理
LLM輸出的原始概率由logits通過softmax函數計算得到,而溫度直接作用于logits,改變最終的概率分布。公式如下:
-
原始概率計算(無溫度):
概率(token) = softmax(logits) = exp(logits) / Σexp(logits)
-
帶溫度的概率計算:
概率(token) = softmax(logits / 溫度) = exp(logits / 溫度) / Σexp(logits / 溫度)
溫度(用τ
表示)的核心作用是縮放logits的數值范圍,進而改變softmax后的概率分布形狀:
- 當
τ < 1
(如0.5):logits被放大(l