思維鏈的 內部機制和簡單理解
思維鏈是對解決問題的步驟進行規劃,規劃后將作為上下文 在LLM中繼續輸出。因為Transform都是一個一個單詞生成,沒新生成一個單詞都會將新生的作為上下文。
可以這么理解,但更準確的簡化描述是:
思維鏈是讓模型在回答問題時,先“內部生成”或“外顯輸出”一個“分步思考過程”,再基于這個過程推導出答案。
核心邏輯:
- 不是簡單的“先 生成再輸入”,而是模型在處理問題時,主動模擬人類拆解問題、逐步推理的思維路徑(類似大腦“先想清楚步驟,再得出結論”)。
- 思考過程可以是隱性的(模型內部計算時分步處理),也可以是顯性的**(通過提示讓模型把思考過程寫出來,如“首先…其次…最后…”)。
舉個簡單例子:
問題:“18÷3×2等于多