【Token系列】14｜Prompt不是文本，是token結構工程

14｜Prompt不是文本，是token結構工程

副標題：理解Prompt寫法，先理解它如何被切分成token和影響Attention結構

語言模型不會“按人類的語義”理解Prompt，而是按其被切分成的token結構來處理。

例子：

Prompt A: 請你給我寫一個優美的詩句。
Prompt B: 幫我寫詩。

你覺得A更有禮貌，但模型可能：

token結構密度 = 在有限token中，信息是否集中、分布是否便于模型識別

例子：

① “你能否幫我生成一個關于春天的句子？”  
② “生成：春天 句子”

Transformer中的Self-Attention結構如下：

attention(Q, K, V) = softmax(QK^T / √d) * V

如果Prompt寫法導致：

→ 這些都直接干擾模型的注意焦點。

你輸入了100個token，不代表信息量高。例子：

A: “請問你能否為我推薦一些在春天適合閱讀的書籍？”
B: “推薦：春天 讀書”→ 模型看到的有效token：
- A中“你能否”“適合”拆成多個token，句式冗余；
- B中核心token“推薦”“春天”“讀書”高密度排列 → 更有效；

場景	優化策略
復雜指令	拆分為結構清晰的token塊，如“目標：”“范圍：”
信息稀釋	刪除客套與冗語，如“你能不能幫我…”，“請問…”
多輪對話	用標記提示結構變化，如“歷史對話：”“當前任務：”
控制生成結果	使用明確指令token，如“格式為：”“使用markdown”

用tokenizer工具查看token化結果

示例：
輸入：“你能不能幫我推薦一本書”
→ token列表：[“你”, “能”, “不”, “能”, “幫”, “我”, “推”, “薦”, “一”, “本”, “書”]
→ 說明部分詞被拆分，結構松散，可優化為：“推薦一本書”
檢查高信息詞是否被切斷

示例：
“Transformer模型如何工作” → 若“Transformer”被拆成多token，建議拼寫統一（如用“transformer”英文）
檢查是否用過多低信息詞填充Prompt空間

示例：
“請問你可不可以幫我完成一項簡單的小小的工作？”
→ 可壓縮為：“完成一項任務”
控制總token數，讓高密度token盡可能靠后

示例：
將“以下是背景信息…”提前，將任務問題壓到Prompt結尾，以避免截斷影響回答質量。
優化關鍵詞順序，讓Q能高效與K建立attention連接

示例：
不推薦：“你在上文中說過……” → 模型找不到“上文”；
推薦：“請解釋以下內容：‘你上次提到的觀點是……’” → 提示結構更穩定，關鍵詞更集中。

Prompt不是“你說了什么”，而是“你輸入了哪些token”：

語言模型不理解禮貌，它只理解結構密度。

理解Prompt的token結構，是LLM時代寫作與指令工程的第一課。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/79071.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/79071.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/79071.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！