【Token系列】14|Prompt不是文本,是token結構工程

文章目錄

  • 14|Prompt不是文本,是token結構工程
    • 一、很多人寫的是“自然語言”,模型讀的是“token序列”
    • 二、Prompt寫法會直接影響token結構密度
    • 三、token分布影響Attention矩陣的聚焦方式
    • 四、token數 ≠ 有效信息量
    • 五、Prompt結構設計建議(以token為單位思考)
    • 六、實戰小結:如何檢查Prompt是否結構良好?
    • 七、結語

14|Prompt不是文本,是token結構工程

副標題:理解Prompt寫法,先理解它如何被切分成token和影響Attention結構


一、很多人寫的是“自然語言”,模型讀的是“token序列”

語言模型不會“按人類的語義”理解Prompt,而是按其被切分成的token結構來處理。

例子:

Prompt A: 請你給我寫一個優美的詩句。
Prompt B: 幫我寫詩。

你覺得A更有禮貌,但模型可能:

  • 更關注“寫”和“詩”這些關鍵詞;
  • “請你”、“優美”可能被切成多個token,被稀釋掉;
  • 如果Prompt太長,有效信息被Attention平均掉,影響理解。

二、Prompt寫法會直接影響token結構密度

token結構密度 = 在有限token中,信息是否集中、分布是否便于模型識別

例子:

① “你能否幫我生成一個關于春天的句子?”  
② “生成:春天 句子”
  • ① token數量多,但語義分散,可能有20個token,模型注意力稀釋;
  • ② 精準關鍵詞更少token,密度高,注意力集中,更易觸發相關生成。

三、token分布影響Attention矩陣的聚焦方式

Transformer中的Self-Attention結構如下:

attention(Q, K, V) = softmax(QK^T / √d) * V
  • Q來自當前token;
  • K來自所有token。

如果Prompt寫法導致:

  • 無效token太多 → Q對無關K打分;
  • 關鍵詞不突出 → 無法獲得高attention值;
  • token靠前還容易被截斷;

→ 這些都直接干擾模型的注意焦點。


四、token數 ≠ 有效信息量

你輸入了100個token,不代表信息量高。例子:

A: “請問你能否為我推薦一些在春天適合閱讀的書籍?”
B: “推薦:春天 讀書”→ 模型看到的有效token:
- A中“你能否”“適合”拆成多個token,句式冗余;
- B中核心token“推薦”“春天”“讀書”高密度排列 → 更有效;

五、Prompt結構設計建議(以token為單位思考)

場景優化策略
復雜指令拆分為結構清晰的token塊,如“目標:”“范圍:”
信息稀釋刪除客套與冗語,如“你能不能幫我…”,“請問…”
多輪對話用標記提示結構變化,如“歷史對話:”“當前任務:”
控制生成結果使用明確指令token,如“格式為:”“使用markdown”

六、實戰小結:如何檢查Prompt是否結構良好?

  1. 用tokenizer工具查看token化結果

    示例:
    輸入:“你能不能幫我推薦一本書”
    → token列表:[“你”, “能”, “不”, “能”, “幫”, “我”, “推”, “薦”, “一”, “本”, “書”]
    → 說明部分詞被拆分,結構松散,可優化為:“推薦一本書”

  2. 檢查高信息詞是否被切斷

    示例:
    “Transformer模型如何工作” → 若“Transformer”被拆成多token,建議拼寫統一(如用“transformer”英文)

  3. 檢查是否用過多低信息詞填充Prompt空間

    示例:
    “請問你可不可以幫我完成一項簡單的小小的工作?”
    → 可壓縮為:“完成一項任務”

  4. 控制總token數,讓高密度token盡可能靠后

    示例:
    將“以下是背景信息…”提前,將任務問題壓到Prompt結尾,以避免截斷影響回答質量。

  5. 優化關鍵詞順序,讓Q能高效與K建立attention連接

    示例:
    不推薦:“你在上文中說過……” → 模型找不到“上文”;
    推薦:“請解釋以下內容:‘你上次提到的觀點是……’” → 提示結構更穩定,關鍵詞更集中。


七、結語

Prompt不是“你說了什么”,而是“你輸入了哪些token”:

語言模型不理解禮貌,它只理解結構密度。

理解Prompt的token結構,是LLM時代寫作與指令工程的第一課


本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/79071.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/79071.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/79071.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

研發效率破局之道閱讀總結(4)個人效率

研發效率破局之道閱讀總結(4)個人效率 Author: Once Day Date: 2025年4月30日 一位熱衷于Linux學習和開發的菜鳥,試圖譜寫一場冒險之旅,也許終點只是一場白日夢… 漫漫長路,有人對你微笑過嘛… 全系列文章可參考專欄: 程序的藝術_Once-Day…

CNN代碼詳細注釋

import torch from torch import nn#定義張量x,它的尺寸是5x1x28x28 #表示了5個單通道28x28大小的數據 xtorch.zeros([5,1,28,28])#定義一個輸入通道是1,輸出通道是6,卷積核大小是5x5的卷積層 convnn.Conv2d(in_channels1,out_channels6,ker…

機器指標監控技術方案

文章目錄 機器指標監控技術方案架構圖組件簡介Prometheus 簡介核心特性適用場景 Grafana 簡介核心特性適用場景 Alertmanager 簡介核心特性適用場景 數據采集機器Node ExporterMySQL ExporterRedis ExporterES ExporterRocketMQ ExporterSpringcloud ExporterNacos 數據存儲短期…

【Office-Excel】單元格輸入數據后自動填充單位

1.自定義設置單元格格式 例如我想輸入數字10,回車確認后自動顯示10kg。 右擊單元格或者快捷鍵(Ctrl1),選擇設置單元格格式,自定義格式輸入: 0"kg"格式仍是數字,但是顯示是10kg&…

JavaScript的3D庫有哪些?

JavaScript的3D庫有哪些? 在3D開發領域,JavaScript提供了多種庫和框架,使開發者能夠在瀏覽器中創建豐富的3D體驗。以下是一些流行的3D方面的JavaScript庫: Three.js:這是最著名的用于創建3D圖形的JavaScript庫之一。它…

中央網信辦部署開展“清朗·整治AI技術濫用”專項行動

為規范AI服務和應用,促進行業健康有序發展,保障公民合法權益,近日,中央網信辦印發通知,在全國范圍內部署開展為期3個月的“清朗整治AI技術濫用”專項行動。 中央網信辦有關負責人表示,本次專項行動分兩個階…

論文閱讀:2024 arxiv Jailbreaking Black Box Large Language Models in Twenty Queries

總目錄 大模型安全相關研究:https://blog.csdn.net/WhiffeYF/article/details/142132328 Jailbreaking Black Box Large Language Models in Twenty Queries https://www.doubao.com/chat/4008882391220226 https://arxiv.org/pdf/2310.08419 速覽 這篇論文是來…

零基礎學指針2

零基礎學指針---大端和小端 零基礎學指針---什么是指針 零基礎學指針---取值運算符*和地址運算符& 零基礎學指針---結構體大小 零基礎學指針5---數據類型轉換 零基礎學指針6---指針數組和數組指針 零基礎學指針7---指針函數和函數指針 零基礎學指針8---函數指針數組…

《Python實戰進階》 No46:CPython的GIL與多線程優化

Python實戰進階 No46:CPython的GIL與多線程優化 摘要 全局解釋器鎖(GIL)是CPython的核心機制,它保證了線程安全卻限制了多核性能。本節通過concurrent.futures、C擴展優化和多進程架構,實戰演示如何突破GIL限制&#…

Golang實現函數默認參數

golang原生不支持默認參數 在日常開發中,我們有時候需要使用默認設置,但有時候需要提供自定義設置 結構體/類,在Java我們可以使用無參、有參構造函數來實現,在PHP中我們也可以實現(如 public function xxx($isCName false, $sec…

Chrome 136 H265 WebRTC 支持 正式版本已包含

時間過的真快,去年8月份寫過一篇文章介紹如何加參數方式啟動Chrome H265 硬件解碼器, 現在的136版本已經包含在內,至此WebRTC已經完整包含了H264和H265解碼器,這個事情應該從2015年開始,Google強推VP9 AV1&#xff0c…

12.SpringDoc OpenAPI 功能介紹(用于生成API接口文檔)

12.SpringDoc OpenAPI 功能介紹(用于生成API接口文檔) SpringDoc OpenAPI 是一個基于 OpenAPI 3.0/3.1 規范的工具,用于為 Spring Boot 應用生成 API 文檔。它是 springfox(Swagger 2.x)的現代替代方案,完全支持 Spring Boot 3.x…

CentOS Linux 環境二進制方式安裝 MySQL 5.7.32

文章目錄 安裝依賴包新建用戶解壓初始化配置文件啟動服務登錄MySQL修改密碼停止數據庫 安裝依賴包 yum -y install libaio perl perl-devel libncurses* autoconf numactl新建用戶 useradd mysql解壓 tar xf mysql-5.7.32-linux-glibc2.12-x86_64.tar.gz mv mysql-5.7.32-l…

Webug4.0通關筆記06- 第8關CSV注入

目錄 CSV注入漏洞 1.CSV漏洞簡介 2.漏洞原理 (1)公式執行 (2)DDE機制 (3)OS命令執行 3.漏洞防御 第08關 CSV注入 1.打開靶場 2.修改源碼 3.注入命令 4.導出excel表 5.打開excel表 CSV注入漏洞…

Windows和 macOS 上安裝 `nvm` 和 Node.js 16.16.0 的詳細教程。

Windows和 macOS 上安裝 nvm 和 Node.js 16.16.0 的詳細教程。 --- ### 1. 安裝 nvm(Node Version Manager) nvm 是一個 Node.js 版本管理工具,可以輕松安裝和切換不同版本的 Node.js。 #### Windows 安裝 nvm 1. **下載 nvm 安裝包**&#x…

[特殊字符] 藍橋杯省賽全解析:含金量、獲獎難度、參賽意義與發展價值全面剖析

藍橋杯省賽剛剛落幕,不論你是剛參加完比賽的同學,還是還在觀望是否值得投入時間去準備藍橋杯的學生,相信你都關心: 藍橋杯到底值不值得參加? 獲獎難不難?含金量如何? 和其它算法競賽相比有什么…

ASP.NET MVC后端控制器用模型 接收前端ajax數據為空

1、前端js代碼 如下: const formData {DeptName: D001,Phone: 12345678900 };$.ajax({url: "/Phone/SavePhone1",type: "POST",contentType: "application/json",data: JSON.stringify(formData), //必須要JSON.stringifysuccess:…

擁抱 Kotlin Flow

1. 引言 Kotlin Flow 是 Kotlin 協程生態中處理異步數據流的核心工具,它提供了一種聲明式、輕量級且與協程深度集成的響應式編程模型。與傳統的 RxJava 相比,Flow 更簡潔、更易于維護,尤其在 Android 開發中已成為主流選擇。本文將從基礎概念…

精益數據分析(34/126):深挖電商運營關鍵要點與指標

精益數據分析(34/126):深挖電商運營關鍵要點與指標 在創業和數據分析的學習之旅中,我們都在不斷探尋如何讓業務更上一層樓。今天,我依舊帶著和大家共同進步的想法,深入解讀《精益數據分析》中電商運營的關…

Learning vtkjs之ImageCropFilter

過濾器 圖片數據體積裁剪 介紹 vtkImageCropFilter可以裁剪vtkImageData。這只適用于IJK對齊的平面。 請注意,由于CPU限制的裁剪,這在大型數據集上會很慢。 效果 核心代碼 需要實現這個代碼主要邏輯 1、設定的crop的包圍盒 其實主要是IMax IMin JM…