11 Prompt 工程進階:Few-shot 與 Chain-of-Thought

11 Prompt 工程進階:Few-shot 與 Chain-of-Thought

前10節總結 & 后10節展望

在前 10 節,我們已經完成了 AI 產品經理的入門階段

  • 1–3:理解了大模型的基本概念、Token、Prompt 基礎;
  • 4–5:體驗了本地部署與 API 調用;
  • 6–8:掌握了 RAG 技術鏈路(Embedding + 向量數據庫),讓模型學會查資料;
  • 9:學會了評估 AI 產品的效果;
  • 10:寫出了第一份 AI 產品 PRD。

可以說,這 10 節我們已經完成了從 “知道 AI 是什么” → “能跑起來一個 Demo” → “能寫出產品文檔” 的過程。

接下來的 第 11–20 節,我們進入 進階階段

  • 深入 Prompt 工程(Few-shot、Chain-of-Thought、模板化);
  • 構建完整的 RAG 系統,并做優化(檢索、向量庫、評估平臺);
  • 體驗多輪對話、流式輸出、Web Demo;
  • 學習如何把技術和 具體行業場景(教育、電商、金融) 結合。

👉 今天(第 11 節)是第二階段的開篇,我們要學習的內容是 Prompt 工程進階技巧


為什么要學習 Prompt 工程?

在第一階段的實驗中,你可能發現:

  • 有時候模型回答很棒,但有時候答得完全跑偏;
  • 問題稍微復雜一點,答案就不靠譜;
  • 同一個問題,不同次回答可能差別很大。

這說明,大模型的表現 高度依賴 Prompt(提示詞)
就像和人交流,如果你說得含糊,對方可能亂猜;但如果你舉例說明、逐步解釋,對方往往理解得更準確。

👉 Prompt 工程就是學習“如何和模型對話”,讓它表現得更穩定、更符合需求。

今天我們重點看兩種方法:

  • Few-shot(少樣本提示):通過給模型一些“示范”,讓它模仿;
  • Chain-of-Thought(思維鏈提示):要求模型“逐步推理”,而不是只給最終答案。

一、核心概念(零基礎友好解釋)

1. Zero-shot vs Few-shot

  • Zero-shot(零樣本):不給示例,直接問問題。
  • Few-shot(少樣本):先給幾個示例,讓模型模仿示例風格或推理方式。

2. Chain-of-Thought(思維鏈)

  • 直譯:讓模型“展示推理過程”。
  • 作用:尤其適合邏輯推理、數學題、復雜業務流程,可以顯著提升準確率。

二、實踐:對比實驗

Python 示例

from openai import OpenAIclient = OpenAI(base_url="http://127.0.0.1:11434/v1", api_key="ollama")def ask(prompt):resp = client.chat.completions.create(model="deepseek-r1",messages=[{"role": "user", "content": prompt}],temperature=0.2)return resp.choices[0].message.content# Zero-shot
q1 = "小明有12個蘋果,給了朋友3個,然后又買了5個,現在有多少個蘋果?"
print("Zero-shot 回答:")
print(ask(q1))# Few-shot
q2 = """示例:
Q: 小紅有10個橙子,吃了2個,還剩多少?
A: 她還剩 8 個橙子。Q: 小王有7支筆,送人2支,還剩多少?
A: 他還剩 5 支筆。現在請回答:
Q: 小明有12個蘋果,給了朋友3個,然后又買了5個,現在有多少個蘋果?
A:"""
print("\nFew-shot 回答:")
print(ask(q2))# Chain-of-Thought
q3 = """請逐步推理:
小明有12個蘋果,給了朋友3個,然后又買了5個,現在有多少個蘋果?"""
print("\nChain-of-Thought 回答:")
print(ask(q3))

預期結果

在學術定義中,三種方式本應區別如下:

  • Zero-shot:只給結果
  • Few-shot:模仿示例,風格更統一
  • CoT:逐步推理,展示步驟

特別說明:為什么 DeepSeek R1 三種方式都輸出了推理過程?

如果你用 DeepSeek R1 跑實驗,可能會發現:

  • Zero-shot / Few-shot / CoT 的回答里都有 <think> 部分;
  • 模型總是自動展示推理過程。

這是因為:

  • DeepSeek R1 是“推理增強模型”,被設計成默認生成思維鏈,即使用戶沒有要求。
  • 這是它的特性,不代表 Zero-shot / Few-shot / CoT 的概念無效。
  • 在代碼里,你可以通過正則去掉 <think> 部分,得到更接近“標準差異”的對比結果。

👉 換句話說:概念依然正確,但模型行為會因實現不同而有所差異。


三、產品經理思考

1. 為什么 PM 要懂 Few-shot 和 CoT?

  • 交互設計:決定用戶是“一問一答”,還是用模版(Few-shot)。
  • 控制風格:通過 Few-shot 可以固定回答口吻(禮貌、專業、簡潔)。
  • 保證準確率:涉及邏輯推理的任務,必須要求模型展示思維鏈。

2. 模型行為差異要注意

  • 有些模型簡潔(GPT-3.5),Zero-shot 只給答案。

  • 有些模型“話多”(DeepSeek R1),會自動展示推理過程。

  • 在 PRD 中要寫清楚:

    • 是否要展示推理過程給用戶?
    • 是否只在后臺保留(便于調試)?
    • 是否需要清理 <think> 標簽,讓用戶只看到最終答案?

3. 案例

  • 教育產品:學生問數學題 → 用 CoT 提示,強制展示步驟。
  • 客服機器人:用 Few-shot 保證禮貌統一。
  • 企業助手:可以保留 <think> 作為調試日志,但前端只展示結果。

四、小結

  • Few-shot:通過示例提升模型模仿能力。
  • Chain-of-Thought:通過逐步推理提升邏輯準確性。
  • DeepSeek R1 默認輸出思維鏈,這是它的特性,不影響我們理解概念。
  • PM 角度:Prompt 工程是“產品體驗的調節閥”,不同模型行為差異本身也是產品設計的考量點。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/921989.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/921989.shtml
英文地址,請注明出處:http://en.pswp.cn/news/921989.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

ARM1.(ARM體系結構)

1.基本概念嵌入式:以應用為心&#xff0c;以計算機技術為礎&#xff0c;軟便件可被的專用計算機系統。計算機系統的軟件基本組成: 系統軟件、應用軟件。計算機系統的硬件基本組成&#xff1a;運算器、控制器、存諸器、輸入設備、輸出設備日常生活中遇到的專業術語&#xff1a…

Django全棧班v1.01 Python簡介與特點 20250910

從零開始的Python編程之旅 “人生苦短&#xff0c;我用Python。”這不僅僅是Python程序員的口頭禪&#xff0c;更是對Python強大能力的最好詮釋&#xff01;&#xff01;&#xff01; 為什么全世界有超過1500萬開發者選擇Python&#xff1f; 為什么Python連續多年蟬聯最受歡…

【WebApi】什么情況開啟如何開啟緩存

在 ASP.NET Core WebAPI 中開啟緩存是優化性能、減少服務器負載和提升用戶體驗的非常重要的手段。但并非所有情況都適合開啟緩存。 下面我將從 “什么情況下開啟” 和 “如何開啟” 兩個方面為你詳細解釋。 一、什么情況下應該開啟緩存? 總的來說,緩存適用于 “變化不頻繁但…

Go語言類型斷言全解析

類型斷言的基本概念類型斷言(Type Assertion)是Go語言中用于檢查接口值底層具體類型的機制。它本質上是一種運行時類型檢查的操作&#xff0c;允許程序在運行時判斷接口變量是否持有特定的類型值&#xff0c;并提取該類型的值。這是Go語言類型系統中的一個重要特性&#xff0c;…

大模型在題目生成中的安全研究:攻擊方法與防御機制

大模型在題目生成中的安全研究&#xff1a;攻擊方法與防御機制 文章目錄大模型在題目生成中的安全研究&#xff1a;攻擊方法與防御機制一、引言二、大模型在題目生成中的安全漏洞與攻擊方法2.1 大模型在題目生成中的安全漏洞分析2.1.1 訓練數據相關漏洞2.1.2 模型架構與特性相關…

跟做springboot尚品甄選項目(二)

登錄功能的書寫 后端接口的書寫 &#xff08;1&#xff09;創建配置文件 粘貼這兩個文件&#xff08;E:\project\AllProJect\Shangpin Selection\項目材料素材\資料\資料\03-配置文件&#xff09; 在spzx-manager服務的src/resources目錄下創建application.yml、application-…

前后端接口調試提效:Postman + Mock Server 的工作流

前后端接口調試提效&#xff1a;Postman Mock Server 的工作流 &#x1f31f; Hello&#xff0c;我是摘星&#xff01; &#x1f308; 在彩虹般絢爛的技術棧中&#xff0c;我是那個永不停歇的色彩收集者。 &#x1f98b; 每一個優化都是我培育的花朵&#xff0c;每一個特性都是…

大帶寬香港云服務器在數據傳輸速度上有何優勢?

為方便站長快速部署網站、優化用戶訪問體驗&#xff0c;當下眾多實力強勁的香港數據中心&#xff0c;均推出了大帶寬云服務器產品。不過&#xff0c;市面上不少數據中心雖宣稱提供 “專屬大帶寬”&#xff0c;但其線路配置中&#xff0c;國際線路占比高、繞行鏈路多&#xff0c…

HT862 智能音頻功率放大器:為便攜音頻設備打造高效穩定的音質解決方案

在藍牙音箱、智能手機、便攜式游戲機等設備的設計中&#xff0c;音頻功率放大器是決定音質表現、續航能力與使用穩定性的關鍵部件。一款優質的音頻功放&#xff0c;不僅需要輸出足夠的功率以滿足清晰響亮的聽覺需求&#xff0c;還需在能效、溫控、適配性上達到平衡&#xff0c;…

HarmonyOS-ArkUI Web控件基礎鋪墊7-HTTP SSL認證圖解 及 Charles抓包原理 及您為什么配置對了也抓不到數據

HarmonyOS-ArkUI Web控件基礎鋪墊6--TCP協議- 流量控制算法與擁塞控制算法 HarmonyOS-ArkUI Web控件基礎鋪墊5--TCP協議- 動畫展示超時重傳&#xff0c;滑動窗口&#xff0c;快速重傳 HarmonyOS-ArkUI Web控件基礎鋪墊4--TCP協議- 斷聯-四次揮手解析 HarmonyOS-ArkUI Web控件…

【qt】通過TCP傳輸json,json里包含圖像

主要是使用協議頭 發送方connect(m_pDetectWorker, &DetectionWorker::sig_detectImg, this, [](const QJsonObject &json){// 轉換為JSON數據QJsonDocument doc(json);QByteArray jsonData doc.toJson(QJsonDocument::Compact);// 構建增強協議頭struct EnhancedHead…

四,基礎開發工具(下)

4.5自動構建make/Makefile4.5.1基本使用1示例2進一步解釋3實踐4最佳實踐4.6練習&#xff1a;進度條4.6.1倒計時4.6.2進度條version14.6.2進度條version24.7版本控制器Git4.7.1git操作1操作一次&#xff0c;以后不愁2經典"三件套"3常用4版本回退4.7.2小結4.5自動構建m…

C++基本數據類型的范圍

文章目錄不同位數的系統下各個類型所占字節數如何存儲的我發現我能搜到的相關文章都只講了這些數據類型的范圍是這樣的&#xff0c;不說實際的存儲情況&#xff0c;當你了解了類型實際是如何存儲的&#xff0c;再去記憶這些范圍就簡單了&#xff0c;所以就有了這篇文章不同位數…

基于社交媒體數據的公眾情緒指數構建與重大事件影響分析

一、引言在信息爆炸的時代&#xff0c;社交媒體&#xff08;如微博、Twitter&#xff09;已成為公眾表達情緒、討論熱點事件的主要平臺。通過分析社交媒體數據&#xff0c;可以構建公眾情緒指數&#xff0c;并進一步研究其與股市波動、政策發布等重大事件的關聯性。本文將介紹如…

OpenLayers數據源集成 -- 章節七:高德地圖集成詳解

前言在前面的文章中&#xff0c;我們學習了OpenLayers的瓦片調試&#xff08;VectorTileDebug&#xff09;技術。本文將深入探討OpenLayers中高德地圖的集成方法&#xff0c;這是WebGIS開發中接入商業地圖服務的重要技術。高德地圖作為國內領先的地圖服務提供商&#xff0c;提供…

海外代理IP平臺Top3評測:LoongProxy、神龍動態IP、IPIPGO哪家更適合你?

在當今互聯網環境中&#xff0c;代理IP服務已成為許多企業和個人用戶的剛需。無論是數據采集、市場調研還是賬號管理&#xff0c;優質的代理IP都能大幅提升工作效率。本文將針對LoongProxy、神龍海外動態IP和IPIPGO這三家主流代理IP服務商進行橫向評測&#xff0c;幫助你根據自…

對瀏覽器事件機制的理解

瀏覽器事件是什么&#xff1a; 事件是用戶操作網頁時發生的交互動作&#xff0c;比如 click/move&#xff0c; 事件除了用戶觸發的動作外&#xff0c;還可以是文檔加載&#xff0c;窗口滾動和大小調整。事件被封裝成一個 event 對象&#xff0c;包含了該事件發生時的所有相關信…

XCVP1902-2MSEVSVA6865 AMD 賽靈思 XilinxVersal Premium FPGA

XCVP1902-2MSEVSVA6865 是 AMD 賽靈思&#xff08;Xilinx&#xff09;Versal Premium FPGA 系列中的高端自適應系統級芯片&#xff08;Adaptive SoC&#xff09;變體&#xff0c;面向需要極高邏輯密度、海量 I/O 與超高速收發能力的數據中心互聯、原型驗證與高性能網絡加速等應…

kotlin - 2個Fragment實現左右顯示,左邊列表,右邊詳情,平板橫、豎屏切換(一)

kotlin - 2個Fragment實現左右顯示&#xff0c;左邊列表&#xff0c;右邊詳情&#xff0c;平板橫、豎屏切換(要使用平板測試)平板橫屏&#xff1a;左右fragment實現分屏效果&#xff0c;平板豎屏&#xff1a;只顯示左邊的fragment&#xff0c;點擊才顯示右邊fragment屏幕旋轉&a…

推薦系統中的AB測試:從設計到分析全流程

推薦系統中的AB測試:從設計到分析全流程 關鍵詞:推薦系統、AB測試、實驗設計、數據分析、效果評估、統計顯著性、用戶體驗 摘要:本文將深入探討推薦系統中AB測試的全流程,從實驗設計到結果分析。我們將用通俗易懂的方式解釋AB測試的核心概念,展示如何科學地評估推薦算法改…