📘 第五期書生葡語實戰營講座總結
🎙 主講人:王明(東部大學 數據挖掘實驗室 博士生)
一、大語言模型的生成原理
- 架構基礎:采用 Transformer(Decoder-only)架構,如 GPT 系列。
- 學習過程模擬人類成長:
- 🧠 預訓練:以“下一個詞預測”為核心任務,掌握通用語言規律。
- 🎯 指令微調:遵循指令,更貼合人類指令執行習慣。
- 🏛? 領域微調:形成“垂直專業模型”,例如醫學、金融 LLM。
- 🧰 工具協同:調用外部知識庫、搜索引擎或 API 執行復雜任務。
- 續寫機制:根據輸入內容,預測下一個最可能的詞,逐步生成連貫文本。
二、提示工程 Prompt Engineering 簡介
📌 什么是 Prompt?
輸入給模型的指令/內容,引導其生成期望輸出。
? 什么是提示工程?
通過設計和優化 Prompt,提高模型響應質量與穩定性。
? 六大提示原則(來自 OpenAI):
- 清晰具體的任務描述
- 提供上下文或示例(few-shot)
- 任務分解(適用于復雜任務)
- 給予思考時間(Chain of Thought)
- 調用外部工具輔助推理
- 系統化測試調整提示
三、實用提示技巧舉例
技巧類型 | 示例 |
---|---|
明確任務格式 | “生成一首七言律詩”比“寫一首詩”更有效 |
指定角色扮演 | 翻譯大師 vs 普通翻譯 |
提供示例 (few-shot,思維鏈) | 提高準確率與風格一致性 |
使用格式符 | 用 `` 或 Markdown 包裹指令,避免誤解 |
情感/獎勵激勵 | “這對我事業很重要” or “我給你200元小費” |
四、結構化提示設計框架對比
🧩 CRISP 框架(結構靈活)
- 能力和角色(Capabilities&Role):希望大語言模型扮演怎么樣的角色
- 洞察力(insights):背景信息和上下文
- 個性(Persona)希望大語言模型以什么風格或方式回答你
- 指令(Prompt)希望大語言模型做什么
- 嘗試(Experiment)要求大語言模型提供多個答案
🧱 COSTAR 框架(結構清晰)
- Context(背景):提供任務背景信息
- Objective(目標):定義需要LLM執行的任務
- Style(風格):指定希望LLM具備的寫作風格
- Tone(語氣):設定LLM回復的情感基調
- Audience(對象):表明回復對象
- Response format(輸出格式):提供回復格式
?? 問題:不便擴展或調整,無法容納復雜模塊(如示例/規則)
五、人格化提示設計框架:Long-GPT
🎯 目標
通過“人格化”提示設計,使模型進入特定角色和工作狀態。
🧠 理論基礎:心理學啟發
- 認知框架:圍繞“心理模型”組織語言
- 情緒調節:正向激勵帶來正面響應
- 思維模式:模擬人類工作流、思維路徑
🛠 結構化模塊(可選組合):
- 基本身份與能力喚醒
- 明確規則與目標約束
- 分階段工作流程(如“先做A,再做B”)
- 輸出格式要求(如 JSON、表格)
- 初始化啟動語
六、自動提示生成工具:MISTRO
Lang-GPT 提示自動生成器(掛載于 Hugging Face Space)https://huggingface.co/spaces/sci-m-wang/Minstrel
🧱 模塊組成:
- 分析組:解析用戶任務意圖,激活相應模塊
- 設計組:生成對應提示結構(Prompt Blocks)
- 測試組:
- 提示模擬器(執行任務)
- 多智能體評估群組(自動辯論 & 優化)
七、實戰演練:提示工程練習賽(論文分類)
🏆 任務目標:
- 依據論文標題和摘要,將論文歸類為 10 個科學領域之一。
📊 數據來源:
- arXiv 論文,10類:AI、CV、CL、Robotics、Networking 等
🧪 提交內容:
- 系統提示(可空)
- 任務提示(包含
{title}
和{abstract}
)
🧮 評測方式:
- 使用 OpenCompass + 書生葡語 38B instruct 模型
- 準確率 = 正確分類數量 / 總數
🧩 示例系統提示結構(Lang-GPT):
你是一個資深arXiv論文分類專家,你的任務是……
[背景信息]
[技能喚醒]
[規則說明]
[工作流程指示]
[輸出格式要求]