大語言模型原理與書生大模型提示詞工程實踐-學習筆記

📘 第五期書生葡語實戰營講座總結

🎙 主講人:王明(東部大學 數據挖掘實驗室 博士生)


一、大語言模型的生成原理

  • 架構基礎:采用 Transformer(Decoder-only)架構,如 GPT 系列。
  • 學習過程模擬人類成長:
    1. 🧠 預訓練:以“下一個詞預測”為核心任務,掌握通用語言規律。
    2. 🎯 指令微調:遵循指令,更貼合人類指令執行習慣。
    3. 🏛? 領域微調:形成“垂直專業模型”,例如醫學、金融 LLM。
    4. 🧰 工具協同:調用外部知識庫、搜索引擎或 API 執行復雜任務。
  • 續寫機制:根據輸入內容,預測下一個最可能的詞,逐步生成連貫文本。

二、提示工程 Prompt Engineering 簡介

📌 什么是 Prompt?

輸入給模型的指令/內容,引導其生成期望輸出。

? 什么是提示工程?

通過設計和優化 Prompt,提高模型響應質量與穩定性。

? 六大提示原則(來自 OpenAI):

  1. 清晰具體的任務描述
  2. 提供上下文或示例(few-shot)
  3. 任務分解(適用于復雜任務)
  4. 給予思考時間(Chain of Thought)
  5. 調用外部工具輔助推理
  6. 系統化測試調整提示
    在這里插入圖片描述

三、實用提示技巧舉例

技巧類型示例
明確任務格式“生成一首七言律詩”比“寫一首詩”更有效
指定角色扮演翻譯大師 vs 普通翻譯
提供示例 (few-shot,思維鏈)提高準確率與風格一致性
使用格式符用 `` 或 Markdown 包裹指令,避免誤解
情感/獎勵激勵“這對我事業很重要” or “我給你200元小費”

四、結構化提示設計框架對比

🧩 CRISP 框架(結構靈活)

  • 能力和角色(Capabilities&Role):希望大語言模型扮演怎么樣的角色
  • 洞察力(insights):背景信息和上下文
  • 個性(Persona)希望大語言模型以什么風格或方式回答你
  • 指令(Prompt)希望大語言模型做什么
  • 嘗試(Experiment)要求大語言模型提供多個答案
    在這里插入圖片描述

🧱 COSTAR 框架(結構清晰)

  • Context(背景):提供任務背景信息
  • Objective(目標):定義需要LLM執行的任務
  • Style(風格):指定希望LLM具備的寫作風格
  • Tone(語氣):設定LLM回復的情感基調
  • Audience(對象):表明回復對象
  • Response format(輸出格式):提供回復格式
    在這里插入圖片描述

在這里插入圖片描述

?? 問題:不便擴展或調整,無法容納復雜模塊(如示例/規則)


五、人格化提示設計框架:Long-GPT

🎯 目標

通過“人格化”提示設計,使模型進入特定角色和工作狀態。

🧠 理論基礎:心理學啟發

  • 認知框架:圍繞“心理模型”組織語言
  • 情緒調節:正向激勵帶來正面響應
  • 思維模式:模擬人類工作流、思維路徑
    在這里插入圖片描述

🛠 結構化模塊(可選組合):

  • 基本身份與能力喚醒
  • 明確規則與目標約束
  • 分階段工作流程(如“先做A,再做B”)
  • 輸出格式要求(如 JSON、表格)
  • 初始化啟動語

六、自動提示生成工具:MISTRO

Lang-GPT 提示自動生成器(掛載于 Hugging Face Space)https://huggingface.co/spaces/sci-m-wang/Minstrel

在這里插入圖片描述

🧱 模塊組成:

  1. 分析組:解析用戶任務意圖,激活相應模塊
  2. 設計組:生成對應提示結構(Prompt Blocks)
  3. 測試組
    • 提示模擬器(執行任務)
    • 多智能體評估群組(自動辯論 & 優化)

七、實戰演練:提示工程練習賽(論文分類)

🏆 任務目標:

  • 依據論文標題和摘要,將論文歸類為 10 個科學領域之一。

📊 數據來源:

  • arXiv 論文,10類:AI、CV、CL、Robotics、Networking 等

🧪 提交內容:

  • 系統提示(可空)
  • 任務提示(包含 {title}{abstract}

🧮 評測方式:

  • 使用 OpenCompass + 書生葡語 38B instruct 模型
  • 準確率 = 正確分類數量 / 總數

🧩 示例系統提示結構(Lang-GPT):

你是一個資深arXiv論文分類專家,你的任務是……
[背景信息]
[技能喚醒]
[規則說明]
[工作流程指示]
[輸出格式要求]![在這里插入圖片描述](https://i-blog.csdnimg.cn/direct/c43d5497a931482296aebe3f8b527d4c.png)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/909074.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/909074.shtml
英文地址,請注明出處:http://en.pswp.cn/news/909074.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

李沐 《動手學深度學習》 | 實戰Kaggle比賽:預測房價

文章目錄 1.下載和緩存數據集2.數據預處理讀取樣本預處理樣本數值型特征處理特征標準化的好處離散值處理轉換為張量表示 訓練K折交叉驗證模型選擇最終模型確認及結果預測代碼總結提交到Kaggle 房價預測比賽鏈接:https://www.kaggle.com/c/house-prices-advanced-reg…

一鍵部署Prometheus+Grafana+alertmanager對網站狀態進行監控

在建設監控體系的過程中,針對一個系統的監控是多維度的,除了服務器資源狀態、中間件狀態、應用狀態外,對系統訪問狀態的監控也是很有必要,可以在系統訪問出現異常時第一時間通知到我們。本文介紹使用 Docker-compose 方式一鍵部署…

康謀方案 | 高精LiDAR+神經渲染3DGS的完美融合實踐

目錄 一、從點云到高精地圖的重建 1、數據采集 2、點云聚合 3、高精地圖建模 4、三維建模與裝飾 二、顛覆性革新:NeRF 與 3DGS 重建 1、僅需數日,完成街景重建 2、進一步消除 Domain gap,場景逼真如實地拍攝 3、降本增效&#xff0c…

MySQL-事務(TRANSACTION-ACID)管理

目錄 一、什么是事務? 1.1.事務的定義 1.2.事務的基本語句 1.3.事務的四大特性(ACID) 二、數據庫的并發控制 2.1.什么是并發及并發操作帶來的影響? 2.2.并發操作帶來的隔離級別 三、使用事務的場景 3.1.銀行轉賬場景示例 3.2.模擬…

centos系統docker配置milvus教程

本人使用的是京東云服務器配置milvus 參考教程:https://blog.csdn.net/withme977/article/details/137270087 首先確保安裝了docker 、docker compose docker -- version docker-compose --version創建milvus工作目錄 mkdir milvus # 進入到新建的目錄 cd milvu…

什么是JSON ?從核心語法到編輯器

一、什么是JSON ? JSON,即 JavaScript 對象表示法,是一種輕量級、跨語言、純文本的數據交換格式 。它誕生于 JavaScript 生態,但如今已成為所有編程語言通用的 “數據普通話”—— 無論前端、后端,還是 Python、Java&…

計算機網絡(7)——物理層

1.數據通信基礎 1.1 物理層基本概念 物理層(Physical Layer)是所有網絡通信的物理基礎,它定義了在物理介質上傳輸原始比特流(0和1)所需的機械、電氣、功能、過程和規程特性 1.2 數據通信系統模型 信源:生成原始數據的終端設備,常見形態包括…

深度學習基礎知識總結

1.BatchNorm2d 加速收斂:Batch Normalization 可以使每層的輸入保持較穩定的分布(接近標準正態分布),減少梯度更新時的震蕩問題,從而加快模型訓練速度。 減輕過擬合:批歸一化引入了輕微的正則化效果&#…

iOS 抖音首頁頭部滑動標簽的實現

抖音首頁的頭部滑動標簽(通常稱為"Segmented Control"或"Tab Bar")是一個常見的UI組件,可以通過以下幾種方式實現: 1. 使用UISegmentedControl 最簡單的實現方式是使用系統自帶的UISegmentedControl: let segmentedCo…

ThreadLocal實現原理

ThreadLocal 是 Java 中實現線程封閉(Thread Confinement)的核心機制,它通過為每個線程創建變量的獨立副本來解決多線程環境下的線程安全問題。 Thread └── ThreadLocalMap (threadLocals) // 每個線程持有的專屬Map├── Entry[] tab…

【筆記】結合 Conda任意創建和配置不同 Python 版本的雙軌隔離的 Poetry 虛擬環境

如何結合 Conda 任意創建和配置不同 Python 版本的雙軌隔離的Poetry 虛擬環境? 在 Python 開發中,為不同項目配置獨立且適配的虛擬環境至關重要。結合 Conda 和 Poetry 工具,能高效創建不同 Python 版本的 Poetry 虛擬環境,接下來…

defineAsyncComponent

下面,我們來系統的梳理關于 defineAsyncComponent 懶加載 的基本知識點: 一、異步組件核心概念 1.1 什么是異步組件? 異步組件是 Vue 中一種按需加載組件的機制,允許將組件代碼拆分為獨立的 chunk,在需要時再從服務器加載。這種技術能顯著提升應用初始加載速度。 1.2 為…

ANeko v1.0.3 | 在手機里養只寵物貓 實時互動 動畫細膩

ANeko是一款專為喜歡貓咪的用戶設計的互動養寵應用。它讓你在手機屏幕上擁有一只可愛的貓咪動畫,這只貓咪會實時跟隨你的手指觸摸軌跡,帶來生動有趣的互動體驗。該應用不僅保留了用戶熟悉的交互式貓動畫,還結合了現代高清圖形技術&#xff0c…

人工智能AI

AI 簡介 AI 使我們能夠生成可以改進衛生保健的出色軟件,讓人能夠克服生理上的不便,改進智能基礎結構,創造令人驚嘆的娛樂體驗,甚至拯救地球! 什么是 AI? 簡而言之,AI 就是一種模仿人類行為和能力的軟件。 關鍵工作負載包括: 機器學習 - 它通常是 AI 系統的基礎,也是…

Vue 中 data 選項:對象 vs 函數

Vue 中 data 選項&#xff1a;對象 vs 函數 在 Vue 開發中&#xff0c;data 選項可以使用對象或函數形式&#xff0c;了解它們的使用場景非常重要。下面我將通過一個直觀的示例來展示兩者的區別和適用場景。 <!DOCTYPE html> <html lang"zh-CN"> <h…

python打卡第49天

知識點回顧&#xff1a; 通道注意力模塊復習空間注意力模塊CBAM的定義 CBAM 注意力模塊介紹 從 SE 到 CBAM&#xff1a;注意力機制的演進 之前我們介紹了 SE&#xff08;Squeeze-and-Excitation&#xff09;通道注意力模塊&#xff0c;其本質是對特征進行增強處理。現在&#…

iOS和桌面雙端抓包實戰經驗總結:Sniffmaster與常見工具組合解析

近幾年&#xff0c;移動端和桌面端的網絡調試工作變得越來越“棘手”。過去一個代理證書搞定的場景&#xff0c;現在常常被HTTPS加密、雙向驗證、App安全策略給難住。特別是涉及到iOS平臺時&#xff0c;很多傳統抓包方案都不再適用。作為一名在多個平臺開發和測試的程序員&…

cloudstudio騰訊云:matplotlib 設置中文字體

檢查可用字體&#xff1a; import matplotlib.font_manager as fm fonts [f.name for f in fm.fontManager.ttflist] print(fonts) # 查看系統中可用的字體列表# 列出所有中文字體文件 !fc-list :langzh沒有中文字體&#xff0c;需要下載 !sudo apt-get install fonts-wqy-m…

Django中的ORM的使用步驟----以MySQL為例

1 以純Python的形式創建項目虛擬環境 2 命令安裝Django 3 在當前虛擬環境目錄下命令創建Django項目 4 命令創建app 注&#xff1a; 若想將創建的子應用存放到指定目錄&#xff0c;如app&#xff0c; 那么需要先手動創建app目錄&#xff0c;再手動創建子應用目錄&#xff0c;如o…

Rust 學習筆記:通過 Send 和 Sync trait 實現可擴展并發性

Rust 學習筆記&#xff1a;通過 Send 和 Sync trait 實現可擴展并發性 Rust 學習筆記&#xff1a;通過 Send 和 Sync trait 實現可擴展并發性Send trait&#xff1a;允許在線程之間轉移所有權Sync trait&#xff1a;允許多線程訪問手動實現 Send 和 Sync 是不安全的練習題 Rust…