大模型提示詞工程背后的原理:深入理解Prompt Learning(提示學習)

知其然也要知其所以然,為什么會有提示詞工程?

了解和使用過大模型的人應該都知道提示詞工程,即使不了解提示詞工程,至少也應該聽說過,提示詞工程說白了就是一種和大模型交流的方法,它的作用就是讓大模型更好的理解人類的需求。

而且在網上很多關于大模型提示詞的文章和視頻中,都提到了提示詞的質量能夠直接影響到大模型的性能和推理效果。???????????????????????????

但很少有人能明白這是為什么?為什么不同的提示詞會產生完全不同的效果。????????

今天我們就來透過現象看本質,深入了解一下提示詞工程。??

01提示詞工程的背后?????????????????????

要知其然也要知其所以然?

在我們學習大模型技術的時候,很多文章和視頻教程都告訴我們要寫好提示詞,好的提示詞能直接影響到大模型的輸出質量。??????

但從來沒有人告訴你,為什么不同的提示詞會得到完全不同的結果,換句話說為什么會有提示詞的出現??????????????????????

在這里插入圖片描述

技術的出現是有一個先后順序的,先有的提示詞,再有的提示詞工程;提示詞工程是為提示詞服務的,目的就是怎么寫出一個更好的提示詞。

簡單來說就是,大家把寫提示詞的經驗總結成一種方法,這個方法就叫做提示詞工程。????????

OK了解了提示詞和提示詞工程之間的關系,那么就來回答上面那個問題。??????????????

為什么會有提示詞?

提示詞的產生是有歷史原因的,雖然這個歷史很短。

我們知道人工智能的發展經歷了多個階段,雖然近些年機器學習大行其道,但并沒有產生特別大的影響,直到openAI基于Transformer架構開發出了GPT系列,特別是GPT-3版本發布,以及谷歌發布的BERT模型。????????????????????????????????

在GPT和BERT模型開發前期,由于參數量小,模型體量也小,直接的結果就是當時的模型訓練成本比較低;因此,那時開發大模型主要以預訓練和微調為主。????????????????????????????????????

這時研究深度學習模型的方法也被稱為——預訓練-微調范式。??????

在這里插入圖片描述

但直到GPT-3的出現,模型的參數出現爆炸式增長,直接從剛開始的上億參數量增長到上千億參數量;這時大模型這個詞出現了,大模型代表的不只是模型規模大,參數量多;也代表著模型的訓練和微調成本直線上升。??????????????????????????

比如說,GPT-3模型訓練成本好像達到了上千萬美元;因此,從成本的角度訓練和微調模型不再是一個好的選擇。

這時,大家就開始考慮一個問題,上千億參數的模型已經具有了非常豐富的知識量,那么怎么更好的更有效率的利用好這些知識呢????????????????

我們知道,在預訓練和微調學習范式中,需要通過訓練數據不斷調整模型的參數來讓模型達到最優解。????????????????

而經過一段時間的研究和實驗,這時就有人發現了一種在不需要調整大模型參數的情況下,用少量樣本或零樣本的方式,就可以讓大模型輸出更好的結果。???????

基于這種結果,人們又經過其它研究發現,對同一個問題使用不同的提示詞會輸出不同的結果。??????????????????????

簡單來說就是,提示詞寫的越好,模型的輸出效果越好,因此就把這種現象命名為提示學習。???????????????????

而為什么會產生這種現象,這個就像大模型的涌現能力一樣,它是一種現象,但不知道產生的原因。??

所以總結來說,提示學習是一種基于實驗發現的一種現象,它能夠在不改變模型參數的前提下,讓模型擁有更高的輸出質量。?????????????????????????????

因此,基于提示學習這個理論就產生了提示詞,而怎么把提示詞寫的更好就有了提示詞工程。??????????????????????????????????????????????

不同提示詞產生不同效果的原因

網上也有這種說法,在預訓練-微調階段是讓大模型去適配不同的任務;比如,電商類大模型需要用電商數據進行訓練或微調,工業類大模型需要使用工業數據進行訓練或微調。???????????????????????????

而提示學習階段,卻是讓任務去適配大模型;就類似于男女之間的感情,在之前大都是男追女,男人需要給女人買禮物,請客吃飯等等,需要花費大量的金錢;而最近兩年男人突然明白過來了,我不追了,花錢把自己收拾干凈,買房買車讓女人倒追。??????????????????????????

下面我們用一個例子來說明為什么提示詞不同,效果也不同,拿一個情感分類任務來說:????

問題 Q = “這個電影不錯”?

?????

加上提示詞模板P_Q = “這個電影不錯,我很喜歡,因此這是一個X電影”。???????????????????????????????????????????????????????????????????????

這里的X就是大模型需要預測的結果,而如果再把這個X加一個限定范圍,比如A:無趣的,B:好玩的;這時大模型就可以輕易的判斷出這是一個好玩的電影。?????????

而不加提示詞模板,模型給出的答案可能就千奇百怪,比如說這是一個難看的電影,這是一個糟糕透頂的電影,這是一個某某主演的關于某某事情的電影等等,都是有可能的。???????????????????????

而這就是為什么提示詞工程中有些人會要求,寫提示詞要給大模型設定角色,背景,明確任務要求,限定任務范圍等要求。???????????????????????

基于NLP自然語言處理模型開發的人工智能機器人,感興趣的可以點擊查看:?????

總結

簡單來說,不論是預訓練-微調,還是提示詞都是為了讓模型表現的更好,為了發揮大模型龐大知識能力的一種方式,而提示詞是一種成本相對較低的方式。???????????????????

而對使用者來說,使用第三方模型是根據Token進行計費的,而更長的提示詞意味著更多的Token,因此怎么寫出一個簡短又高質量的提示詞就是一個需要考慮的問題。????????????????

普通人如何抓住AI大模型的風口?

領取方式在文末

為什么要學習大模型?

目前AI大模型的技術崗位與能力培養隨著人工智能技術的迅速發展和應用 , 大模型作為其中的重要組成部分 , 正逐漸成為推動人工智能發展的重要引擎 。大模型以其強大的數據處理和模式識別能力, 廣泛應用于自然語言處理 、計算機視覺 、 智能推薦等領域 ,為各行各業帶來了革命性的改變和機遇 。

目前,開源人工智能大模型已應用于醫療、政務、法律、汽車、娛樂、金融、互聯網、教育、制造業、企業服務等多個場景,其中,應用于金融、企業服務、制造業和法律領域的大模型在本次調研中占比超過 30%。
在這里插入圖片描述

隨著AI大模型技術的迅速發展,相關崗位的需求也日益增加。大模型產業鏈催生了一批高薪新職業:
在這里插入圖片描述

人工智能大潮已來,不加入就可能被淘汰。如果你是技術人,尤其是互聯網從業者,現在就開始學習AI大模型技術,真的是給你的人生一個重要建議!

最后

只要你真心想學習AI大模型技術,這份精心整理的學習資料我愿意無償分享給你,但是想學技術去亂搞的人別來找我!

在當前這個人工智能高速發展的時代,AI大模型正在深刻改變各行各業。我國對高水平AI人才的需求也日益增長,真正懂技術、能落地的人才依舊緊缺。我也希望通過這份資料,能夠幫助更多有志于AI領域的朋友入門并深入學習。

真誠無償分享!!!
vx掃描下方二維碼即可
加上后會一個個給大家發

在這里插入圖片描述

大模型全套學習資料展示

自我們與MoPaaS魔泊云合作以來,我們不斷打磨課程體系與技術內容,在細節上精益求精,同時在技術層面也新增了許多前沿且實用的內容,力求為大家帶來更系統、更實戰、更落地的大模型學習體驗。

圖片

希望這份系統、實用的大模型學習路徑,能夠幫助你從零入門,進階到實戰,真正掌握AI時代的核心技能!

01 教學內容

圖片

  • 從零到精通完整閉環:【基礎理論 →RAG開發 → Agent設計 → 模型微調與私有化部署調→熱門技術】5大模塊,內容比傳統教材更貼近企業實戰!

  • 大量真實項目案例: 帶你親自上手搞數據清洗、模型調優這些硬核操作,把課本知識變成真本事?!

02適學人群

應屆畢業生?: 無工作經驗但想要系統學習AI大模型技術,期待通過實戰項目掌握核心技術。

零基礎轉型?: 非技術背景但關注AI應用場景,計劃通過低代碼工具實現“AI+行業”跨界?。

業務賦能突破瓶頸: 傳統開發者(Java/前端等)學習Transformer架構與LangChain框架,向AI全棧工程師轉型?。

image.png

vx掃描下方二維碼即可
在這里插入圖片描述

本教程比較珍貴,僅限大家自行學習,不要傳播!更嚴禁商用!

03 入門到進階學習路線圖

大模型學習路線圖,整體分為5個大的階段:
圖片

04 視頻和書籍PDF合集

圖片

從0到掌握主流大模型技術視頻教程(涵蓋模型訓練、微調、RAG、LangChain、Agent開發等實戰方向)

圖片

新手必備的大模型學習PDF書單來了!全是硬核知識,幫你少走彎路(不吹牛,真有用)
圖片

05 行業報告+白皮書合集

收集70+報告與白皮書,了解行業最新動態!
圖片

06 90+份面試題/經驗

AI大模型崗位面試經驗總結(誰學技術不是為了賺$呢,找個好的崗位很重要)圖片
在這里插入圖片描述

07 deepseek部署包+技巧大全

在這里插入圖片描述

由于篇幅有限

只展示部分資料

并且還在持續更新中…

真誠無償分享!!!
vx掃描下方二維碼即可
加上后會一個個給大家發

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/920111.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/920111.shtml
英文地址,請注明出處:http://en.pswp.cn/news/920111.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

AI 智能體安全設計模式:從三大“反模式”看如何構建可信的 AI 系統

摘要:當我們將 AI 智能體(Agent)從實驗原型推向生產環境時,許多團隊在不經意間重復著一些危險的錯誤實踐。這些反復出現的錯誤,在軟件工程中被稱為“反模式”(Anti-Patterns)。本文基于 Curity …

【前端安全】前端安全第一課:防止 XSS 和 CSRF 攻擊的常見手法

【前端安全】前端安全第一課:防止 XSS 和 CSRF 攻擊的常見手法 所屬專欄: 《前端小技巧集合:讓你的代碼更優雅高效》 上一篇: 【性能指標】決戰性能之巔:深入理解核心 Web 指標(Core Web Vitals&#xff0…

QT新建文件或者項目解釋:那些模板分別是什么意思?

在 Qt Creator 的 “New File or Project” 界面中,不同分類下的模板有著不同的用途和適用場景,以下是對各部分的詳細說明:一、“項目” 分類下1. Application(應用程序)用途:用于創建可直接運行的應用程序…

《支付回調狀態異常的溯源與架構級修復》

在后端開發領域,能通過錯誤日志直接定位的問題,只能算作“基礎挑戰”;而那些依賴特定數據量、并發量或外部交互場景才會觸發的隱性問題,往往像藏在電路中的虛焊點,平時看似正常,關鍵時刻卻會導致整個系統斷…

C語言 運算符 (2)

一、內容概要內容提neirong關系運算符 邏輯運算符 逗號運算符 位運算二、運算符2.1 關系運算符說明&#xff1a; >,<,>,<,,! &#xff08;都是雙目的&#xff09;所有關系運算符都是雙目運算符&#xff08;二元運算符&#xff09;&#xff0c;運算符左側和右側、可…

mac版SVN客戶端: macSvn 下載、使用指南【保姆級教程】

做項目要用SVN&#xff0c;在Mac平臺找順手的客戶端好難。Windows下的TortoiseSVN很贊&#xff0c;Mac卻一直沒對等工具。直到發現新發布的MacSVN&#xff0c;布局和操作深得我心&#xff0c;內置常用工具&#xff0c;還能無縫集成到OS與任務欄&#xff0c;便捷易上手&#xff…

MongoDB分片集群自動化部署

OS&#xff1a;CentOS Linux release 7.9.2009 (Core) 場景&#xff1a; 需要半自動化或者自動化部署MongoDB集群時&#xff0c;可用此腳本。提高交付效率。 腳本實現架構圖&#xff1a;腳本&#xff1a; check_clear_host.sh #此腳本有2個功能及是檢查 資源規格和清理資源上的…

go-redis庫使用總結

文章目錄1. 概述與特性2. 安裝與初始化2.1 安裝2.2 初始化3 基本使用模式3.1 單實例客戶端3.2 連接池與自動重連4. 常用 Redis 數據結構操作4.1 字符串&#xff08;String&#xff09;4.2 哈希&#xff08;Hash&#xff09;4.3 列表&#xff08;List&#xff09;4.4 集合&#…

【軟件設計模式】策略模式

1.概念策略&#xff08;Strategy&#xff09;模式定義了一系列算法&#xff0c;并將每個算法封裝起來&#xff0c;使它們可以相互替換&#xff0c;且算法的變化不會影響使用算法的客戶。策略模式屬于行為型設計模式&#xff0c;它通過對算法進行封裝&#xff0c;把使用算法的責…

Mac電腦英特爾版本最新系統15.6.1安裝php環境

Mac電腦安裝php環境 版本環境&#xff1a; 2025-08-22 14:09:19 安裝 最新系統15.6.1系統&#xff1a; 新版本的mac不帶php環境&#xff0c;需要自己 安裝 brew install php8.3 啟動說明 查看 . 使用官方方法安裝 NVM curl -o- https://raw.githubusercontent.com/nvm-sh/…

Android焦點窗口變化導致遙控鍵值監聽失效問題分析

最近在做語音全局控制Android系統功能&#xff0c;通過集成第三方語音識別sdk得到相關控制指令&#xff0c;然后將指令通過進程間通信傳遞給當前應用并作出響應。有很多通用指令&#xff0c;比如播放/暫停&#xff0c;Android系統本身就有全局控制指令&#xff1a;KeyEvent.KEY…

降本增效:基于 JavaScript 的 AI 編程 IDE 上下文壓縮優化方案

降本增效&#xff1a;基于 JavaScript 的 AI 編程 IDE 上下文壓縮優化方案 在當前 AI 輔助編程&#xff08;AI Pair Programming&#xff09;日益普及的背景下&#xff0c;開發者越來越依賴如 GitHub Copilot、Tabnine、CodeLlama 等智能編碼工具。然而&#xff0c;一個普遍存在…

DataX HdfsWriter 插件文檔

?博客主頁&#xff1a; https://blog.csdn.net/m0_63815035?typeblog &#x1f497;《博客內容》&#xff1a;大數據、Java、測試開發、Python、Android、Go、Node、Android前端小程序等相關領域知識 &#x1f4e2;博客專欄&#xff1a; https://blog.csdn.net/m0_63815035/…

Rancher 管理的 K8S 集群中部署常見應用(MySQL、Redis、RabbitMQ)并支持擴縮容的操作

文章目錄一、前提條件二、準備鏡像三、進入 Rancher UI 部署3.1. 進入 Workloads3.2. 部署 MySQL3.3. 部署 Redis3.4. 部署 RabbitMQ四、驗證服務五、擴縮容&#xff08;UI 操作&#xff09;六、附錄yml部署文件6.1. mysql.yaml6.2. redis.yaml6.3. rabbitmq.yaml一、前提條件 …

8.21-8.22網絡編程——詞典

文章目錄一、思維導圖二、詞典1、服務器2、客戶端3、現象三、牛客網刷題一、思維導圖 二、詞典 1、服務器 #include <myhead.h>#define SER_PORT 8888 //服務器端口號 #define SER_IP "192.168.116.128" //服務器IP地址 //賬戶密碼結構 typedef s…

ffmpeg測試rtsp地址

ffmpeg可以用 ffmpeg 通過 tcp協議/udp協議傳輸流到 null設備&#xff0c;ffmpeg \-rtsp_transport tcp \ # 使用TCP協議傳輸RTSP流-timeout 5000000 \ # 設置超時時間為5000000微秒&#xff08;5秒&#xff09;-i "rtsp://admin:admin123192.168.1.…

Apache Commons Math_Java科學計算的利器

1. 引言 1.1 科學計算在現代軟件開發中的重要性 隨著大數據、人工智能和科學計算需求的不斷增長,科學計算能力已成為現代軟件開發不可或缺的重要組成部分。從金融風險評估到工程仿真,從數據分析到機器學習,科學計算在各行各業中發揮著關鍵作用。 科學計算涉及復雜的數學運…

Python爬蟲框架設計:類封裝與工程化實踐?

實戰中的UA輪換技巧 import fake_useragent import random class DynamicHeader: def init(self): self.ua_generator fake_useragent.UserAgent() # 注意&#xff1a;實際使用需更新數據路徑 self.fingerprints [“chrome125”, “edge115”, “safari17”] # 2025年主流指…

5G 三卡圖傳終端:公安執法的 “移動可視化指揮中樞”

前言 在公安執法中&#xff0c;“實時取證、高效指揮、安全協同” 是破解現場復雜局面的核心需求。傳統執法設備常因傳輸卡頓、證據存證難、跨警種信息斷層等問題影響執法效能&#xff0c;而 5G 便攜式多卡高清視頻融合終端憑借多網聚合、高清編碼、安全存儲等特性&#xff0c;…

R語言rbind()和cbind()使用

rbind&#xff1a;r row&#xff08;行&#xff09;cbind&#xff1a;c column&#xff08;列&#xff09; 核心區別方向 ? rbind&#xff1a;縱向&#xff08;按行&#xff09;堆疊&#xff0c;行數相加。 ? cbind&#xff1a;橫向&#xff08;按列&#xff09;拼接&#…