“ 知其然也要知其所以然,為什么會有提示詞工程?”
了解和使用過大模型的人應該都知道提示詞工程,即使不了解提示詞工程,至少也應該聽說過,提示詞工程說白了就是一種和大模型交流的方法,它的作用就是讓大模型更好的理解人類的需求。
而且在網上很多關于大模型提示詞的文章和視頻中,都提到了提示詞的質量能夠直接影響到大模型的性能和推理效果。???????????????????????????
但很少有人能明白這是為什么?為什么不同的提示詞會產生完全不同的效果。????????
今天我們就來透過現象看本質,深入了解一下提示詞工程。??
01提示詞工程的背后?????????????????????
要知其然也要知其所以然?
在我們學習大模型技術的時候,很多文章和視頻教程都告訴我們要寫好提示詞,好的提示詞能直接影響到大模型的輸出質量。??????
但從來沒有人告訴你,為什么不同的提示詞會得到完全不同的結果,換句話說為什么會有提示詞的出現??????????????????????
技術的出現是有一個先后順序的,先有的提示詞,再有的提示詞工程;提示詞工程是為提示詞服務的,目的就是怎么寫出一個更好的提示詞。
簡單來說就是,大家把寫提示詞的經驗總結成一種方法,這個方法就叫做提示詞工程。????????
OK了解了提示詞和提示詞工程之間的關系,那么就來回答上面那個問題。??????????????
為什么會有提示詞?
提示詞的產生是有歷史原因的,雖然這個歷史很短。
我們知道人工智能的發展經歷了多個階段,雖然近些年機器學習大行其道,但并沒有產生特別大的影響,直到openAI基于Transformer架構開發出了GPT系列,特別是GPT-3版本發布,以及谷歌發布的BERT模型。????????????????????????????????
在GPT和BERT模型開發前期,由于參數量小,模型體量也小,直接的結果就是當時的模型訓練成本比較低;因此,那時開發大模型主要以預訓練和微調為主。????????????????????????????????????
這時研究深度學習模型的方法也被稱為——預訓練-微調范式。??????
但直到GPT-3的出現,模型的參數出現爆炸式增長,直接從剛開始的上億參數量增長到上千億參數量;這時大模型這個詞出現了,大模型代表的不只是模型規模大,參數量多;也代表著模型的訓練和微調成本直線上升。??????????????????????????
比如說,GPT-3模型訓練成本好像達到了上千萬美元;因此,從成本的角度訓練和微調模型不再是一個好的選擇。
這時,大家就開始考慮一個問題,上千億參數的模型已經具有了非常豐富的知識量,那么怎么更好的更有效率的利用好這些知識呢????????????????
我們知道,在預訓練和微調學習范式中,需要通過訓練數據不斷調整模型的參數來讓模型達到最優解。????????????????
而經過一段時間的研究和實驗,這時就有人發現了一種在不需要調整大模型參數的情況下,用少量樣本或零樣本的方式,就可以讓大模型輸出更好的結果。???????
基于這種結果,人們又經過其它研究發現,對同一個問題使用不同的提示詞會輸出不同的結果。??????????????????????
簡單來說就是,提示詞寫的越好,模型的輸出效果越好,因此就把這種現象命名為提示學習。???????????????????
而為什么會產生這種現象,這個就像大模型的涌現能力一樣,它是一種現象,但不知道產生的原因。??
所以總結來說,提示學習是一種基于實驗發現的一種現象,它能夠在不改變模型參數的前提下,讓模型擁有更高的輸出質量。?????????????????????????????
因此,基于提示學習這個理論就產生了提示詞,而怎么把提示詞寫的更好就有了提示詞工程。??????????????????????????????????????????????
不同提示詞產生不同效果的原因
網上也有這種說法,在預訓練-微調階段是讓大模型去適配不同的任務;比如,電商類大模型需要用電商數據進行訓練或微調,工業類大模型需要使用工業數據進行訓練或微調。???????????????????????????
而提示學習階段,卻是讓任務去適配大模型;就類似于男女之間的感情,在之前大都是男追女,男人需要給女人買禮物,請客吃飯等等,需要花費大量的金錢;而最近兩年男人突然明白過來了,我不追了,花錢把自己收拾干凈,買房買車讓女人倒追。??????????????????????????
下面我們用一個例子來說明為什么提示詞不同,效果也不同,拿一個情感分類任務來說:????
問題 Q = “這個電影不錯”?
?????
加上提示詞模板P_Q = “這個電影不錯,我很喜歡,因此這是一個X電影”。???????????????????????????????????????????????????????????????????????
這里的X就是大模型需要預測的結果,而如果再把這個X加一個限定范圍,比如A:無趣的,B:好玩的;這時大模型就可以輕易的判斷出這是一個好玩的電影。?????????
而不加提示詞模板,模型給出的答案可能就千奇百怪,比如說這是一個難看的電影,這是一個糟糕透頂的電影,這是一個某某主演的關于某某事情的電影等等,都是有可能的。???????????????????????
而這就是為什么提示詞工程中有些人會要求,寫提示詞要給大模型設定角色,背景,明確任務要求,限定任務范圍等要求。???????????????????????
基于NLP自然語言處理模型開發的人工智能機器人,感興趣的可以點擊查看:?????
總結
簡單來說,不論是預訓練-微調,還是提示詞都是為了讓模型表現的更好,為了發揮大模型龐大知識能力的一種方式,而提示詞是一種成本相對較低的方式。???????????????????
而對使用者來說,使用第三方模型是根據Token進行計費的,而更長的提示詞意味著更多的Token,因此怎么寫出一個簡短又高質量的提示詞就是一個需要考慮的問題。????????????????
普通人如何抓住AI大模型的風口?
領取方式在文末
為什么要學習大模型?
目前AI大模型的技術崗位與能力培養隨著人工智能技術的迅速發展和應用 , 大模型作為其中的重要組成部分 , 正逐漸成為推動人工智能發展的重要引擎 。大模型以其強大的數據處理和模式識別能力, 廣泛應用于自然語言處理 、計算機視覺 、 智能推薦等領域 ,為各行各業帶來了革命性的改變和機遇 。
目前,開源人工智能大模型已應用于醫療、政務、法律、汽車、娛樂、金融、互聯網、教育、制造業、企業服務等多個場景,其中,應用于金融、企業服務、制造業和法律領域的大模型在本次調研中占比超過 30%。
隨著AI大模型技術的迅速發展,相關崗位的需求也日益增加。大模型產業鏈催生了一批高薪新職業:
人工智能大潮已來,不加入就可能被淘汰。如果你是技術人,尤其是互聯網從業者,現在就開始學習AI大模型技術,真的是給你的人生一個重要建議!
最后
只要你真心想學習AI大模型技術,這份精心整理的學習資料我愿意無償分享給你,但是想學技術去亂搞的人別來找我!
在當前這個人工智能高速發展的時代,AI大模型正在深刻改變各行各業。我國對高水平AI人才的需求也日益增長,真正懂技術、能落地的人才依舊緊缺。我也希望通過這份資料,能夠幫助更多有志于AI領域的朋友入門并深入學習。
真誠無償分享!!!
vx掃描下方二維碼即可
加上后會一個個給大家發
大模型全套學習資料展示
自我們與MoPaaS魔泊云合作以來,我們不斷打磨課程體系與技術內容,在細節上精益求精,同時在技術層面也新增了許多前沿且實用的內容,力求為大家帶來更系統、更實戰、更落地的大模型學習體驗。
希望這份系統、實用的大模型學習路徑,能夠幫助你從零入門,進階到實戰,真正掌握AI時代的核心技能!
01 教學內容
-
從零到精通完整閉環:【基礎理論 →RAG開發 → Agent設計 → 模型微調與私有化部署調→熱門技術】5大模塊,內容比傳統教材更貼近企業實戰!
-
大量真實項目案例: 帶你親自上手搞數據清洗、模型調優這些硬核操作,把課本知識變成真本事?!
02適學人群
應屆畢業生?: 無工作經驗但想要系統學習AI大模型技術,期待通過實戰項目掌握核心技術。
零基礎轉型?: 非技術背景但關注AI應用場景,計劃通過低代碼工具實現“AI+行業”跨界?。
業務賦能突破瓶頸: 傳統開發者(Java/前端等)學習Transformer架構與LangChain框架,向AI全棧工程師轉型?。
vx掃描下方二維碼即可
本教程比較珍貴,僅限大家自行學習,不要傳播!更嚴禁商用!
03 入門到進階學習路線圖
大模型學習路線圖,整體分為5個大的階段:
04 視頻和書籍PDF合集
從0到掌握主流大模型技術視頻教程(涵蓋模型訓練、微調、RAG、LangChain、Agent開發等實戰方向)
新手必備的大模型學習PDF書單來了!全是硬核知識,幫你少走彎路(不吹牛,真有用)
05 行業報告+白皮書合集
收集70+報告與白皮書,了解行業最新動態!
06 90+份面試題/經驗
AI大模型崗位面試經驗總結(誰學技術不是為了賺$呢,找個好的崗位很重要)
07 deepseek部署包+技巧大全
由于篇幅有限
只展示部分資料
并且還在持續更新中…
真誠無償分享!!!
vx掃描下方二維碼即可
加上后會一個個給大家發