大模型學習筆記 day01 提示工程入門1.One-shot Few-shot提示學習法

如何應?和激發?語?模型的各??能?

提示?程 Prompt engineering

  • 通過輸?更加合理的提示,引導模型進?更有效的結果輸出,本質上是?種引導和激發模型能?的?法
  • 更加輕量級的引導?法,嘗試和實施的?檻更低;問題是受限于模型最?對話上下?限制,提示量有限

微調 Fine tuning

  • 通過輸?額外的樣本,對模型部分參數進?修改,從?強化模型某部分能?;本質上也是?種引導和激發模型能?的?法
  • 需要重新訓練模型部分參數,訓練成本較?,且需要精?準備數據,技術實施難度也更?;優勢是可以讓模型永久的強化某??能?;

提示?程和微調的技術關系?

  • 能?提示?程解決的問題,往往不會?微調;?也有很多微調才能夠解決的問題;
  • 更多的時候是作為上下游技術關系,例如要進?本地知識庫的定制化問答,最好的?法就是借助提示?程進?數據標注,然后再利?標注好的數據進?微調

提示?程三??核?技術

  • 提示詞模板設計:相當于是魔法語句,在輸?了某些語句之后,模型能夠更好的完成任務,例如“請?步步進?思考”;
  • 提示示例設計:?前較為流?的提示示例設計是不僅包括問答內容,同時包括推理和解決問題的步驟,從?能夠給予模型更好的引導;
  • 提示流程設計:很多時候模型?法?步到位解決問題,此時就需要設計更加復雜的提示流程,來引導模型通過多步的提示來解決問題

One-shot & Few-shot提示學習法

輸入一些類似問題和問題答案,讓模型參考學習,并在同一個prompt的末尾提出新的問題,依次提升模型的推理能力。

示例:

prompt_Few_shot1 = 'Q:“羅杰有五個網球,他又買了兩盒網球,每盒有3個網球,請問他現在總共有多少個網球?” \A:“現在羅杰總共有11個網球。” \Q:“食堂總共有23個蘋果,如果他們用掉20個蘋果,然后又買了6個蘋果,請問現在食堂總共有多少個蘋果?” \A:'
prompt_Few_shot1

通過思維鏈提示法提升模型推理能力

Zero-shot-CoT提示方法

最為簡單的思維鏈的實現方法是在提示詞尾部追加一句“Let’s think step by step”(請一步步進行推理并得出結論),即可大幅提高模型推理能力

Few-shot-CoT提示方法

Few-shot,Few-shot-CoT的不同之處只是在于需要在提示樣本中不僅給出問題的答案、還同時需要給出問題推導的過程(即思維鏈),從而讓模型學到思維鏈的推導過程,并將其應用到新的問題中

示例

'Q:“羅杰有五個網球,他又買了兩盒網球,每盒有3個網球,請問他現在總共有多少個網球?” \
A:“羅杰一開始有五個網球,又購買了兩盒網球,每盒3個,共購買了6個網球,因此現在總共由5+6=11個網球。因此答案是11。” '

CoT改良方法:LEAST-TO-MOST PROMPTING(LtM提示法)

解決CoT提示方法泛化能力不足的問題——即通過人工編寫的思維鏈提示樣本可能并不能夠很好的遷移到別的問題當中去,換而言之,就是解決問題的流程遷移能力不足,即泛化能力不夠。而這種泛化能力不足則會導致“新的問題”無法使用“老的模板”進行解決。?

?該方法先通過提示過程讓模型找到解決該問題必須要分步解決哪幾個問題,然后再通過依次解決這些問題來解決最原始的問題。

整個提示過程會分為兩個階段進行,第一個階段是自上而下的分解問題(Decompose Question into subquestion),第二個階段是自下而上的依次解決問題(Sequentially Solve Subquestion),而整個依次回答問題的過程,其實就可以看成是CoT的過程,只不過LtM會要求模型根據每個不同的問題,單獨生成解決問題的鏈路,以此做到解決問題流程的“千人千面”,從而能夠更加精準的解決復雜推理問題。而整個過程問題的由少變多,則是LEAST-TO-MOST一詞的來源。

prompt_Zero_shot_MtL1 = 'Q:“羅杰有五個網球,他又買了兩盒網球,每盒有3個網球,請問他現在總共有多少個網球?”\A:為了解決“羅杰總共又多少個網球?”這個問題,我們首先要解決的問題是'
prompt_Zero_shot_MtL1

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/902657.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/902657.shtml
英文地址,請注明出處:http://en.pswp.cn/news/902657.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

FPGA初級項目10——基于SPI的DAC芯片進行數模轉換

FPGA初級項目10——基于SPI的DAC芯片進行數模轉換 DAC芯片介紹 DAC 芯片(數字模擬轉換器)是一種將數字信號轉換為連續模擬信號(如電壓或電流)的集成電路,廣泛應用于電子系統中,連接數字世界與模擬世界。 …

如何在 Windows上安裝 Python 3.6.5?

Windows 系統安裝步驟 下載安裝包 安裝包下載鏈接:https://pan.quark.cn/s/9294ca0fd46a 運行安裝程序 雙擊下載的 .exe 文件(如 python-3.6.5.exe)。 勾選 Add Python 3.6 to PATH(重要!這將自動配置環境變量&…

Cephalon端腦云:神經形態計算+邊緣AI·重定義云端算力

前引:當算力不再是“奢侈品” ,在人工智能、3D渲染、科學計算等領域,算力一直是橫亙在個人與企業面前的“高墻”。高性能服務器價格動輒數十萬元,專業設備維護成本高,普通人大多是望而卻步。然而,Cephalon算…

【信息系統項目管理師】高分論文:論進度管理和成本管理(智慧城管平臺項目)

更多內容請見: 備考信息系統項目管理師-專欄介紹和目錄 文章目錄 論文1、規劃進度管理2、定義活動3、排列活動順序4、估算活動資源5、估算活動持續時間6、制定進度計劃7、控制進度論文 2018年8月,我作為項目經理參與了 XX市智慧城管平臺項目的建設,該項目投資500萬元人民幣…

WebAssembly:開啟高性能Web應用新時代

一、引言 隨著互聯網技術的飛速發展,Web應用的復雜度和性能要求越來越高。傳統的Web開發技術,如JavaScript,雖然功能強大,但在處理復雜計算和高性能需求時仍存在一些局限性。WebAssembly(簡稱Wasm)作為一種…

操作系統進程管理筆記

1. 進程的基本概念 1.1 進程的定義 進程就是運行中的程序。程序本身是沒有生命周期的,它只是存在磁盤上面的一些指令(也可能是一些靜態數據)。是操作系統讓這些字節運行起來,讓程序發揮作用。 1.2 CPU的時分共享 操作系統通過…

Python中random庫的應用

文章目錄 一、random 庫常用函數二、條件語句 隨機數示例1:隨機決定程序分支示例2:模擬概率事件 三、循環語句 隨機數示例1:循環直到滿足隨機條件示例2:隨機次數循環 四、隨機操作數據結構示例1:隨機打亂列表順序示例…

密碼學貨幣混幣器詳解及python實現

目錄 一、前言二、混幣器概述2.1 混幣器的工作原理2.2 關鍵特性三、數據生成與預處理四、系統架構與流程五、核心數學公式六、異步任務調度與 GPU 加速七、PyQt6 GUI 設計八、完整代碼實現九、自查測試與總結十、展望摘要 本博客聚焦 “密碼學貨幣混幣器實現”,以 Python + P…

各種各樣的bug合集

一、連不上數據庫db 1.可能是密碼一大包東西不對; 2.可能是里面某個port和數據庫不一樣(針對于修改了數據庫但是連不上的情況); 3.可能是git代碼沒拉對,再拉一下代碼。? 二、沒有這個包 可能是可以#注釋掉。? …

面陣相機中M12鏡頭和遠心鏡頭的區別及性能優勢

以下是關于面陣相機中M12鏡頭和遠心鏡頭的區別及性能優勢的詳細分析,結合知識庫內容整理如下: 一、M12鏡頭與遠心鏡頭的核心區別 1. 設計原理與光學特性 特性M12鏡頭遠心鏡頭光學設計標準鏡頭設計,無特殊光學校正,依賴傳統光路。…

從內核到應用層:深度剖析信號捕捉技術棧(含sigaction系統調用/SIGCHLD回收/volatile內存屏障)

Linux系列 文章目錄 Linux系列前言一、進程對信號的捕捉1.1 內核對信號的捕捉1.2 sigaction()函數1.3 信號集的修改時機 二、可重入函數三、volatile關鍵字四、SIGCHLD信號 前言 Linux系統中,信號捕捉是指進程可以通過設置信號處理函數來響應特定信號。通過信號捕捉…

DDD領域驅動與傳統CRUD

DDD 是一套 應對復雜業務系統 的設計方法論,核心是 讓代碼直接映射業務邏輯,避免技術實現與業務需求脫節。 關鍵區別: 傳統開發:根據數據庫表寫 CRUD(技術驅動)。DDD:根據業務行為建模&#xf…

20. git diff

基本概述 git diff的作用是:比較代碼差異 基本用法 1.工作區 VS 暫存區 git diff [file]2.暫存區 VS 最新提交 git diff --staged [file] # 或 git diff --cached [file]3.工作區 VS 最新提交 git diff HEAD [file]高級用法 1.比較兩個提交間的差異 git dif…

大模型面經 | 春招、秋招算法面試常考八股文附答案(五)

大家好,我是皮先生!! 今天給大家分享一些關于大模型面試常見的面試題,希望對大家的面試有所幫助。 往期回顧: 大模型面經 | 春招、秋招算法面試常考八股文附答案(RAG專題一) 大模型面經 | 春招、秋招算法面試常考八股文附答案(RAG專題二) 大模型面經 | 春招、秋招算法…

Sql刷題日志(day5)

面試: 1、從數據分析角度,推薦模塊怎么用指標衡量? 推薦模塊主要目的是將用戶進行轉化,所以其主指標是推薦的轉化率推薦模塊的指標一般都通過埋點去收集用戶的行為并完成相應的計算而形成相應的指標數據,而這里的驅動…

封裝 element-ui 二次彈框

author 封裝 element-ui 彈框 param text 文本內容 (不傳默認顯示 確定執行此操作嗎? ) param type 彈框類型(不傳默認warning類型) param title 彈框標題(不傳默認顯示 提示 ) export fun…

【Rust 精進之路之第12篇-生命周期·入門】為何需要與顯式標注 (`‘a`):讓編譯器讀懂引用的“有效期”

系列: Rust 精進之路:構建可靠、高效軟件的底層邏輯 作者: 碼覺客 發布日期: 2025-04-20 引言:懸垂引用的“幽靈”與編譯器的“偵探” 在前面的章節中,我們深入學習了 Rust 的所有權系統,以及如何通過引用 (& 和 &mut) 進行借用,從而在不轉移所有權的情況下安…

[密碼學實戰]CTF競賽高頻加密與解密技術詳解

CTF競賽高頻加密與解密技術詳解 一、CTF加密體系全景圖 在CTF密碼學挑戰中,加解密技術主要分為四大戰域: #mermaid-svg-lmm07BXqYAGYjymI {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-lm…

docker.desktop下安裝普羅米修斯prometheus、grafana并看服務器信息

目標 在docker.desktop下先安裝這三種組件,然后顯示當前服務的CPU等指標。各種坑已踩,用的是當前時間最新的鏡像 核心關系概述 組件角色依賴關系Prometheus開源監控系統,負責 數據采集、存儲、查詢及告警。依賴 Node-Exporter 提供的指標數據。Node-Exporter專用的 數據采集…

《MySQL:MySQL表的內外連接》

表的連接分為內連接和外連接。 內連接 內連接實際上就是利用where子句對兩種表形成的笛卡爾積進行篩選,之前的文章中所用的查詢都是內連接,也是開發中使用的最多的連接查詢。 select 字段 from 表1 inner join 表2 on 連接條件 and 其他條件&#xff1…