上下文學習思維鏈COTPrompt工程

一、上下文學習

上下文學習強調在學習過程中考慮問題所處的上下文環境。

1.1 上下文學習的分類

  • 零樣本(Zero-Shot)上下文學習
  • 單樣本(One-Shot)上下文學習
  • 少樣本(Few-Shot)上下文學習

1.2 示例選擇方法

兩個主要依據是相似性和多樣性

  • 直接檢索:然后選取排名靠前的K個示例。
  • 聚類檢索:把所有示例劃分為K個簇,從每個簇中選取最為相似的示例,獲取K個示例。
  • 迭代檢索:下一個示例的選擇依賴于當前的問題和已選擇的示例。

1.3 性能影響因素

  • 預訓練數據:領域豐富度、任務多樣性、訓練數據的分布
  • 預訓練規模:模型參數規模
  • 演示示例:示例的數量和順序

二、思維鏈

2.1 兩種任務類型

(1)System-1任務

  • 依靠直覺和經驗進行瞬間判斷。
  • 隨著規模(參數量、訓練數據、算力)變大,模型性能顯著提升。

(2)System-2任務

  • 運用邏輯分析、計算和有意識的思考來解決。
  • 模型會出現“Flat Scaling Curves”現象——即模型規模增長未帶來預期性能提升。

2.2 思維鏈的定義

在提示中嵌入一系列中間推理步驟,引導大模型模擬人類解決問題時的思考過程,以提升模型處理System-2任務的能力

2.3 思維鏈的分類

在標準COT方法上,出現了許多擴展方法,這些方法按照其推理方式的不同,可以歸納為三種模式:按部就班、三思而行、集思廣益

按部就班模式

強調邏輯的連貫性和步驟的順序性

代表方法:

  • COT:手工構造(費時費力例子,作為示例放入Prompt,引導模型一步一步推理。
  • Zero-Shot COT:無需手工標注,只需提供簡單的提示,如“Let's think step by step”,引導模型自行生成一條推理鏈。

魔法咒語:Let's think step by step.

  • Auto COT:聚類算法自動篩選相關樣本,Zero-Shot生成思維鏈內容作為示例,引導大語言模型生成針對用戶問題的推理鏈和答案。

不足:

  • 局部:在思維過程中不會探索不同的后續內容,即樹的分支。
  • 全局:順序鏈式輸出,不存在回溯的過程。

三思后行模式

強調審慎和靈活

代表方法:

  • Tree of Thoughts(TOT):將推理過程構造為一棵思維樹,允許模型在不確定時進行回溯重新選擇。TOT從拆解、衍生、評估、搜索四個角度構造思維樹。

  • Graph of Thoughts(GOT)

集思廣益模式

強調觀點和方法的多樣性。

代表方法:

  • Self-Consistency:引入多樣性的推理路徑,從中提取并選擇最一致的答案。

  • Universal Self-Consistency:利用LLMs自身選擇最一致答案,支持更多種任務,無需答案提取過程。


三、Prompt工程

3.1 Prompt規范

編寫規范的Prompt是與大語言模型進行有效溝通的基礎。一個標準規范的Prompt通常由任務說明、上下文、問題、輸出格式這幾個部分中的一個或幾個來組成。

3.2 Prompt技巧

  • 復雜問題拆解
  • 追問
  • 適時使用COT
  • 善用心理暗示:角色扮演or情景代入

3.3 Prompt工程應用

可以通過精心設計的Prompt激活大語言模型的內在潛力,而不需要對模型進行微調。Prompt已經在垂域任務、數據增強、智能代理等多個領域發揮出卓越性能。

(1)自然語言接口

  • Text to SQL
  • 代碼生成

(2)大模型支撐的數據合成

  • Self-Instruct

(3)大模型增強的搜索引擎

(4)大模型賦能智能體

經典的智能體通常由大語言模型和四大模塊組成,分別是:配置模塊(Profile)、記憶模塊(Memory)、計劃模塊(Planning)、行動模塊(Action)。

單智能體僅包含一個智能體,交互相對簡單,適用于簡單任務。Prompt設計主要用于引導模型執行特定任務,且圍繞單個上下文。

多智能體包含多個智能體,每個智能體都設定有角色和任務,交互復雜度高。他們協調、合作、競爭,以實現共同或各自目標。

(5)大模型驅動的具身智能

大語言模型是AGI的智慧引擎,機器人是大語言模型走向真實世界的物理載體。


四、參考

bilibili:浙江大學-大模型原理與技術

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/72220.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/72220.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/72220.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

node.js-WebScoket心跳機制(服務器定時發送數據,檢測連接狀態,重連)

1.WebScoket心跳機制是? 基于上一篇文章,WebScoket在瀏覽器和服務器間完成一次握手,兩者間創建持久性連接,并進行雙向數據連接。node.js-node.js作為服務器,前端使用WebSocket(單個TCP連接上進行全雙工通訊…

若依RuoYi-Cloud-Plus微服務版(完整版)前后端部署

一.目標 在瀏覽器上成功登錄進入 二.源碼下載 后端源碼:前往Gitee下載頁面(https://gitee.com/dromara/RuoYi-Cloud-Plus)下載解壓到工作目錄。 前端源碼: 前往Gitee下載頁面(https://gitee.com/JavaLionLi/plus-ui)下載解壓到工作目錄。 文檔地址&a…

Nginx 多協議代理功能(Nginx Multi Protocol Proxy Function)

前言 Nginx 作為高性能的反向代理和負載均衡工具,廣泛應用于 HTTP 和 HTTPS 協議的代理。但你知道嗎?Nginx 還可以代理其他協議,比如 TCP 和 UDP!這些功能讓它在多協議支持方面表現出色,可以用于數據庫代理、流媒體服…

MistralAI挑戰DeepSeek:開源模型能否顛覆行業巨頭

在2025年,世界移動通信大會的展臺上,MistralAI的創始人ArthurMensch對著鏡頭,露出了溫和的笑容。不過他隨后講出的話,就仿佛一顆重磅炸彈,在AI領域引發了巨大的動蕩——他們即將推出的開源模型,據傳能夠超越…

代碼隨想錄第五十二天| 101.孤島的總面積 102.沉沒孤島 103.水流問題 104.建造最大島嶼

孤島的總面積 題目描述 給定一個由 1(陸地)和 0(水)組成的矩陣,島嶼指的是由水平或垂直方向上相鄰的陸地單元格組成的區域,且完全被水域單元格包圍。孤島是那些位于矩陣內部、所有單元格都不接觸邊緣的島…

八叉樹地圖的原理與實現

八叉樹與體素圖 八叉樹地圖 八叉樹地圖是可變分辨率的三維柵格地圖,可以自由調整分辨率,如下所示: 根據點云的數量或密度決定每個葉子方塊是否被占據 體素圖 體素就是固定分辨率的三維柵格地圖,如下所示: 根據點云…

最節省服務器,手搓電子證書查詢系統

用戶預算150元,想要一個最簡單證書查詢系統。前臺能查詢證書、后臺管理員能登錄能修改密碼,證書能夠手動輸入修改刪除、批量導入導出刪除數據、查詢搜索。能夠兼容蘋果、安卓、PC三端瀏覽器,最后幫忙部署到云服務器上。 用戶預算不多&#xf…

什么是全棧?

🤟致敬讀者 🟩感謝閱讀🟦笑口常開🟪生日快樂?早點下班 📘博主相關 🟧博主信息🟨博客首頁🟫專欄推薦🟥活動信息 📃文章前言 🔷文章均為學習工…

作物移栽機器人的結構設計的介紹

作物移栽機器人的結構設計是一個復雜的機械與電子結合的系統工程,單純用代碼來實現整個結構設計是不現實的,因為結構設計更多涉及到機械結構、硬件選型等物理層面的內容。不過,我們可以通過代碼來模擬作物移栽機器人的部分功能,例…

【文獻閱讀】SPRec:用自我博弈打破大語言模型推薦的“同質化”困境

📜研究背景 在如今的信息洪流中,推薦系統已經成為了我們生活中的“貼心小助手”,無論是看電影、聽音樂還是購物,推薦系統都在努力為我們提供個性化的內容。但這些看似貼心的推薦背后,其實隱藏著一個嚴重的問題——同質…

使用1Panel一鍵搭建WordPress網站的詳細教程(全)

嘿,各位想搭建自己網站的朋友們!今天我要跟大家分享我用1Panel搭建WordPress網站的全過程。說實話,我之前對服務器運維一竅不通,但通過這次嘗試,我發現原來建站可以這么簡單!下面是我的親身經歷和一些小技巧…

本地fake server,

C# 制作的系統級tcp 重定向,整個系統只要有訪問指定url,返回自定義內容到訪問端。不局限在瀏覽器單一方面。 再者請理解這個圖的含金量,服務器down機都可以模擬。 用途那就太多了,當然很多用途都不正當。嘿嘿 如果你很想要源代…

設計模式之美

UML建模 統一建模語言(UML)是用來設計軟件的可視化建模語言。它的語言特點是簡單 統一 圖形化 能表達軟件設計中的動態與靜態信息。 UML的分類 動態結構圖: 類圖 對象圖 組件圖 部署圖 動態行為圖: 狀態圖 活動圖 時序圖 協作…

【openGauss】物理備份恢復

文章目錄 1. gs_backup(1)備份(2)恢復(3)手動恢復的辦法 2. gs_basebackup(1)備份(2)恢復① 偽造數據目錄丟失② 恢復 3. gs_probackup(1&#xf…

一文了解JVM的垃圾回收

Java堆內存結構 java堆內存是垃圾回收器管理的主要區域,也被稱為GC堆。 為了方便垃圾回收,堆內存被分為新生代、老年代和永久代。 新創建的對象的內存會在新生代中分配,達到一定存活時長后會移入老年代,而永久代存儲的是類的元數…

SQL子查詢與MyBatis映射

文章目錄 前言1. 數據庫表結構2. MyBatis Mapper XML3. Java 實體類4. 技術點解析5. 執行效果6. 優化建議 前言 提示:這里可以添加本文要記錄的大概內容: 以下是一個結合 SQL 別名、子查詢、MyBatis 字段映射和代碼復用的完整案例,以用戶管…

基于SpringBoot的“校園周邊美食探索及分享平臺”的設計與實現(源碼+數據庫+文檔+PPT)

基于SpringBoot的“校園周邊美食探索及分享平臺”的設計與實現(源碼數據庫文檔PPT) 開發語言:Java 數據庫:MySQL 技術:SpringBoot 工具:IDEA/Ecilpse、Navicat、Maven 系統展示 校園周邊美食探索及分享平臺結構圖…

時間復雜度(Time Complexity)

時間復雜度 1. 什么是時間復雜度? 時間復雜度(Time Complexity)是計算算法執行時間隨輸入規模(n)增長的變化趨勢。它衡量算法的效率,通常使用大 O 記號(Big-O notation)表示&#…

樹莓派:更新源

發行版本 Debian 一直維護著至少三個發行版本:“穩定版(stable)”,“測試版(testing)”和“不穩定版(unstable)”。 發行版目錄 下一代 Debian 正式發行版的代號為 bullseye — 發布…

K8s 1.27.1 實戰系列(八)Service

一、Service介紹 1、Service 的作用與核心功能 Service 是 Kubernetes 中用于抽象一組 Pod 并提供穩定訪問入口的資源。它解決了以下問題: ?Pod IP 不固定:Pod 可能因故障、擴縮容或更新導致 IP 變化,Service 通過 ClusterIP(虛擬 IP)提供固定訪問地址。?負載均衡:自動…