【LLM 論文】Step-Back Prompting:先解決更高層次的問題來提高 LLM 推理能力

論文:Take a Step Back: Evoking Reasoning via Abstraction in Large Language Models

????

Google DeepMind, ICLR 2024, arXiv:2310.06117

論文速讀

該論文受到的啟發是:人類再解決一個包含很多細節的具體問題時,先站在更高的層次上解決一些更加抽象的問題,可以拓展一個更寬闊的上下文環境,從而輔助解決這個具體的問題。

反應到 LLM 中,就是當問 LLM 一個具體的物理題目時,先讓 LLM 解決一個更加高層次的抽象問題 這個問題背后用得到物理定律或法則是什么? ,然后再讓 LLM 去解決那個包含了很多細節的具體的物理題目,可能效果就會更好,準確率更高。

因此,本論文提出了 Step-Back 的 prompting 思路,示例如下:

image-20240510214918541

如上圖所示,上半部分中,original question 是一個具體的物理問題,Step-Back Prompting 先讓 LLM 進行抽象得到一個 StepBack Question,也就是“這個物理問題背后的物理定律是什么”,然后再去檢索這個 StepBack Question 得到相關事實,然后基于以上信息去讓 LLM 做 reasoning 得到 final answer。

簡而言之,Step-Back Prompting 包含兩個簡單的步驟

  • Abstraction:先讓 LLM 根據 original question 提出一個更高層次概念的 step-back question,并檢索這個 step-back question 的相關事實
  • Reasoning:基于高層次概念或原則的事實,LLM 就可以去推理原始問題的解決方案了。

分析討論

StepBack Prompting 思路中的“抽象”通過去除不相關的細節和提煉高級概念或原則來指導具體問題的解決

通過實驗分析,abstraction 對于 LLM 來說是一個簡單的任務,通過一些 few-shot exemplar 即可使用 in-context learning 來學會,但 reasoning 對于 LLM 來說仍然是最難學會的任務,在多個 error cases 上做分析,推理仍然是主要的錯誤來源。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/9883.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/9883.shtml
英文地址,請注明出處:http://en.pswp.cn/web/9883.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Android 屏幕適配全攻略(上)-掌握屏幕單位,應對千變萬化的設備

本文從 Android 開發中常見的長度單位 px、dp、sp 入手,詳細介紹了它們的特點及轉換關系。 接著深入探討了屏幕尺寸、分辨率、像素密度等重要的屏幕指標,幫助讀者全面理解它們之間的聯系。最后,通過實例代碼演示了如何在代碼中進行單位轉換&…

三分鐘上手安全滲透系統Kali Linux

kali linux系統集成了常用的安全滲透工具,省去了安裝工具的時間,做安全相關的工作是非常推薦使用的。 安裝Kalii Linux 安裝系統 一般使用虛擬機進行安裝,Kali Linux基于Debian內核,虛擬機的操作系統選擇Debian 7.x 64 選擇系統…

【SRC實戰】一鍵完成全部任務獲取獎勵

挖個洞先 https://mp.weixin.qq.com/s/LkPfJuuP1K8vaFXRn-8wVg “ 以下漏洞均為實驗靶場,如有雷同,純屬巧合 ” 01 — 漏洞證明 一、業務邏輯 “ 如何欺騙APP完成任務獲取獎勵? ” 1、記錄金幣數量20 2、瀏覽商品詳情頁 3、點擊瀏覽提…

我們應該如何做參與式觀察

記得多年以前,有個朋友問我:對于做觀察,有人通過教授繪畫技巧來教人如何做觀察。你們研究員又不會畫畫,你們如何讓人相信你們更會觀察呢?坦率說,當時我被問住了,因為我從來沒有進行過這樣的對比…

day5Qt作業

服務器端 #include "widget.h" #include "ui_widget.h"Widget::Widget(QWidget *parent): QWidget(parent), ui(new Ui::Widget) {ui->setupUi(this);//準備組件,初始化組件狀態this->setFixedSize(800,600);chatwidget new QListWidge…

代碼隨想錄算法訓練營第四十九天| 123.買賣股票的最佳時機III,188.買賣股票的最佳時機IV

目錄 題目鏈接:123.買賣股票的最佳時機III 思路 代碼 題目鏈接:188.買賣股票的最佳時機IV 思路 代碼 總結 題目鏈接:123.買賣股票的最佳時機III 思路 與之前買賣股票不同的是本題要求最多買賣兩次,那么dp數組以及遞推公式都…

攻擊者正在利用AI,對保險公司發起大規模欺詐

保險欺詐一直是保險行業面臨的重要挑戰之一,尤其隨著技術的進步,欺詐者也在不斷更新其手段,利用AI技術,包括生成式模型、機器學習和數據分析工具等欺騙保險公司,而AI技術的應用正成為他們的新工具,使其犯罪…

如何打造個人IP?

打造個人IP(Intellectual Property)是當今社會中越來越受到關注的話題。個人IP指的是個人在某個領域內所擁有的獨特的、具有商業價值的知識、技能、品牌和影響力。為什么要打造個人IP?如何打造個人IP?下面我將為您詳細解答。 首先…

Navicat連接遠程數據庫時,隔一段時間不操作出現的卡頓問題

使用 Navicat 連接服務器上的數據庫時,如果隔一段時間沒有使用,再次點擊就會出現卡頓的問題。 如:隔一段時間再查詢完數據會出現: 2013 - Lost connection to MySQL server at waiting for initial communication packet, syste…

LinkedList鏈表

LinkedList 的全面說明 LinkList底層實現了雙向鏈表和雙端隊列特點可以添加任意元素(元素可以重復),包括null線程不安全,沒有實現同步 LinkedList 的底層操作機制 LinkedList底層維護了一個雙向鏈表LinkList中維護了兩個屬性fi…

【算法入門賽】A.坐標變換(推薦學習)C++題解與代碼

比賽鏈接:https://www.starrycoding.com/contest/8 題目描述 武漢市可以看做一個二維地圖。 牢 e e e掌握了一項特異功能,他可以“瞬移”,每次瞬移需要分別設定 x x x和 y y y的偏移量 d x dx dx和 d y dy dy,瞬移完成后位置會…

【Fastadmin】表格列改input框輸入編輯,以排序權重為例

目錄 1.自定義權重排序,以字段sort為例 js列代碼 在// 初始化表格table.bootstrapTable({ });的后面添加事件 api里面增加formatter方法,如果存在角色權限問題,控制器添

谷歌外鏈怎么發?

既要數量也要質量,要保證你的鏈接廣泛分布,在數量上,確實需要你的鏈接在各種平臺上有所展現,這樣能提升你網站的知名度和曝光率,但是,光有數量是不夠的,如果這些鏈接的內容不行,那對…

ARIMA模型在河流水質預測中的應用_含代碼

#水質模型 #時間序列 #python應用 ARIMA 時間序列模型簡介 時間序列是研究數據隨時間變化而變化的一種算法,是一種預測性分析算法。它的基本出發點就是事物發展都有連續性,按照它本身固有的規律進行。ARIMA(p,d,q)模型全稱為差分自回歸移動平均模型 (A…

SSH文件傳輸

一、設置SSH密鑰對,實現記住密碼 要避免每次使用scp或ssh時都輸入密碼,你可以設置SSH密鑰對(一對公鑰和私鑰),并將公鑰添加到遠程服務器上。這樣,你的系統可以通過密鑰自動驗證身份,而無需手動…

Blazor入門-基礎知識+vs2022自帶例程的理解

參考: Blazor 教程 - 生成首個應用 https://dotnet.microsoft.com/zh-cn/learn/aspnet/blazor-tutorial/intro Blazor基礎知識:Visual Studio 2022 中的Blazor開發入門_vs2022 blazor webassembly-CSDN博客 https://blog.csdn.net/mzl87/article/detail…

NSSCTF | [SWPUCTF 2021 新生賽]jicao

打開題目&#xff0c;發現高亮顯示了一個 php 腳本 這是腳本的內容 <?php highlight_file(index.php); include("flag.php"); $id$_POST[id]; $jsonjson_decode($_GET[json],true); if ($id"wllmNB"&&$json[x]"wllm") {echo $flag;…

idea中數據庫的連接(保姆級)

點擊idea中的database 然后再點擊加號 創建 然后選擇第一欄data source 再選擇mysql 然后選擇數據庫的連接方式 再輸入密碼 這里我們本來就是localhost所有就不用改 選擇端口號 然后點擊Test Connection 測試連接 第一次連接會下載連接的文件 我們只需要 等待它下載完成就好了 …

文本批量操作指南:文本合并技巧,批量處理大量文本的方法

在數字化時代&#xff0c;文本處理成為我們日常生活和工作中不可或缺的一部分。無論是整理文檔、數據分析還是內容創作&#xff0c;我們都需要處理大量的文本數據。為了提升工作效率&#xff0c;掌握文本批量操作和合并的技巧變得尤為重要。本文將為您提供一份詳細的文本批量操…

機器學習算法應用——CART決策樹

CART決策樹&#xff08;4-2&#xff09; CART&#xff08;Classification and Regression Trees&#xff09;決策樹是一種常用的機器學習算法&#xff0c;它既可以用于分類問題&#xff0c;也可以用于回歸問題。CART決策樹的主要原理是通過遞歸地將數據集劃分為兩個子集來構建決…