LLMs之CriticGPT:CriticGPT的簡介、安裝和使用方法、案例應用之詳細攻略

LLMs之CriticGPT:CriticGPT的簡介、安裝和使用方法、案例應用之詳細攻略

目錄

CriticGPT的簡介

1、簡介

2、CriticGPT的方法

2.1、CriticGPT的訓練方法

2.2、CriticGPT的批評生成方法

3、局限性

4、后續步驟

CriticGPT的安裝和使用方法

CriticGPT的案例應用


CriticGPT的簡介

2024年6月27日,OpenAI官方正式發布CriticGPT,CriticGPT是一個基于 GPT-4 的模型,它撰寫了對 ChatGPT 響應的評論,以幫助人類訓練師在 RLHF 期間發現錯誤

官方地址:https://openai.com/index/finding-gpt4s-mistakes-with-gpt-4/

原始論文:https://cdn.openai.com/llm-critics-help-catch-llm-bugs-paper.pdf

1、簡介

我們訓練了一個基于 GPT-4 的模型,稱為 CriticGPT,用于捕獲 ChatGPT 代碼輸出中的錯誤。我們發現,當人們從 CriticGPT 獲得幫助來審查 ChatGPT 代碼時,他們在 60% 的時間里比沒有幫助的人表現得更好。我們正在開始將類似 CriticGPT 的模型集成到我們的 RLHF 標簽管道中,為我們的訓練師提供明確的 AI 幫助。這是朝著能夠評估先進人工智能系統的輸出邁出的一步,如果沒有更好的工具,人們可能很難對這些結果進行評分。

為 ChatGPT 提供支持的 GPT-4 系列模型通過“人類反饋強化學習”(RLHF) 進行調整,以提供有用和互動性。RLHF 的一個關鍵部分是收集比較,在這些比較中,被稱為 AI 訓練師的人對不同的 ChatGPT 響應進行評分。

隨著我們在推理和模型行為方面的進步,ChatGPT 變得更加準確,它的錯誤變得更加微妙。這可能會使 AI 訓練師在出現不準確時難以發現不準確之處,從而使為 RLHF 提供支持的比較任務變得更加困難。這是 RLHF 的一個基本局限性,并且隨著模型逐漸變得比任何可以提供反饋的人更了解模型,它可能會使調整模型變得越來越困難。

為了幫助應對這一挑戰,我們訓練 CriticGPT 撰寫評論,強調 ChatGPT 答案中的不準確之處。

CriticGPT 的建議并不總是正確的,但我們發現,與沒有 AI 幫助相比,它們可以幫助訓練師通過模型編寫的答案發現更多的問題。此外,當人們使用 CriticGPT 時,人工智能增強了他們的技能,從而比人們單獨工作時更全面的批評,并且比模型單獨工作時更少的幻覺錯誤。在我們的實驗中,第二個隨機訓練師在超過 60% 的時間里更喜歡 Human+CriticGPT 團隊的批評,而不是來自無助者的批評。

2、CriticGPT的方法

2.1、CriticGPT的訓練方法

CriticGPT 也接受了 RLHF 的訓練,類似于 ChatGPT。但與 ChatGPT 不同的是,它看到了大量包含錯誤的輸入,然后它不得不對其進行批評。我們要求 AI 訓練師手動將這些錯誤插入到 ChatGPT 編寫的代碼中,然后編寫示例反饋,就好像他們抓住了剛剛插入的錯誤一樣。然后,同一個人比較了對修改后的代碼的多個批評,這樣他們就可以很容易地判斷評論何時抓住了他們插入的錯誤。在我們的實驗中,我們研究了 CriticGPT 是否可以捕獲插入的錯誤和之前訓練師捕獲的“自然發生的”ChatGPT 錯誤。我們發現,在 63% 的關于自然發生的錯誤的案例中,訓練師更喜歡 CriticGPT 批評而不是 ChatGPT 批評,部分原因是新批評家產生的“吹毛求疵”(無益的小抱怨)更少,產生幻覺問題的頻率也更低。

2.2、CriticGPT的批評生成方法

我們還發現,通過對批評獎勵模型使用額外的測試時搜索,我們可以生成更長、更全面的批評。這種搜索過程使我們能夠平衡我們在代碼中尋找問題的積極程度,并在幻覺和檢測到的錯誤數量之間配置精確度-召回率權衡。這意味著我們可以生成對 RLHF 盡可能有幫助的評論。有關更多詳細信息,請參閱我們的研究論文。

3、局限性

我們在 ChatGPT 的答案上訓練了 CriticGPT,這些答案很短。為了監督未來的代理,我們需要開發可以幫助訓練師理解長期復雜任務的方法。

模型仍然會產生幻覺,有時教練在看到這些幻覺后會犯標簽/標記錯誤。

有時,現實世界的錯誤可能會分散在答案的許多部分。我們的工作重點是可以在一個地方指出的錯誤,但將來我們也需要解決分散的錯誤。

CriticGPT 只能提供有限的幫助:如果一項任務或響應非常復雜,即使是專家在模型幫助下也可能無法正確評估。

4、后續步驟

為了對齊越來越復雜的 AI 系統,我們需要更好的工具。在對 CriticGPT 的研究中,我們發現將 RLHF 應用于 GPT-4 有望幫助人類為 GPT-4 生成更好的 RLHF 數據。我們正計劃進一步擴大這項工作的規模并將其付諸實踐。

CriticGPT的安裝和使用方法

暫時未開源,持續更新中……

CriticGPT的案例應用

持續更新中……

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/40442.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/40442.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/40442.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

“proxy_pass“ directive is duplicate

后面發現是nginx.conf里面proxy pass這里有兩個,注釋其中一個并重新運行即可!

AI并不是開發者的敵人,而是幫助他們實現更高效工作的得力助手。

AI是在幫助開發者還是取代他們? 在軟件開發領域,生成式人工智能(AIGC)正在改變開發者的工作方式。無論是代碼生成、錯誤檢測還是自動化測試,AI工具正在成為開發者的得力助手。然而,這也引發了對開發者職業前…

基于主流SpringBoot進行JavaWeb開發的學習路線

目錄 一、學習路線 (1)第一部分(Web前端開發的技術棧) (2)第二部分(Web后端開發) 二、學習之后必備的技能 三、學習Web開發的基礎與未來的收獲 學完這一類知識目標:…

Mybatis-01 原理

一. JDBC式編程 在 jdbc 編程中,我們最常用的是 PreparedStatement 式的編程,我們看下面這個例子; Connection conn null; PreparedStatement ps null; ResultSet rs null;try {// 1. 注冊驅動Class.forName("com.mysql.jdbc.Drive…

Sping源碼總覽

源碼地址:https://github.com/spring-projects/spring-framework 倉庫地址:https://gitcode.net/qq_42665745/spring/-/tree/master 文章目錄如下: 實現一個簡單的Bean容器Bean 的定義、注冊、獲取Bean有參構造實例化Bean屬性注入資源加載器…

C++11使用std::future和std::promise實現線程同步和異步通信

std::future 和 std::promise 是 C11 引入的標準庫特性,用于實現線程間的異步通信和同步。它們提供了一種機制,使一個線程能夠生成一個值或異常,并讓另一個線程獲取這個值或異常。 (線程A中設置結果) std::promise 用于設置異步操作的結果(線…

【Jupyter Notebook與Git完美融合】在Notebook中駕馭版本控制的藝術

標題:【Jupyter Notebook與Git完美融合】在Notebook中駕馭版本控制的藝術 Jupyter Notebook是一個流行的開源Web應用程序,允許用戶創建和共享包含實時代碼、方程、可視化和解釋性文本的文檔。而Git是一個廣泛使用的分布式版本控制系統,用于跟…

關于C#在WPF中如何使用“抽屜”控件

關于C#在WPF中如何使用“抽屜”控件 1.前提準備2.XAML代碼3.對應的C#代碼4.顯示效果1.前提準備 需要引用MaterialDesign控件庫,關于如何引用,請參照文章——關于C#如何引用MaterialDesign控件庫 2.XAML代碼 <Window x:Class="MaterialDesign_Test.MainWindow"…

化身成羊:關于羊的詞群探析

在西方的神話故事中&#xff0c;像主神宙斯&#xff0c;或者基督教義中的上帝&#xff0c;通常都有化身成羊的形象。 那為什么會這樣呢&#xff1f; 一、什么是神話(myth)&#xff1f; 神話&#xff0c;正式的用詞是 mythology&#xff1a; mythology n.神話&#xff1b;神話…

Http接口RestSharp中StatusCode返回0, 但服務器或本地postman獲取應答正常(C#)

我的本地和其他服務器用同一段代碼都可以訪問&#xff1a; 原代碼&#xff1a; RestClient client new RestClient(url); client.Timeout -1; RestRequest request new RestRequest(Method.POST); request.AddHeader("Authorization", "Bearer " acc…

Echarts中的折線圖,多個Y軸集中在左側(在Vue中使用多個Y軸的折線圖)

簡述&#xff1a;在 ECharts 中&#xff0c;創建一個帶有多個 Y 軸的折線圖&#xff0c;并且將這些 Y 軸都集中顯示在圖表的左側&#xff0c;可以通過合理配置 yAxis 和 series 的屬性來實現。簡單記錄 一. 函數代碼 drawCarNumEcs() {// 初始化echarts圖表,并綁定到id為"…

網絡安全設備——探針

網絡安全設備探針是一種專門用于網絡安全領域的工具&#xff0c;它通過對網絡流量進行監控和分析&#xff0c;幫助發現和防止網絡攻擊。以下是對網絡安全設備探針的詳細解釋&#xff1a; 定義與功能 定義&#xff1a;網絡安全設備探針是一種設備或軟件&#xff0c;它通過捕獲…

【docker】運行階段遇到的問題

目錄 1、查詢docker 下掛載了哪些工具 2、docker中的簡單命令 3、實際場景應用&#xff08;redis&#xff09; 目前工作中僅用到了redis,所以沒有太多經驗可以交流&#xff0c;暫時僅將我目前遇到的進行發布。還請見諒。 1、查詢docker 下掛載了哪些工具 docker ps -a 或者…

Vue組件如何“傳話”?這里有個小秘訣!

?&#x1f308;個人主頁&#xff1a;前端青山 &#x1f525;系列專欄&#xff1a;vue篇 &#x1f516;人終將被年少不可得之物困其一生 依舊青山,本期給大家帶來vue篇專欄內容:vue-組件通信 目錄 Vue組件通信 &#xff08;1&#xff09; props / $emit 1. 父組件向子組件傳…

適合職場小白的待辦事項管理方法和工具

剛入職場那會兒&#xff0c;我每天都像只無頭蒼蠅&#xff0c;忙得團團轉卻效率低下。待辦事項像潮水般涌來&#xff0c;會議、報告、客戶跟進……每一項都像是懸在頭頂的利劍&#xff0c;讓我焦慮不堪。我深知&#xff0c;管理好待辦事項是職場生存的必修課&#xff0c;但該如…

內衣洗衣機哪個牌子好用?傾力推薦四大熱門產品,質量放心

在當今社會&#xff0c;內衣洗衣機已經成為每個家庭必不可少的家電之一。但由于市場上的內衣洗衣機品牌和型號繁多&#xff0c;對于消費者來說&#xff0c;選擇一款實用、性價比高的內衣洗衣機是非常重要的。那么&#xff0c;內衣褲洗衣機哪個品牌最好&#xff1f;接下來我將會…

框架為我們做了什么?

1. SpringBoot 1.1 web服務器 Spring Boot 的 web 服務器原理主要基于其嵌入式服務器的概念&#xff0c;這意味著它內嵌了一個 web 服務器&#xff0c;無需部署到外部服務器上。Spring Boot 內嵌了如 Tomcat、Jetty 或 Undertow 等 servlet 容器。 1.2 servlet Servlet&…

【鴻蒙學習筆記】創建自定義組件

官方文檔&#xff1a;創建自定義組件 目錄標題 自定義組件的基本結構&#xff11;?struct 自定義組件名 {...}&#xff20;ComponentEntry &#xff11;? &#xff12;? &#xff13;? &#xff14;? &#xff15;? &#xff16;? &#xff17;? &#xff18;? &…

Python | Leetcode Python題解之第206題反轉鏈表

題目&#xff1a; 題解&#xff1a; # Definition for singly-linked list. # class ListNode: # def __init__(self, val0, nextNone): # self.val val # self.next next class Solution:def reverseList(self, head: Optional[ListNode]) -> Optio…

VulnHub靶場之DarkHole_1

1 信息收集 1.1 主機發現 arp-scan -l 主機IP地址為&#xff1a;192.168.1.17 1.2 端口和服務掃描 nmap -sS -sV -A -T5 -p- 192.168.1.17 開放22&#xff0c;80端口 1.3 目錄掃描 dirsearch -u 192.168.1.17 2 滲透 2.1 訪問端口 2.2 注冊賬號 暴力破解不現實&#…