Agents 要點

一、Agents概念

? ? ? 人類是這個星球上最強大的 Agent。Agent是一個能感知并自主地采取行動的實體,這里的自主性極其關鍵,Agent要能夠實現設定的目標,其中包括具備學習和獲取知識的能力以提高自身性能。

關鍵點:感知環境、自主決策、具備行動能力,設定明確的目標和任務,適應環境及學習能力

例如?Agent 的復雜程度各不相同,一個簡單的恒溫器可以是一個 Agent

? ? ? ? ? ? ? ? 一個大型的國家或者一個生物群體也可能是個 Agent。

垂直領域 Agent?:

比如 Alphago,還有使用強化學習打游戲的DeepMind的Agent57,更加通用的Gato,OpenAI玩“躲貓貓”的多智能體。

二、prompt 工程

提示詞萬能公式

角色+角色技能+

任務核心關鍵詞+任務目標+任務背景+任務范圍+任務解決與否判定+任務限制條件
輸出格式/形式+輸出量

?

https://github.com/JushBJJ/Mr.-Ranedeer-AI-Tutor

?三、Prompt外掛

外掛知識庫數據庫

這些還不夠,嘗試讓 GPT 調用函數和使用工具,ChatGPT也推出了插件體系。當人們發現大模型的推理能力很差時,開始試圖讓模型自身清楚地描述問題,把問題轉化為 PDDL (Planning Domain Definition Language)格式的描述語言,通過調用通用規劃器來解決規劃問題?。

四、分解與組合

?大模型在大任務執行能力上分解和組合。例如,

?1.MapReduce 模式

將一個大型文本進行摘要,分開摘要在獲得整體摘要

2、思維鏈(Chain of Thought,CoT),

它要求模型展示其思考過程

兩種方式實現,一種是具體說明,即要求模型詳細地、一步步地思考;

另一種是示例說明,即通過給定問題和答案的同時,提供思考過程。當詢問模型時,模型會模仿此過程,逐漸思考并給出答案。

嘗試多種思路來解決問題,然后投票選擇最佳答案,這就是CoT-SC

3、思維樹(ToT, Tree of Thought)

發散的方法也有局限性,例如24點問題,它不能很好地解決,解決方法垂直分解,思維樹(ToT, Tree of Thought)的一個主要思路,它會根據當前的問題分解出多個可能,然后每一個樹節點就是父節點的一個子問題,逐層擴散,遍布整個解空間,一些節點就直接會發現不合適而終止掉,達到了有效剪枝的作用。

?

比如排序問題,排序你可能需要分解和排序,然后再merge,COT就不行了

4、Graph of Tree,GoT

為了解決這個問題,一種名為思維圖(Graph of Tree,GoT)的方法被提出。這種思維圖既可以分解,也可以合并。?

2023年9月26日,清華姚期智團隊又提出了更新的方法——累計推理?

首先會提出一個初步的想法,然后再對這個想法進行驗證,看這個提案是否合適。如果提案合適,就將它添加到圖的下一個節點,每一步都基于已經建立的圖節點進行下一個思考節點的創建,這樣發散、合并或刪除直到達到最終目標狀態,完備性和靈活性大大增強。24點問題上成功率已經達到98%

4、反饋?

分解和組合,不能與外界進行互動,反饋是整個控制論的基石,也是動物體從誕生之初就具備的基本能力。

ReACT讓大模型先進行思考,思考完再進行行動,然后根據行動的結果再進行觀察,再進行思考,這樣一步一步循環下去。基本上就是人類這樣的智能體主要模式。

Agent的框架都會讓模型輸出JSON進行函數調用,OpenAI也就推出了Funtion Calling?

五、Agents

1、AutoGPT

AutoGPT橫空出世,短短數周Star數就超過PyTorch達到90k?

創建一個初始的計劃,然后進入主循環。系統會讓模型判斷在當前計劃下該進行何種行動,接著會執行行動。執行完畢后,結果會寫入下一次循環中。如此,每次決策都會基于之前的結果、記憶和計劃,從而制定出新的行動方案。

2、jarvis gpt

微軟的賈維斯 (Jarvis)一個深度學習任務調度系統,也采用了類似思想。他們主要關注如何調用模型來執行各種深度學習任務,涉及到了先做計劃,再選擇模型,然后執行任務,獲取反饋,然后進入下一輪循環等環節。

?3、Xagents

清華聯合面壁發布了XAgent,提出了雙循環機制在效果上碾壓了AutoGPT

GPT-4也是一種Agent,Agent的概念是大模型的超集

?1.6 Multi-Agent

斯坦福小鎮"開了一個好頭。在這個虛擬的小鎮里,每個角色都是一個單獨的智能體,每天依據制定的計劃按照設定的角色去活動和做事情,

MetaGPT的項目

引起了廣泛關注,這個項目中定義了產品經理、架構師、項目管理員、工程師和質量保證等角色,各角色之間通過相互協作,基本可以勝任完成500行左右代碼的小工程了。?

ChatDev的系統

清華開發了一個名為ChatDev的系統,進一步引入了CEO等角色,這里就不再展開描述。

RPA Agents

?RPA 公司實在智能把 Agent 用于他們的產品調用常見桌面軟件,如淘寶網、釘釘,來自動完成桌面任務。?

Agent 的實現,共性:長短時記憶能力、工具使用能力、通信能力,甚至包括 SOP 的能力

AI在一定程度上模仿了人腦的工作方式,但實際上,機器人和人腦在處理信息時采用的策略有很大的不同。因此,即使在未來,我們也需要繼續改進 AI 框架,以解決這種差距。比如一個百萬位數的加法任務,GPT-4囿于token數的限制是不可能完成這個任務的,但人類卻可以,這恰是人類和AI需要彌補的Gap。

?

五、智能本質

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/43921.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/43921.shtml
英文地址,請注明出處:http://en.pswp.cn/web/43921.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

前端項目筆記經驗-001

做項目有一段時間了,利用下班或者零碎時間的功夫,想分享一些個人心得和感受。與君共勉。 前端應該具備的幾個能力: (1)準備假數據(模擬數據)的能力,因為后端有時候接口沒有準備好&…

element plus 實現跨頁面+跨tab欄多選

文章目錄 element plus 層面數據層面 菜鳥好久沒寫博客了,主要是沒遇見什么很難的問題,今天碰見了一個沒有思路的問題,解決后立馬來和大家伙分享了! 菜鳥今天要實現一個需求,就是:實現跨頁面跨 tab欄 多選…

力學篤行(四)Qt 線程與信號槽

線程與信號槽 1. 主窗口(MainWindow)主線程2. 線程2.1 QThread2.2 QtConcurrent::run()2.3 thread 的調用方式 3. 信號槽3.1 connect3.2 元對象系統中注冊自定義數據類型 附錄一 信號槽機制與主線程進行通信示例 1. 主窗口(MainWindow&#x…

MySQL聯合索引最左匹配原則

MySQL中的聯合索引(也叫組合索引)遵循最左匹配原則,即在創建聯合索引時,查詢條件必須從索引的最左邊開始,否則索引不會被使用。在聯合索引的情況下,數據是按照索引第一列排序,第一列數據相同時才會按照第二列排序。 例…

CVE-2024-27292:Docassemble任意文件讀取漏洞復現 [附POC]

文章目錄 CVE-2024-27292:Docassemble任意文件讀取漏洞復現 [附POC]0x01 前言0x02 漏洞描述0x03 影響版本0x04 漏洞環境0x05 漏洞復現1.訪問漏洞環境2.構造POC3.復現 0x06 修復建議 CVE-2024-27292:Docassemble任意文件讀取漏洞復現 [附POC] 0x01 前言 …

冒泡排序與其C語言通用連續類型排序代碼

冒泡排序與其C語言通用連續類型排序代碼 冒泡排序冒泡排序為交換排序的一種:動圖展示:冒泡排序的特性總結:冒泡排序排整型數據參考代碼(VS2022C語言環境): 冒泡排序C語言通用連續類型排序代碼對比較的方式更…

法律行業守護神:知識庫+AI大模型,解鎖企業知識全周期管理

在法律行業中,搭建一個有效的知識庫并進行企業知識全生命周期管理確實是一項不小的挑戰。法律環境的復雜性和不斷變化的法規要求企業必須持續更新和維護其知識庫,以確保所有信息的準確性和實時性。 這種系統化的信息管理不僅有助于提高律師和法律顧問的…

打卡第9天-----字符串

我在自學的時候,看了卡爾的算法公開課了,有些題目我就照葫蘆畫瓢寫了一遍js代碼,差不多都寫出來了,有暴力解法,有卡爾推薦的思路和方法。話不多說,直接上題上代碼吧: 一、翻轉字符串里的單詞 leetcode題目鏈接:151. 反轉字符串中的單詞 題目描述: 給你一個字符串 s…

5個自動化面試題,助你過關斬將!

面試時,自動化是軟件測試高頻面試內容,通過學習和準備面試題,你會對可能遇到的問題有所準備,從而減輕面試時的緊張感,讓你在面試中穩操勝券! 今天,分享一些在面試中可能會遇到的自動化測試面試…

軟件架構之測評方法

軟件架構之測評方法 第 11 章:測試評審方法11.1 測試方法11.1.1 軟件測試階段11.1.2 白盒測試和黑盒測試11.1.3 缺陷的分類和級別11.1.4 調試 11.2 評審方法11.3 驗證與確認11.4 測試自動化11.5 面向對象的測試 第 11 章:測試評審方法 軟件測試與評審是…

大學生暑假“三下鄉”社會實踐工作新聞投稿指南請查收!

近年來,大學生暑期“三下鄉”社會實踐工作方興未艾,越來越多的大學生通過參與“三下鄉”實踐工作,走出校園,深入基層,體驗農村生活,服務農民,促進農村經濟社會發展,實現了理論與實踐…

算能科技,致力于成為全球領先的通用算力供應商

算能致力于成為全球領先的定制算力提供商,專注于RISC-V、TPU處理器等算力產品的研發和推廣應用。公司遵循全面開源開放的生態理念,攜手行業伙伴推動RISC-V高性能通用計算產業落地;打造覆蓋“云、邊、端”的全場景產品矩陣,為數據中…

【eNSP模擬實驗】三層交換機實現VLAN通信

實驗需求 讓PC1和PC2能夠互相通訊&#xff0c;其中PC1在vlan10中&#xff0c;PC2在vlan20中。 實驗操作 首先把PC1和PC2都配置好ip&#xff0c;配置好之后&#xff0c;點擊右下角的應用 然后&#xff0c;在S2交換機&#xff08;S3700&#xff09;上做如下配置 #進入系統 <…

mvvm模式

MVVM&#xff08;Model-View-ViewModel&#xff09;模式是一種軟件設計模式&#xff0c;特別適用于構建用戶界面&#xff08;UI&#xff09;應用程序&#xff0c;尤其是使用WPF&#xff08;Windows Presentation Foundation&#xff09;、Silverlight和其他XAML技術的應用程序。…

【Redis】Redis十大類型

文章目錄 前言一、string字符串類型二、List列表類型三、 Hash表四、 Set集合五、 ZSet有序集合六、 GEO地理空間七、 HyperLogLog基數統計八、Bitmap位圖九、bitfield位域十、 Stream流10.1 隊列指令10.2 消費組指令10.3 ACK機制 前言 redis是k-v鍵值對進行存儲&#xff0c;k…

Mac上pyenv的安裝及使用

Mac上pyenv的安裝及使用 安裝 brew update brew install pyenv 報錯 git -C /usr/local/Homebrew/Library/Taps/homebrew/homebrew-core fetch --unshallowgit -C /usr/local/Homebrew/Library/Taps/homebrew/homebrew-cask fetch --unshallow那就執行這2句 還報錯 git -C /…

【最經典的79個】軟件測試面試題(內含答案)提前備戰“金九銀十”

001.軟件的生命周期(prdctrm) 計劃階段(planning)-〉需求分析(requirement)-〉設計階段(design)-〉編碼(coding)->測試(testing)->運行與維護(running maintrnacne) 測試用例 用例編號 測試項目 測試標題 重要級別 預置條件 輸入數據 執行步驟 預期結果 0002.問&…

“論軟件維護方法及其應用”寫作框架,軟考高級論文,系統架構設計師論文

論文真題 軟件維護是指在軟件交付使用后&#xff0c;直至軟件被淘汰的整個時間范圍內&#xff0c;為了改正錯誤或滿足 新的需求而修改軟件的活動。在軟件系統運行過程中&#xff0c;軟件需要維護的原因是多種多樣的&#xff0c; 根據維護的原因不同&#xff0c;可以將軟件維護…

CVE-2024-34351 漏洞復現

CVE-2024-34351&#xff0c;由Next.js異步函數createRedirectRenderResult導致的SSRF。 影響版本&#xff1a;13.4.0< Next.js < 14.1.1 參考文章&#xff1a; Next.js Server-Side Request Forgery in Server Actions CVE-2024-34351 GitHub Advisory Database Gi…

數據庫Doris的手動分桶和自動分桶

在Doris中,分桶(Bucketing)是為了更好地管理和查詢數據,將數據分成多個小的邏輯單元。分桶可以通過手動或自動的方式進行配置,每種方式各有其特點和適用場景。 Doris 支持兩層的數據劃分。第一層是分區(Partition),支持 Range 和 List 的劃分方式。第二層是Bucket(Tab…