淺窺Claude-Prompting for Agents的Talk

Prompting for Agents

請添加圖片描述

先說一句:顏值這么高,你倆要出道啊。

請添加圖片描述
此圖基本就是claude倡導的agent prompt結構了,可以看到經過一年時間的演變,基本都是follow這個結構去寫prompt。我比較喜歡用Role→react→task→histroy→few shot→rules/guidelines這個結構

請添加圖片描述

可以根據這個表評估一下,直接丟給AI也可以

請添加圖片描述

目前比較常見的就這幾個了吧,做的都比較成熟了,當然啦,還有目前超火的AI scientist

請添加圖片描述

  1. Jeremy覺得prompt是很重要的,prompt作為概念工程就是人在給AI賦予insight。
  2. 去設計agent要以agent的角度去思考,把他當成Intern去教,搜索的時候tool 的使用次數,什么時候停止,要清楚的寫出來。
  3. tool selection比較重要, 可能需要你再fewshot和tool description的時候做的比較詳細
  4. 另外一個option就是構建好thought,這個可以依賴模型本身提升比如說RL和人工few shot
  5. prompt可能會導致agent無止境的調用tool并且沒有答案,所以emm,加點rules吧,這也是為啥RL一定程度上對agent很重要
  6. 控制context也就是chat history怎么弄呢,compress,然后summary,絕大情況下還好,但summary肯定會丟一丟丟細節。我覺得目前agent memory部分的工作需要做的更方便易用一點,同時盡可能保留足夠多的細節,同志們還要努力啊。multiagent某種程度上會緩解這個部分問題,其是看任務場景的話,大部分好用的實現都是agent as tools,整體還行。

請添加圖片描述
展示了一個好的tool design的例子,這個確實比我們的做的詳細,很多人偷懶不會寫那么多parameter進去,但是這個對系統擴展不是很友好,我個人不喜歡這種做法,如果不是官方tool call,就用自然語言去描述就比較方便,anyone can make any tools,當然還有一些工作是讓agent自己寫tool加進去的,或許有用。。。但是想想就覺得不是很穩定

請添加圖片描述
claude有個模擬器,牛啊,你可以測試并迭代你的prompt,thought什么的都有展示,有點像langsmith。

請添加圖片描述

eval也是比較重要的一環,感覺可以來個綜合策略去eval?

  1. 這個就是測試的工作啦,面對極端的case,抗壓測測
  2. LLM judge,有點用但不多
  3. 終極解法:轉人工。所以human in the loop 是不可或缺的一環。

請添加圖片描述
一些cases,anyway, try you best to eval.

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/91971.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/91971.shtml
英文地址,請注明出處:http://en.pswp.cn/web/91971.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【MySQL04】:基礎查詢

MySQL的基本查詢表的增刪查改 insert(插入) insert [info] table_name [(colume, [,colume] ...)] values (value_list) ...對于value_list我們通過,作為分隔符 插入替換我們使用on duplicate key update, 表示如果存在主鍵沖突, 會進行更新, 這個字段后面還有寫更新的字段repl…

NGINX反向代理golang后端服務

nginx配置參考(/etc/nginx/sites-available路徑下創建配置文件) server {listen 80; # 監聽80端口server_name ip; # 你的域名或IPlocation / {root /var/www/test_page/;index index.html; # 默認文件try_files $uri $uri/ /index.html; # 單頁…

【秋招筆試】2025.08.03蝦皮秋招筆試-第二題

?? 點擊直達筆試專欄 ??《大廠筆試突圍》 ?? 春秋招筆試突圍在線OJ ?? 筆試突圍在線刷題 bishipass.com 02. 城市規劃的連通網絡 問題描述 A先生是一名城市規劃師,他負責設計一個智能城市的通信網絡。城市被劃分為一個 n m n \times m n

JVM 01 運行區域

Java 虛擬機 跨平臺 虛擬機隱藏平臺差異,解決不同平臺代碼運行結果不一致問題,實現Write Once, Run Anywhere,實現用戶代碼跨平臺。它本身是一個操作系統上的應用程序,將字節碼文件翻譯成特定機器的機器碼。 Java 虛擬機 運行時內…

[學習筆記-AI基礎篇]03_Transfommer與GPT架構學習

介紹GPT-1,GPT-2,GPT-3,GPT-4 GPT-1 介紹2018年6月,OpenAI公司發表了論文"|mproving Language Understanding by Generative Pre-training”《用生成式預訓練提高模型的語言理解力》,推出了具有1.17億個參數的GPT-1(Generative Pre-trainingTransformers,生成式預訓練變換…

HPNetworkCheckControl.dll HPEnvRes.dll hpcasl.dll HpBwcDecode.dll HpBlogic.dll hpbhilxres.dll

在使用電腦系統時經常會出現丟失找不到某些文件的情況,由于很多常用軟件都是采用 Microsoft Visual Studio 編寫的,所以這類軟件的運行需要依賴微軟Visual C運行庫,比如像 QQ、迅雷、Adobe 軟件等等,如果沒有安裝VC運行庫或者安裝…

飛算 JavaAI:給需求分析裝上 “智能大腦“

在軟件開發的漫長旅途中,需求分析是至關重要的起點,其精準度與效率直接關乎整個項目的成敗。傳統的需求分析依賴人工梳理,不僅耗費大量時間與精力,還時常出現理解偏差和邏輯漏洞。而飛算 JavaAI 的橫空出世,猶如為需求…

javacc學習筆記 01、JavaCC本地安裝與測試

文章目錄前言本章節源碼一、什么是javacc二、Mac環境安裝javacc三、javacc測試案例1、編寫詞法描述文件2、借助javacc命令來處理demo01.jj文件3、idea配置輸入參數,運行Adder類方法四、javacc文件編譯類描述4.1、demo1.jj文件生成內容描述&解析轉換過程4.2、解析…

Java基礎-stream流的使用

目錄 案例要求: 實現思路: 代碼: 總結: 案例要求: 實現思路: 創建一個包含學生姓名(String)和選擇地址變量(集合)的實體類,然后將題干數據封裝到集合,然后進行stream操作 代碼: import ja…

virtualbox+UBuntu20.04+內存磁盤擴容

寫在前面:1.由于我寫博客都是偏向個人筆記性質的,所以寫的比較粗糙,如果有疑問私信評論我即可。2.這篇博客的解決方法應該算是“全網”首發吧,因為我為了磁盤擴容真的找了好多相關資料,但是基本都沒有用。如果你也是找…

關于對Spring的理解,以及對spring中的兩大核心概念AOP和IOC的理解

我們先來說一說Spring,從總體上Spring就是一個基礎框架,同時Spring給我們提供了一個Bean容器,用來裝載和管理具體的Bean對象,你像我們之前創建對象的時候就是通過new關鍵字來實現的,但是現在我們只需要告訴容器有哪些對…

Next Terminal 實戰:內網無密碼安全登錄

本文首發于 Anyeの小站,點擊閱讀原文體驗更加。 前言 在日常的 HomeLab 或小型私有云環境中,我們常常通過反向代理(如 Nginx、Caddy 等)將內網服務暴露到公網,方便遠程訪問。然而,一旦端口映射開啟、公網…

WebSocket斷線重連機制:保障實時通信的高可用性

一、為什么需要斷線重連?WebSocket雖提供全雙工通信能力,但實際環境中連接穩定性受多重威脅:??網絡層波動??:Wi-Fi切換、4G/5G信號抖動(觸發onclose事件)??服務端異常??:服務器宕機、主…

低空三維多物理場耦合風洞試驗,保證飛行器的性能安全是低空飛行的底線,是低空經濟發展的基礎

風墻\風矩陣開發背景:2024年被稱為中國低空經濟產業發展元年,國家發改委提出“無安全、不低空”原則,要求低空經濟產業在技術研發、適航認證、運營管理各環節優先保障安全。目前無人機及其他低空飛行器技術已深度融入軍事、民用與工業領域&am…

中文基于Qwen3-235B-2507蒸餾數據集的操作

中文基于Qwen3-235B-2507蒸餾數據集的操作 flyfish 方式1 from datasets import load_dataset from transformers import AutoTokenizer# -------------------------- 配置參數 -------------------------- TOKENIZER_PATH "/media/models/models/Qwen/Qwen3-8B/" #…

論文閱讀筆記:《Dataset Distillation by Matching Training Trajectories》

論文閱讀筆記:《Dataset Distillation by Matching Training Trajectories》1.動機與背景2.核心方法:軌跡匹配(Trajectory Matching)3.實驗與效果4.個人思考與啟發主體代碼算法邏輯總結一句話總結: 這篇論文通過讓合成…

STM32標準庫的工程創建

一.所需文件說明 1.啟動文件startup_xxxx.s 作用:初始化堆棧指針、復位向量、中斷向量表,執行 SystemInit() 后跳轉到 main()。 位置:Libraries/CMSIS/Device/ST/STM32Fxx/Source/Templates/arm/ 文件名: startup_stm32f10x_l…

k8s ceph sc 設置文件系統格式化參數

前言 默認的 sc 文件系統 inode 太少,對于小文件場景,往往會出現容量沒滿,inode 已經用盡的情況,本文說明如何設置 inode。 說明 本文使用的是 rook-ceph 部署的 ceph 作為存儲后端。 xfs 文件系統 sc 創建帶格式化參數的 xfs 文件系統的 sc allowVolumeExpansion: t…

關于Npm和Nvm的用法

npm是個什么東西 npm是什么 node package managernodejs包管理工具處理復雜的包的管理的問題那么使用npm以后就不需要從前端引入相應的代碼和文件等。 npm相關的命令 查看版本npm -v 更新npm install npm5.4.0 更新到最新版本npm install npmlatest 初始化項目 npm ini…

MyBatis高效查詢:簡化JDBC開發實戰

Mybatis MyBatis 是一款優秀持久層(DAO)框架,用于簡化 JDBC 開發 ,原是 Apache 開源項目 iBatis,經歷遷移改名,2010 年從 Apache 遷到 Google Code 并改名,2013 年 11 月遷至 GitHub,官網為 https://mybati…