淺窺Claude-Prompting for Agents的Talk

淺窺Claude-Prompting for Agents的Talk

web/2025/8/5 17:05:47/文章來源:https://blog.csdn.net/qq_43399648/article/details/149879605

Prompting for Agents

請添加圖片描述

先說一句：顏值這么高，你倆要出道啊。

請添加圖片描述
此圖基本就是claude倡導的agent prompt結構了，可以看到經過一年時間的演變，基本都是follow這個結構去寫prompt。我比較喜歡用Role→react→task→histroy→few shot→rules/guidelines這個結構

請添加圖片描述

可以根據這個表評估一下，直接丟給AI也可以

請添加圖片描述

目前比較常見的就這幾個了吧，做的都比較成熟了，當然啦，還有目前超火的AI scientist

請添加圖片描述

Jeremy覺得prompt是很重要的，prompt作為概念工程就是人在給AI賦予insight。
去設計agent要以agent的角度去思考，把他當成Intern去教，搜索的時候tool 的使用次數，什么時候停止，要清楚的寫出來。
tool selection比較重要，可能需要你再fewshot和tool description的時候做的比較詳細
另外一個option就是構建好thought，這個可以依賴模型本身提升比如說RL和人工few shot
prompt可能會導致agent無止境的調用tool并且沒有答案，所以emm，加點rules吧，這也是為啥RL一定程度上對agent很重要
控制context也就是chat history怎么弄呢，compress，然后summary，絕大情況下還好，但summary肯定會丟一丟丟細節。我覺得目前agent memory部分的工作需要做的更方便易用一點，同時盡可能保留足夠多的細節，同志們還要努力啊。multiagent某種程度上會緩解這個部分問題，其是看任務場景的話，大部分好用的實現都是agent as tools，整體還行。

請添加圖片描述
展示了一個好的tool design的例子，這個確實比我們的做的詳細，很多人偷懶不會寫那么多parameter進去，但是這個對系統擴展不是很友好，我個人不喜歡這種做法，如果不是官方tool call，就用自然語言去描述就比較方便，anyone can make any tools，當然還有一些工作是讓agent自己寫tool加進去的，或許有用。。。但是想想就覺得不是很穩定

請添加圖片描述
claude有個模擬器，牛啊，你可以測試并迭代你的prompt，thought什么的都有展示，有點像langsmith。

請添加圖片描述

eval也是比較重要的一環，感覺可以來個綜合策略去eval？

這個就是測試的工作啦，面對極端的case，抗壓測測
LLM judge，有點用但不多
終極解法：轉人工。所以human in the loop 是不可或缺的一環。

請添加圖片描述
一些cases，anyway， try you best to eval.

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/91971.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/91971.shtml
英文地址，請注明出處：http://en.pswp.cn/web/91971.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

【MySQL04】：基礎查詢

【MySQL04】：基礎查詢

MySQL的基本查詢表的增刪查改 insert(插入) insert [info] table_name [(colume, [,colume] ...)] values (value_list) ...對于value_list我們通過,作為分隔符插入替換我們使用on duplicate key update, 表示如果存在主鍵沖突, 會進行更新, 這個字段后面還有寫更新的字段repl…

閱讀更多...

NGINX反向代理golang后端服務

NGINX反向代理golang后端服務

nginx配置參考（/etc/nginx/sites-available路徑下創建配置文件） server {listen 80; # 監聽80端口server_name ip; # 你的域名或IPlocation / {root /var/www/test_page/;index index.html; # 默認文件try_files $uri $uri/ /index.html; # 單頁…

閱讀更多...

【秋招筆試】2025.08.03蝦皮秋招筆試-第二題

【秋招筆試】2025.08.03蝦皮秋招筆試-第二題

?? 點擊直達筆試專欄 ??《大廠筆試突圍》 ?? 春秋招筆試突圍在線OJ ?? 筆試突圍在線刷題 bishipass.com 02. 城市規劃的連通網絡問題描述 A先生是一名城市規劃師，他負責設計一個智能城市的通信網絡。城市被劃分為一個 n m n \times m n

閱讀更多...

JVM 01 運行區域

JVM 01 運行區域

Java 虛擬機跨平臺虛擬機隱藏平臺差異，解決不同平臺代碼運行結果不一致問題，實現Write Once, Run Anywhere，實現用戶代碼跨平臺。它本身是一個操作系統上的應用程序，將字節碼文件翻譯成特定機器的機器碼。 Java 虛擬機運行時內…

閱讀更多...

[學習筆記-AI基礎篇]03_Transfommer與GPT架構學習

[學習筆記-AI基礎篇]03_Transfommer與GPT架構學習

介紹GPT-1,GPT-2,GPT-3,GPT-4 GPT-1 介紹2018年6月,OpenAI公司發表了論文"|mproving Language Understanding by Generative Pre-training”《用生成式預訓練提高模型的語言理解力》,推出了具有1.17億個參數的GPT-1(Generative Pre-trainingTransformers,生成式預訓練變換…

閱讀更多...

HPNetworkCheckControl.dll HPEnvRes.dll hpcasl.dll HpBwcDecode.dll HpBlogic.dll hpbhilxres.dll

HPNetworkCheckControl.dll HPEnvRes.dll hpcasl.dll HpBwcDecode.dll HpBlogic.dll hpbhilxres.dll

在使用電腦系統時經常會出現丟失找不到某些文件的情況，由于很多常用軟件都是采用 Microsoft Visual Studio 編寫的，所以這類軟件的運行需要依賴微軟Visual C運行庫，比如像 QQ、迅雷、Adobe 軟件等等，如果沒有安裝VC運行庫或者安裝…

閱讀更多...

飛算 JavaAI：給需求分析裝上 “智能大腦“

飛算 JavaAI：給需求分析裝上 “智能大腦“

在軟件開發的漫長旅途中，需求分析是至關重要的起點，其精準度與效率直接關乎整個項目的成敗。傳統的需求分析依賴人工梳理，不僅耗費大量時間與精力，還時常出現理解偏差和邏輯漏洞。而飛算 JavaAI 的橫空出世，猶如為需求…

閱讀更多...

javacc學習筆記 01、JavaCC本地安裝與測試

javacc學習筆記 01、JavaCC本地安裝與測試

文章目錄前言本章節源碼一、什么是javacc二、Mac環境安裝javacc三、javacc測試案例1、編寫詞法描述文件2、借助javacc命令來處理demo01.jj文件3、idea配置輸入參數，運行Adder類方法四、javacc文件編譯類描述4.1、demo1.jj文件生成內容描述&解析轉換過程4.2、解析…

閱讀更多...

Java基礎-stream流的使用

Java基礎-stream流的使用

目錄案例要求： 實現思路： 代碼： 總結： 案例要求： 實現思路： 創建一個包含學生姓名(String)和選擇地址變量(集合)的實體類,然后將題干數據封裝到集合,然后進行stream操作代碼： import ja…

閱讀更多...

virtualbox+UBuntu20.04+內存磁盤擴容

virtualbox+UBuntu20.04+內存磁盤擴容

寫在前面：1.由于我寫博客都是偏向個人筆記性質的，所以寫的比較粗糙，如果有疑問私信評論我即可。2.這篇博客的解決方法應該算是“全網”首發吧，因為我為了磁盤擴容真的找了好多相關資料，但是基本都沒有用。如果你也是找…

閱讀更多...

關于對Spring的理解，以及對spring中的兩大核心概念AOP和IOC的理解

關于對Spring的理解，以及對spring中的兩大核心概念AOP和IOC的理解

我們先來說一說Spring，從總體上Spring就是一個基礎框架，同時Spring給我們提供了一個Bean容器，用來裝載和管理具體的Bean對象，你像我們之前創建對象的時候就是通過new關鍵字來實現的，但是現在我們只需要告訴容器有哪些對…

閱讀更多...

Next Terminal 實戰：內網無密碼安全登錄

Next Terminal 實戰：內網無密碼安全登錄

本文首發于 Anyeの小站，點擊閱讀原文體驗更加。前言在日常的 HomeLab 或小型私有云環境中，我們常常通過反向代理（如 Nginx、Caddy 等）將內網服務暴露到公網，方便遠程訪問。然而，一旦端口映射開啟、公網…

閱讀更多...

WebSocket斷線重連機制：保障實時通信的高可用性

WebSocket斷線重連機制：保障實時通信的高可用性

一、為什么需要斷線重連？WebSocket雖提供全雙工通信能力，但實際環境中連接穩定性受多重威脅：??網絡層波動??：Wi-Fi切換、4G/5G信號抖動（觸發onclose事件）??服務端異常??：服務器宕機、主…

閱讀更多...

低空三維多物理場耦合風洞試驗，保證飛行器的性能安全是低空飛行的底線，是低空經濟發展的基礎

低空三維多物理場耦合風洞試驗，保證飛行器的性能安全是低空飛行的底線，是低空經濟發展的基礎

風墻\風矩陣開發背景：2024年被稱為中國低空經濟產業發展元年，國家發改委提出“無安全、不低空”原則，要求低空經濟產業在技術研發、適航認證、運營管理各環節優先保障安全。目前無人機及其他低空飛行器技術已深度融入軍事、民用與工業領域&am…

閱讀更多...

中文基于Qwen3-235B-2507蒸餾數據集的操作

中文基于Qwen3-235B-2507蒸餾數據集的操作

中文基于Qwen3-235B-2507蒸餾數據集的操作 flyfish 方式1 from datasets import load_dataset from transformers import AutoTokenizer# -------------------------- 配置參數 -------------------------- TOKENIZER_PATH "/media/models/models/Qwen/Qwen3-8B/" #…

閱讀更多...

論文閱讀筆記：《Dataset Distillation by Matching Training Trajectories》

論文閱讀筆記：《Dataset Distillation by Matching Training Trajectories》

論文閱讀筆記：《Dataset Distillation by Matching Training Trajectories》1.動機與背景2.核心方法：軌跡匹配（Trajectory Matching）3.實驗與效果4.個人思考與啟發主體代碼算法邏輯總結一句話總結： 這篇論文通過讓合成…

閱讀更多...

STM32標準庫的工程創建

STM32標準庫的工程創建

一.所需文件說明 1.啟動文件startup_xxxx.s 作用：初始化堆棧指針、復位向量、中斷向量表，執行 SystemInit() 后跳轉到 main()。位置：Libraries/CMSIS/Device/ST/STM32Fxx/Source/Templates/arm/ 文件名： startup_stm32f10x_l…

閱讀更多...

k8s ceph sc 設置文件系統格式化參數

k8s ceph sc 設置文件系統格式化參數

前言默認的 sc 文件系統 inode 太少，對于小文件場景，往往會出現容量沒滿，inode 已經用盡的情況，本文說明如何設置 inode。說明本文使用的是 rook-ceph 部署的 ceph 作為存儲后端。 xfs 文件系統 sc 創建帶格式化參數的 xfs 文件系統的 sc allowVolumeExpansion: t…

閱讀更多...

關于Npm和Nvm的用法

關于Npm和Nvm的用法

npm是個什么東西 npm是什么 node package managernodejs包管理工具處理復雜的包的管理的問題那么使用npm以后就不需要從前端引入相應的代碼和文件等。 npm相關的命令查看版本npm -v 更新npm install npm5.4.0 更新到最新版本npm install npmlatest 初始化項目 npm ini…

閱讀更多...

MyBatis高效查詢：簡化JDBC開發實戰

MyBatis高效查詢：簡化JDBC開發實戰

Mybatis MyBatis 是一款優秀持久層(DAO)框架，用于簡化 JDBC 開發 ，原是 Apache 開源項目 iBatis，經歷遷移改名，2010 年從 Apache 遷到 Google Code 并改名，2013 年 11 月遷至 GitHub，官網為 https://mybati…

閱讀更多...

最新文章