聊聊AI大模型的上下文工程(Context Engineering)

聊聊AI上下文工程


上下文工程(Context Engineering)技術簡介

核心定義

“上下文工程是一門精細的藝術與科學——其本質是在每個Agent執行步驟中,將恰到好處的信息精準填充至上下文窗口。”
—— Andrej Karpathy(前特斯拉AI總監)

技術類比

計算機系統LLM Agent系統
CPU大語言模型(LLM)
RAM上下文窗口(Context Window)
操作系統調度上下文工程策略

為什么需要上下文工程?

Agent在長任務執行中面臨三大核心挑戰:
?? 上下文污染(幻覺信息混入)
?? 上下文過載(超10萬token后性能驟降)
?? 工具混淆(>30個工具時準確率下降70%)

案例:Anthropic實驗顯示,多Agent系統通過上下文隔離使研究任務準確率提升90.2%


四大核心策略框架

🔧 1. 寫入策略(Write)

場景:保存中間結果避免污染主上下文
技術實現

  • 動態草稿本:LangGraph的State對象持久化會話狀態
# LangGraph狀態對象示例
state = {"scratchpad": "當前計劃步驟:1.檢索用戶歷史 2.驗證策略合規性"}
  • 長期記憶:Reflexion架構的自我反思記憶機制

ChatGPT實踐:自動生成跨會話的用戶偏好記憶

🎯 2. 選擇策略(Select)

突破點:動態裝載關鍵信息
關鍵技術

  • 工具動態裝載:RAG篩選相關工具描述
# RAG工具選擇(工具數>30時準確率↑3倍)
relevant_tools = vector_db.search("支付API", top_k=3)
  • 記憶精準召回:Embedding+知識圖譜雙索引

Claude Code實踐:CLAUDE.md文件固化高頻指令

🗜? 3. 壓縮策略(Compress)

臨界值:上下文達窗口95%時自動觸發
最佳實踐

技術壓縮率適用場景
遞歸摘要(Recursive)70%長對話歷史
Provence修剪器85%問答場景
結構化提取90%合同/代碼等文檔處理
🛡? 4. 隔離策略(Isolate)

架構革新

  • 多Agent沙箱:HuggingFace的CodeAgent架構

HuggingFace的CodeAgent架構

  • 狀態隔離:LangGraph字段級上下文控制

優勢:隔離高風險操作,阻止92%的提示注入攻擊


LangGraph工程實踐

🛠? 全鏈路支持方案
策略實現方式性能增益
寫入控制Checkpoint持久化機制減少40%重復推理
動態選擇BigTool語義工具檢索庫工具選擇速度↑77%
智能壓縮消息列表自動摘要APIToken消耗↓65%
沙箱隔離E2B/Pyodide安全執行環境錯誤率↓58%
📊 效能監控方案
# LangSmith監控示例(關鍵指標)
metrics = {"context_utilization": "92%", "tool_call_success": "98%","hallucination_rate": "0.7%"
}

行業應用啟示

  1. 金融合規場景
    Anthropic航空客服系統:

    • 結合think工具+政策提示模板
    • 合規檢查準確率↑54%
  2. 代碼Agent設計
    Windsurf最佳實踐:

    1. AST語義代碼分塊  
    2. 知識圖譜索引  
    3. 動態重排上下文
    
  3. 醫療診斷Agent
    關鍵創新:

    • DICOM影像隔離沙箱處理
    • 診斷依據動態裝載機制

核心結論

? 上下文≠內存垃圾場:精準度 > 信息量
? 動態優于靜態:實時裝載擊敗全量加載
? 隔離創造價值:多Agent架構提升上限

“未來3年,上下文工程能力將成為Agent開發者的核心競爭力” - LangChain CTO

立即行動

  1. 用LangSmith分析上下文瓶頸
  2. 在關鍵節點實施Write-Select-Compress-Isolate四步策略
  3. 優先測試工具動態裝載與沙箱隔離

文檔版本:v2.1 | 基于LangChain技術白皮書(2025)
注:保留英文術語便于跨團隊協作,關鍵概念附技術實現參考


參考

https://blog.langchain.com/context-engineering-for-agents/

更多技術干貨歡迎關注微信公眾號“風雨同舟的AI筆記”~

【轉載須知】:轉載請注明原文出處及作者信息

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/88520.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/88520.shtml
英文地址,請注明出處:http://en.pswp.cn/web/88520.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

searxng 對接openweb-UI實現大模型通過國內搜索引擎在線搜索

先看一下 qwen3-4b模型的效果 SearXNG簡介:SearXNG 是一個免費的互聯網元搜索引擎,它匯總了來自各種搜索服務和數據庫的結果。用戶既不會被跟蹤,也不會被分析。 官方項目:https://github.com/searxng/searxng-docker 項目文檔&a…

巨人網絡持續加強AI工業化管線,Lovart國內版有望協同互補

在游戲行業全面邁入 AI 工業化時代的關鍵窗口期,巨人網絡正以系統性布局和前瞻性戰略加速AI內容生產閉環,其構建的AI工業化生產管線及多模態大模型能力矩陣,正釋放出顯著的生產效率和創意表達力。公司內部數據顯示,自研AI代碼生成…

TypeScript---class類型

一.簡介 TypeScript 完全支持 ES2015 中引入的 class 關鍵字。 與其他 JavaScript 語言功能一樣,TypeScript 添加了類型注釋和其他語法,以允許你表達類和其他類型之間的關系。 1.字段 (1).在申明時同時給出類型 class Person {name: string;age: nu…

vue3中實現echarts打印功能

目錄一、創建項目二、項目引入echarts1、下載依賴2、項目引用3、編寫建議echarts圖表三、打印功能1、增加打印按鈕2、打印方法3、效果一、創建項目 老規矩,先從創建項目開始 npm create vitelatest print-demo(項目名稱)第一步出現的框架選擇vue,然后回車 第二步…

今日行情明日機會——20250711

上證指數放量收上影線,但依然強勢,維持在5天均線上,后續調整后,上行的概率依然大;個股上漲偏多。深證指數緩慢上漲,已經突破下跌趨勢線,目前依舊沿著5日線上行,后市依然值得期待。20…

「日拱一碼」024 機器學習——防止過擬合

目錄 數據層面 數據增強 數據正則化 ?數據采樣 模型結構層面 簡化模型 添加正則化層 早停法(Early Stopping) 訓練過程層面 使用交叉驗證 使用集成學習 調整學習率 防止過擬合是機器學習中一個非常重要的問題,它可以幫助模型在新…

持有對象-泛型和類型安全的容器

我們需要管理一批對象序列,但是又對實際運行的時候的對象類型和對象序列長度不確定的時候,用簡單的對象引用無法滿足,java有ArrayList,Map,Set等這些容器類提供,這些都實現了Collections接口,所以都屬于Collections類。…

《財稅企業經營管理秘籍(一):行業適配的獲客方式》

在財稅服務這片競爭激烈的紅海中,客戶資源如同氧氣——沒有它,企業寸步難行。然而殘酷的現實是,許多財稅企業正深陷“獲客泥潭”:投入巨大精力與成本,換來的卻是轉化渺茫、增長停滯的困境。高質量線索,已成…

使用tensorflow的多項式回歸的例子(一)

多項式回歸例1%matplotlib inlineimport tensorflow as tfimport numpy as npimport matplotlib.pyplot as plttrX np.linspace(-1, 1, 101)num_coeffs 6trY_coeffs [1, 2, 3, 4, 5, 6]trY 0for i in range(num_coeffs):trY trY_coeffs[i] * np.power(trX, i)trY np.rand…

STM32F103C8T6基于HAL庫驅動NB-IoT模塊BC26通信詳 解

一、引言: NB-IoT技術與應用場景NB-IoT( Narrow Band Internet of Things )作為低功耗廣域網( LPWAN )的核心技術,以其廣覆 蓋、低功耗、大連接、低成本的特性,廣泛應用于智能表計、環境監測、…

iOS 性能測試工具全流程:主流工具實戰對比與適用場景

在iOS開發中,性能優化往往被安排到開發后期,甚至上線前才臨時補救。但性能瓶頸通常是架構設計、資源加載、動畫機制等多方面共同作用的結果,僅憑肉眼感知和log輸出,難以精準定位。 一套合適的性能測試工具組合,不僅能幫…

目標檢測:視覺系統中的CNN-Transformer融合網絡

一、背景 無人機(UAVs)在城市自動巡邏中發揮著重要作用,但它們在圖像識別方面面臨挑戰,尤其是小目標檢測和目標遮擋問題。此外,無人機的高速飛行要求檢測系統具備實時處理能力。 為解決這些問題,我們提出了…

揭示宇宙的隱藏對稱性:群論-AI云計算拓展核心內容

通過利用云計算,借助群論對宇宙對稱性的探索,從離散群和李群等基礎概念,逐步深入到量子力學和更高自旋系統中的高級應用。 對稱性遠不止是美學上的吸引力;它是編織在宇宙結構中的一個基本原則。從雪花的復雜圖案到控制粒子的基本定…

前端項目vue3項目集成eslint@9.x跟prettier

tips: 這些涉及編輯器的修改不一定能及時生效,如果沒有生效,可以試試重啟編輯器窗口 編輯器集成 我的編輯器是vscode,需要安裝這兩個編輯器插件eslint prettier我這個配置主要是通過eslint提供的配置cli命令生成,在里面加入了對pr…

登錄超時問題的排查方法與預防經驗分享

??一、排查方法????檢查網絡連接??確保網絡穩定,嘗試重啟路由器或切換網絡(如從WiFi切換到移動數據)。使用命令(如 ping 或 traceroute)測試網絡連通性,排查是否存在丟包或高延遲。??驗證服務端狀…

uniapp,Anroid10+版本如何保存圖片并刪除

Android 10系統開始 進一步增強了平臺功能,為外部存儲設備上的應用和用戶數據提供了更好的保護。作為這項工作的一部分,平臺引入了進一步的改進,以簡化向分區存儲的轉換。 為了讓用戶更好地控制自己的文件,保護用戶隱私數據&#…

Jenkins Pipeline 語法

Pipeline 簡介 Jenkins2.x 的核心是使用 pipeline 來構建項目,也就是流水線,將 Jenkins1.0 版本中基于表單的配置信息比如 JDK/SVN 以及參數的配置都轉變成了代碼,即 pipeline as Code。 傳統的表單方式有以下缺點: 需要大量的 web 表單交互,有時候需要進行很多次的切換…

搭建滲透測試環境

一、基于docker搭建靶場 #此步驟需要科學上網 #從軟件源中下載 docker.io 和 docker -compose 軟件包及其依賴項。 sudo apt-get install docker.io docker-compose #查看docker版本 docker -v #查看docker信息 docker info #重啟docker服務 sudo systemctl daemon-reload sudo…

(一)OpenCV——噪聲去除(降噪)

高斯濾波器(針對高斯噪聲) 高斯噪聲是指它的概率密度函數服從高斯分布(即正態分布)的一類噪聲。常見的高斯噪聲包括起伏噪聲、宇宙噪聲、熱噪聲和散粒噪聲等等。 高斯濾波(Gaussian filter) 包含許多種,包括低通、帶…

百度開源文心 4.5 系列開源大模型 GitCode 本地化部署,硅基流動:文心 vs. DeepSeek vs. Qwen 3.0 深度測評

百度開源文心 4.5 系列開源大模型 GitCode 本地化部署,硅基流動:文心 vs. DeepSeek vs. Qwen 3.0 深度測評 文章目錄百度開源文心 4.5 系列開源大模型 GitCode 本地化部署,硅基流動:文心 vs. DeepSeek vs. Qwen 3.0 深度測評背景百…