LLMs之Agent:ChatGPT Agent發布—統一代理系統將研究與行動無縫對接,開啟智能助理新時代

LLMs之Agent:ChatGPT Agent發布—統一代理系統將研究與行動無縫對接,開啟智能助理新時代

目錄

OpenAI重磅發布ChatGPT Agent—統一代理系統將研究與行動無縫對接,開啟智能助理新時代

第一部分:Operator 和深度研究的自然演進

第二部分:一個與您協作、為您工作的智能代理

第三部分:拓展真實世界的實用性

第四部分:使用方式

第五部分:新能力帶來的新風險

第六部分:最強生物風險安全防護

第七部分:可用性

第八部分:局限性與未來展望


OpenAI重磅發布ChatGPT Agent—統一代理系統將研究與行動無縫對接,開啟智能助理新時代

地址

地址:https://openai.com/index/introducing-chatgpt-agent/

時間

2025717

作者

OpenAI

第一部分:Operator 和深度研究的自然演進

OpenAI 將此前獨立的 Operator(可在網頁上進行點擊、滾動、輸入等交互操作)與深度研究模型(擅長信息綜合與生成長文報告)合并,形成一個統一的代理系統,使模型既能深入分析信息,又能主動在網頁上執行操作,解決了兩者各自的局限性

核心要點

>> 互補優勢融合:Operator 擅長網頁交互,而深度研究擅長信息匯總;二者合并后,模型能夠同時完成訪問信息和深度分析的全過程
>> 主動式任務執行:新系統不再僅僅生成文本,而是能夠“思考并行動”,根據用戶指令主動在虛擬瀏覽器中執行一系列操作。
>> 無縫切換模式:用戶可在同一對話中,從簡單對話自由過渡到要求模型執行具體操作,流程自然流暢。

經驗與技巧

>> 在實際應用時,可先讓模型簡單瀏覽網頁(文本模式),如需下載文件或登錄,切換至可視化瀏覽器并授權“接管”模式。
>> 對于需要深度報告的任務,明確告知模型所需分析深度與格式,充分利用其深度研究能力。

第二部分:一個與您協作、為您工作的智能代理

ChatGPT Agent 提供了一套多樣化工具,包括可視化瀏覽器、文本瀏覽器、終端API 連接器,可根據任務需求靈活選擇最優執行路徑,并能連接 Gmail、GitHub 等應用,實現與現有工作流的無縫集成。

核心要點

>> 多元化工具箱:可視化瀏覽器用于處理以人類為設計對象的網站,文本瀏覽器便于大規模文本檢索與分析,終端可運行代碼,API 連接器可訪問日歷、收件箱等私有數據。
>> 虛擬計算機環境:所有操作均在獨立的虛擬機中進行,保持任務上下文一致,無需用戶來回切換環境。
>> 實時協作與中斷可控:用戶可隨時中斷、澄清指令或接管瀏覽器,模型會保留已有進度并根據新指示繼續執行。

經驗與技巧

>> 在需要處理敏感數據時,先在瀏覽器中“接管”登錄,確保 API 連接器僅用于讀取權限而不開放過度控制。
>> 面對多步驟任務,可將每一步拆分,引導模型先規劃再執行,以降低因一次性復雜指令帶來的錯誤風險。

第三部分:拓展真實世界的實用性

Agent 能自動執行工作場景中的重復性任務(如將儀表盤轉換為可編輯的演示文稿、更新財務表格)以及個人場景中的生活規劃(如旅行行程、晚宴規劃、預約安排),大幅提升效率

核心要點

>> 職場自動化:準備演示文稿、整理會議日程、生成財務模型、構建競爭分析報告等,模型輸出可直接編輯。
>> 個人助理:規劃和預訂旅行、菜品采購與烹飪計劃、專家預約等一應俱全。
>>?SOTA 性能:在 Humanity’s Last Exam(41.6 pass@1)和 FrontierMath(27.4% 正確率)、內部知識工作基準、DSBench、SpreadsheetBench(45.5%)等評測中多項領先。

經驗與技巧

>> 針對專業任務,可參考Benchmark的示例指令,確保模型在關鍵步驟(如數據下載、圖表生成)中采用正確工具。
>> 在對比多種方案時,利用并行多次嘗試(parallel rollout)提高成功率,并通過自信度指標選出最佳結果。

第四部分:使用方式

用戶可在對話界面的工具下拉菜單中,隨時切換至“agent mode”,描述所需任務并監控模型的每一步操作,還能設置定期自動執行(如每周報告)。

使用地址:https://chatgpt.com/?openaicom-did=bdc39a56-270f-4ce0-9f6c-1736d412fe83&openaicom_referred=true

核心要點

>> 一鍵啟用與描述:選擇“agent mode”后,用自然語言描述任務要求。
>> 操作可視化:執行過程中,屏幕上實時展示模型執行步驟,可中途插入指令或接管操作。
>> 任務調度:支持定期任務,如每周自動生成并發送報告。

經驗與技巧

>> 在首次使用時,可先讓模型執行一遍示例任務,熟悉“屏幕敘述”流程與中斷機制。
>> 對于周期性強的工作,提前配置好模板(例如 PowerPoint、電子表格),并設置自動調度,最大化節省操作時間。

第五部分:新能力帶來的新風險

ChatGPT Agent 可直接在網頁上執行操作并訪問用戶數據,雖然配備了多層次安全控制,但整體風險相較于僅生成內容的模型有所提升,需要用戶在使用時謹慎衡量。

核心要點

>> 提示注入風險:惡意頁面可通過隱藏提示操控模型行為,可能導致敏感數據泄露或誤操作。
>> 誤操作風險:在執行真實交易或發送電子郵件等關鍵操作前,模型會主動請求用戶確認;但用戶仍需保持警惕。
>> 數據隱私控制:提供一鍵刪除瀏覽數據與退出所有會話的功能,且“接管模式”下模型不存儲用戶輸入(如密碼)。

經驗與技巧

>> 勿在未審查過的網址或可疑網頁上啟用 Agent;對于高風險操作,務必手動確認所有請求。
>> 定期清理瀏覽數據,并僅在必要時啟用連接器遵循最小權限原則

第六部分:最強生物風險安全防護

鑒于模型具備執行命令、運行代碼等能力,OpenAI 將 Agent 定為“高生物與化學能力”級別,部署了最全面的生物安全防護措施,并與外部專家合作持續強化安全評估與監測。

核心要點

>> 威脅建模與雙重拒絕訓練:對潛在雙用途生物技術攻擊場景進行全面建模與訓練。
>> 實時分類與監控:持續監測生成內容,防止雙用途信息泄露。
>> 生態協作:與政府、學術機構和 NGO 合作舉辦研討會,確保全球范圍的生物安全防護。

經驗與技巧

>> 在涉及生物或化學敏感話題時,傾向使用更嚴格的“深度研究”模式,以獲得更詳細的風險評估與安全建議。

第七部分:可用性

ChatGPT Agent 自 2025 年 7 月 17 日起面向 Pro、Plus 和 Team 用戶逐步開放,Pro 用戶當日可用,每月配額 400 次,Plus/Team 用戶每月 40 次;Enterprise、教育版將于數周內上線,歐洲地區正在適配中。

核心要點

>> 分層配額:Pro:400 消息/月;Plus/Team:40 消息/月,可額外購買。
>> 區域差異:歐洲經濟區與瑞士用戶暫未開放,需要等待后續迭代。
>> Operator 研究版日落:深度研究功能集成至 Agent,下線前可繼續通過下拉菜單訪問。

經驗與技巧

>> Pro 用戶可根據需求靈活分配配額,團隊可統一購買信用點以滿足高頻使用場景。

第八部分:局限性與未來展望

當前版本仍處于早期階段,幻燈片生成功能為 Beta,格式美觀度與細節打磨尚需改進;未來將持續增強模型效率、深度與多樣性,優化用戶監督體驗。

核心要點

>> 幻燈片功能:目前可生成基本結構,可編輯性強,但導出與預覽偶有差異。
>> 表格編輯:已支持上傳現有電子表格,但幻燈片模板導入功能尚未上線。
>> 持續迭代:下一個版本將重點提升輸出精度、格式優化與監督需求平衡。

經驗與技巧

>> 對于正式演示,目前建議先讓 Agent 生成初稿,再由人工優化排版與視覺元素;
>> 密切關注后續更新公告,及時體驗新功能與改進。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/90559.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/90559.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/90559.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Linux726 raid0,raid1,raid5;raid 創建、保存、停止、刪除

RAID創建 創建raid0 安裝mdadm yum install mdadm mdadm --create /dev/md0 --raid-devices2 /dev/sdb5 /dev/sdb6 [rootsamba caozx26]# mdadm --create /dev/md0 --raid-devices2 /dev/sdb3 /dev/sdb5 --level0 mdadm: Defaulting to version 1.2 metadata mdadm: array /dev…

深入剖析 MetaGPT 中的提示詞工程:WriteCode 動作的提示詞設計

今天,我想和大家分享關于 AI 提示詞工程的文章。提示詞(Prompt)是大型語言模型(LLM)生成高質量輸出的關鍵,而在像 MetaGPT 這樣的 AI 驅動軟件開發框架中,提示詞的設計直接決定了代碼生成的可靠…

關于 ESXi 中 “ExcelnstalledOnly 已禁用“ 的解決方案

第一步:使用ssh登錄esxi esxcli system settings advanced list -o /User/execInstalledOnly可能會得到以下內容 esxcli system settings advanced list -o /User/execInstalledOnlyPath: /User/ExecInstalledOnlyType: integerInt Value: 0Default Int Value: 1Min…

HTML5 Canvas 繪制圓弧效果

HTML5 Canvas 繪制圓弧效果 以下是一個使用HTML5 Canvas繪制圓弧的完整示例&#xff0c;你可以直接在瀏覽器中運行看到效果&#xff1a; <!DOCTYPE html> <html lang"zh-CN"> <head><meta charset"UTF-8"><meta name"view…

智能Agent場景實戰指南 Day 18:Agent決策樹與規劃能力

【智能Agent場景實戰指南 Day 18】Agent決策樹與規劃能力 開篇 歡迎來到"智能Agent場景實戰指南"系列的第18天&#xff01;今天我們將深入探討智能Agent的核心能力之一&#xff1a;決策樹與規劃能力。在現代業務場景中&#xff0c;Agent需要具備類似人類的決策能力…

AI 編程工具 Trae 重要的升級。。。

大家好&#xff0c;我是櫻木。 今天打開 Trae &#xff0c;已經看到它進行圖標升級&#xff0c;之前的圖標&#xff0c;國際和國內版本長得非常像&#xff0c;現在做了很明顯的區分&#xff0c;這點給 Trae 團隊點個贊。 自從 Claude 使出了壓力以來&#xff0c;Cursor 鎖區&…

排序算法,咕咕咕

1.選擇排序void selectsort(vector<int>& v) { for(int i0;i<v.size()-1;i) {int minii;for(int ji1;j<v.size();j){if(v[i]>v[j]){minij;}}if(mini!i)swap(v[i],v[mini]); } }2.堆排序void adjustdown(vector<int>& v,int root,int size) { int …

數據庫查詢系統——pyqt+python實現Excel內查課

一、引言 數據庫查詢系統處處存在&#xff0c;在教育信息化背景下&#xff0c;數據庫查詢技術更已深度融入教務管理場景。本系統采用輕量化架構&#xff0c;結合Excel課表&#xff0c;通過PythonPyQt5實現跨平臺桌面應用&#xff0c;以實現簡單查課效果。 二、GUI界面設計 使用…

base64魔改算法 | jsvmp日志分析并還原

前言 上一篇我們講了標準 base64 算法還原&#xff0c;為了進一步學習 base64 算法特點&#xff0c;本文將結合 jsvmp 日志&#xff0c;實戰還原出 base64 魔改算法。 為了方便大家學習&#xff0c;我將入參和上篇文章一樣&#xff0c;入參為 Hello, World!。 插樁 在js代碼中&…

vue3筆記(2)自用

目錄 一、作用域插槽 二、pinia的使用 一、Pinia 基本概念與用法 1. 安裝與初始化 2. 創建 Store 3. 在組件中使用 Store 4. 高級用法 5、storeToRefs 二、Pinia 與 Vuex 的主要區別 三、為什么選擇 Pinia&#xff1f; 三、定義全局指令 1.封裝通用 DOM 操作&#…

大模型面試回答,介紹項目

1. 模型準備與轉換&#xff08;PC端/服務器&#xff09;你先在PC上下載或訓練好大語言模型&#xff08;如HuggingFace格式&#xff09;。用RKLLM-Toolkit把模型轉換成瑞芯微NPU能用的專用格式&#xff08;.rkllm&#xff09;&#xff0c;并可選擇量化優化。把轉換好的模型文件拷…

Oracle 19.20未知BUG導致oraagent進程內存泄漏

故障現象查詢操作系統進程的使用排序&#xff0c;這里看到oraagent的物理內存達到16G&#xff0c;遠遠超過正常環境&#xff08;正常環境在19.20大概就是100M多一點&#xff09;[rootorastd tmp]# ./hmem|more PID NAME VIRT(kB) SHARED(kB) R…

嘗試幾道算法題,提升python編程思維

一、跳躍游戲題目描述&#xff1a; 給定一個非負整數數組 nums&#xff0c;你最初位于數組的第一個下標。數組中的每個元素代表你在該位置可以跳躍的最大長度。判斷你是否能夠到達最后一個下標。示例&#xff1a;輸入&#xff1a;nums [2,3,1,1,4] → 輸出&#xff1a;True輸入…

【菜狗處理臟數據】對很多個不同時間序列數據的文件聚類—20250722

目錄 具體做法 可視化方法1&#xff1a;PCA降維 可視化方法2、TSNE降維可視化&#xff08;非線性降維&#xff0c;更適合聚類&#xff09; 可視化方法3、輪廓系數評判好壞 每個文件有很多行列的信息&#xff0c;每列是一個駕駛相關的數據&#xff0c;需要對這些文件進行聚類…

Qwen-MT:翻得快,譯得巧

我們再向大家介紹一位新朋友&#xff1a;機器翻譯模型Qwen-MT。開發者朋友們可通過Qwen API&#xff08;qwen-mt-turbo&#xff09;&#xff0c;來直接體驗它又快又準的翻譯技能。 本次更新基于強大的 Qwen3 模型&#xff0c;進一步使用超大規模多語言和翻譯數據對模型進行訓練…

在 OceanBase 中,使用 TO_CHAR 函數 直接轉換日期格式,簡潔高效的解決方案

SQL語句SELECT TO_CHAR(TO_DATE(your_column, DD-MON-YY), YYYY-MM-DD) AS formatted_date FROM your_table;關鍵說明&#xff1a;核心函數&#xff1a;TO_DATE(30-三月-15, DD-MON-YY) → 將字符串轉為日期類型TO_CHAR(..., YYYY-MM-DD) → 格式化為 2015-03-30處理中文月份&a…

pnpm運行electronic項目報錯,npm運行正常。electronic項目打包為exe報錯

pnpm運行electronic項目報錯 使用 pnpm 運行 electronic 項目報錯&#xff0c;npm 運行正常&#xff0c;報錯內容如下 error during start dev server and electron app: Error: Electron uninstallat getElectronPath (file:///E:/project/xxx-vue/node_modules/.pnpm/elect…

8?? 高級特性—— 列表生成式

文章目錄&#x1f9e0; 總結1. 基本語法2. 加篩選條件&#x1f501; 雙層循環&#xff08;全排列&#xff09;&#x1f4c2; 遍歷目錄&#x1f511; 遍歷字典&#x1f521; 轉小寫3. if 和 if...else 的區別4. 練習題&#x1f9e0; 總結 特性用法示例基礎語法[x for x in iter…

DocC的簡單使用

DocC的簡單使用 在寫3GShare中&#xff0c;由于剛開始使用MVC模式來寫東西&#xff0c;對很多東西都不是很熟&#xff0c;經常寫著寫著就忘了自己在寫什么&#xff0c;所以學了一下DocC來加快開發進度 什么是DocC 簡單來說&#xff0c;DocC就是更高級的注釋&#xff0c;雖然…

深入理解C語言快速排序與自省排序(Introsort)

排序算法是計算機科學中最基礎也是最重要的知識之一。快速排序&#xff08;Quicksort&#xff09;因其平均時間復雜度為 O(n log n) 而廣受歡迎&#xff0c;但在最壞情況下會退化到 O(n)。為了克服這一缺點&#xff0c;自省排序&#xff08;Introsort&#xff09; 應運而生&…