微軟重磅發布Magentic UI，交互式AI Agent助手實測！

微軟重磅發布Magentic UI，交互式AI Agent助手實測！

news/2025/6/28 15:37:02/文章來源:https://blog.csdn.net/danmyw/article/details/148434030

微軟重磅發布Magentic UI，交互式AI Agent助手實測！

請添加圖片描述

何為Magentic UI？

Magentic UI 是微軟于5.19重磅發布的開源Agent助手，并于24日剛更新了第二個版本0.04版

請添加圖片描述

從官方的介紹來看，目標是打造一款 以人為中心 的智能助手，其底層由多個不同的智能體系統驅動，能夠實現網頁瀏覽與操作、代碼生成與執行、文件生成與分析等功能。

它區別于其他一些AI瀏覽器工具的主要區別在于其 透明可控的交互界面，支持高效的人機協同參與。該系統基于微軟的Agent構建框架 AutoGen 構建，目前還處在原型研究階段。

核心功能包括：

???????? 協同規劃：用戶和AI通過聊天和計劃編輯器協作創建并修訂分步執行計劃。
?? 協同任務：用戶可直接通過網頁瀏覽器或聊天界面實時介入并指導任務執行。Magentic-UI 能在需要時主動確認或要求協助。
??? 操作防護：敏感操作需經用戶明確批準后方可執行。
?? 計劃學習與檢索：從過往任務中學習經驗以優化未來自動化流程，并將優秀方案保存至計劃庫。在后續任務中可自動或手動調用已存儲的計劃。
?? 并行任務執行：支持多任務并行運行，會話狀態指示器會實時提示 Magentic-UI 何時需要您的輸入或任務已完成。

設計架構

請添加圖片描述

Magentic-UI 的底層系統是由一組從 AutoGen 的 Magentic-One 系統（如上圖所示）改造而來的專業化 Agent 組構成，各Agent通過模塊化協作實現不同功能：

Agent功能說明

總控代理（Orchestrator）

功能定位：基于大語言模型（LLM）的主控智能體，負責與用戶協同制定計劃、決策何時請求用戶反饋，并向其他智能體分配子任務。
協作流程：
1. 與用戶共同制定分步執行計劃；
2. 動態判斷需用戶介入的節點；
3. 將子任務分派至其他智能體執行。

網頁瀏覽代理（WebSurfer）

功能定位：配備網頁瀏覽器的 LLM 智能體，支持多輪次網頁交互操作。
核心能力：
- 根據總控代理的指令，執行點擊、輸入、滾動、頁面跳轉等操作；
- 超越 AutoGen 多模態網頁瀏覽器：新增標簽管理、選項選擇、文件上傳及多模態查詢支持。

代碼執行代理（Coder）

功能定位：配備 Docker 代碼執行容器的 LLM 智能體。
核心能力：
- 編寫并執行 Python 和 Shell 命令；
- 將執行結果反饋至總控代理。

文件處理代理（FileSurfer）

功能定位：集成 Docker 容器與 MarkItDown 包文件轉換工具的 LLM 智能體。
核心能力：
- 定位 Magentic-UI 控制目錄下的文件；
- 將文件轉換為 Markdown 格式并支持內容問答。

用戶代理（UserProxy）

功能定位：代表用戶與系統交互的代理角色。
協作模式：總控代理可將任務直接委派給用戶（而非其他智能體）完成。

用戶交互流程

用戶利用 Magentic UI 的交互流程可以用下圖表示：

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/908605.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/908605.shtml
英文地址，請注明出處：http://en.pswp.cn/news/908605.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

Python實現快速排序的三種經典寫法及算法解析

Python實現快速排序的三種經典寫法及算法解析

今天想熟悉一下python的基礎寫法，那就從最經典的快速排序來開始吧： 1、經典分治寫法（原地排序） 時間復雜度：平均O(nlogn)，最壞O(n) 空間復雜度：O(logn)遞歸棧空間特點：通過左右指針…

閱讀更多...

海康網絡攝像頭實時取幀轉Opencv數組格式(h,w,3)，已實現python、C#

海康網絡攝像頭實時取幀轉Opencv數組格式(h,w,3)，已實現python、C#

海康攝像頭取幀都是有官方demo的，但是將海康格式的數據轉為Opencv格式的沒有相關demo，而大部分深度學習圖像檢測算法(如YOLO)，都是用opencv格式的圖像作為輸入，因此將海康格式數據轉為opencv格式兼容性更強需要代碼請私信聯系&a…

閱讀更多...

職坐標IT教育物聯網全棧開發實戰：傳感器到云平臺全鏈路

職坐標IT教育物聯網全棧開發實戰：傳感器到云平臺全鏈路

物聯網全棧開發涉及從終端感知到云端服務的全流程技術整合，其核心在于構建完整的“端-管-云-用”技術鏈條。為幫助開發者系統掌握這一能力，課程圍繞四大模塊展開：傳感器數據采集與處理、通信協議適配與優化、云平臺架構設計及跨平臺應用開發。…

閱讀更多...

LUFFY(路飛): 使用DeepSeek指導Qwen強化學習

LUFFY(路飛): 使用DeepSeek指導Qwen強化學習

論文標題 Learning to Reason under Off-Policy Guidance 論文地址 https://arxiv.org/pdf/2504.14945 代碼地址 https://github.com/ElliottYan/LUFFY 作者背景上海人工智能實驗室，西湖大學，南京大學，香港中文大學動機目前大模型…

閱讀更多...

Android Camera Hal中通過Neon指令優化數據拷貝

Android Camera Hal中通過Neon指令優化數據拷貝

背景描述： Camera apk普通相機模式錄像操作時，一般是同時請求兩個流，即預覽流和錄像流。對于兩個流輸出圖像格式和分辨率相同的情況下，是不是可以通過一個流拷貝得到另一個流的數據，進而節省掉一個Sensor輸出處理兩次…

閱讀更多...

WPS word 已有多級列表序號

WPS word 已有多級列表序號

wps的word中，原來已生成的文檔里，已存在序號。比如，存在2、2.1、2.1.1、2.1.1.1、2.1.1.1.1 5層序號，而且已分為5級。但增加內容的時候，并不會自動增加序號，應該如何解決？ 原來長這樣&#xff…

閱讀更多...

從零開始制作小程序簡單概述

從零開始制作小程序簡單概述

以下是結合案例的“從零制作小紅書風格小程序”的全流程指南，采用小紅書爆款筆記的結構呈現，并附CSDN參考資源👇： 一、核心開發步驟（附工具推薦） 賬號與定位 ? 注冊類型選擇：個人店&#xff08…

閱讀更多...

【Go語言基礎【13】】函數、閉包、方法

【Go語言基礎【13】】函數、閉包、方法

文章目錄零、概述一、函數基礎1、函數基礎概念2、參數傳遞機制3、返回值特性3.1. 多返回值3.2. 命名返回值3.3. 錯誤處理二、函數類型與高階函數1. 函數類型定義2. 高階函數（函數作為參數、返回值） 三、匿名函數與閉包1. 匿名函數（Lambda函…

閱讀更多...

網絡編程之服務器模型與UDP編程

網絡編程之服務器模型與UDP編程

一、服務器模型在網絡通信中，通常要求一個服務器連接多個客戶端為了處理多個客戶端的請求，通常有多種表現形式 1、循環服務器模型一個服務器可以連接多個客戶端，但同一時間只能連接并處理一個客戶的請求 socket() 結構體 bind() listen() …

閱讀更多...

open3D：三維點云處理

open3D：三維點云處理

open3d 點云數據處理爆肝5萬字??Open3D 點云數據處理基礎（Python版）_python 點云焊縫-CSDN博客如何用NumPy讀取和保存點云數據 - 知乎讀取并可視化點云 np.loadtxt 從txt中讀取點集，并open3d顯示單個點云 txt內容：每行皆…

閱讀更多...

使用聯邦多軌跡圖神經網絡（GNNs）結合稀缺數據預測嬰兒腦連接|文獻速遞-深度學習醫療AI最新文獻

使用聯邦多軌跡圖神經網絡（GNNs）結合稀缺數據預測嬰兒腦連接|文獻速遞-深度學習醫療AI最新文獻

Title 題目 Predicting infant brain connectivity with federated multi-trajectory GNNs using scarce data 使用聯邦多軌跡圖神經網絡（GNNs）結合稀缺數據預測嬰兒腦連接 01 文獻速遞介紹多模態影像下的嬰兒腦連接演化預測：聯邦學習與…

閱讀更多...

[特殊字符] 深入理解 Linux 內核進程管理：架構、核心函數與調度機制

[特殊字符] 深入理解 Linux 內核進程管理：架構、核心函數與調度機制

Linux 內核作為一個多任務操作系統，其進程管理子系統是核心組成部分之一。無論是用戶應用的運行、驅動行為的觸發，還是系統調度決策，幾乎所有操作都離不開進程的創建、調度與銷毀。本文將從進程的概念出發，深入探討 Linux 內核中進…

閱讀更多...

第16節 Node.js 文件系統

第16節 Node.js 文件系統

Node.js 提供一組類似 UNIX（POSIX）標準的文件操作API。 Node 導入文件系統模塊(fs)語法如下所示： var fs require("fs") 異步和同步 Node.js 文件系統（fs 模塊）模塊中的方法均有異步和同步版本&#xff…

閱讀更多...

《探秘局域網廣播：網絡世界的 “大喇叭”》

《探秘局域網廣播：網絡世界的 “大喇叭”》

揭開局域網廣播的神秘面紗在當今數字化時代，網絡已成為人們生活和工作中不可或缺的一部分。從日常的網頁瀏覽、社交媒體互動，到企業級的數據傳輸、云計算應用，網絡通信無處不在。在這個龐大而復雜的網絡世界里，數據如同信息流在各個節點之間穿梭，而局域網廣播則是其中一種…

閱讀更多...

基于Ubuntu22.04安裝SVN服務器之倉庫遷移

基于Ubuntu22.04安裝SVN服務器之倉庫遷移

基于Ubuntu22.04安裝SVN服務器之倉庫遷移第一步: 停止svn服務器第一步: 停止svn服務器 1）建議遷移的時候先把SN服務器停掉，以免操作失敗。 svnserve -d -r /usr/svn第二步：dump出svn代碼庫 1）通過dump出舊的svn服務器上的代碼…

閱讀更多...

Unity UI 性能優化終極指南 — Image篇

Unity UI 性能優化終極指南 — Image篇

🎯 Unity UI 性能優化終極指南 — Image篇 🧩 Image 是什么？ Image 是UGUI中最常用的基本繪制組件支持顯示 Sprite，可以用于背景、按鈕圖標、裝飾等是UI性能瓶頸的頭號來源之一，直接影響Draw Call和Overdraw &#x1…

閱讀更多...

「Java基本語法」代碼格式與注釋規范

「Java基本語法」代碼格式與注釋規范

Java代碼的基本格式 Java代碼的規范格式是編寫和維護Java程序的基礎，其中包括類定義、方法定義、代碼縮進、大括號位置等。 1．核心規則每個Java文件必須包含一個公共類（public class），且Java源文件的文件名必須和這…

閱讀更多...

2025年AI編程工具推薦

2025年AI編程工具推薦

目錄 👑 **一、全能型AI開發環境（IDE）**🛠? **二、AI代碼助手與插件**🎯 **三、垂直領域工具**🇨🇳 **四、國產工具精選**🔮 **五、創新前沿工具**?? **選型建議** 2025年&#x…

閱讀更多...

【工具使用】STM32CubeMX-FreeRTOS操作系統-信號標志、互斥鎖、信號量篇

【工具使用】STM32CubeMX-FreeRTOS操作系統-信號標志、互斥鎖、信號量篇

一、概述無論是新手還是大佬，基于STM32單片機的開發，使用STM32CubeMX都是可以極大提升開發效率的，并且其界面化的開發，也大大降低了新手對STM32單片機的開發門檻。 ????本文主要講述STM32芯片FreeRTOS信號標志、互斥鎖和信號…

閱讀更多...

ArrayList和LinkedList（深入源碼加擴展）

ArrayList和LinkedList（深入源碼加擴展）

ArrayList 和 LinkedList 是 Java 集合框架中兩種常用的列表實現，它們在底層數據結構、性能特點和適用場景上有顯著的區別。以下是它們的詳細對比以及 ArrayList 的擴容機制。 1. ArrayList 和 LinkedList 的底層區別 (1) 底層數據結構 ArrayList：基于動態數組（Dynamic Ar…

閱讀更多...

最新文章