微軟重磅發布Magentic UI,交互式AI Agent助手實測!

微軟重磅發布Magentic UI,交互式AI Agent助手實測!

請添加圖片描述


何為Magentic UI?

Magentic UI 是微軟于5.19重磅發布的開源Agent助手,并于24日剛更新了第二個版本0.04版

請添加圖片描述

從官方的介紹來看,目標是打造一款 以人為中心 的智能助手,其底層由多個不同的智能體系統驅動,能夠實現網頁瀏覽與操作、代碼生成與執行、文件生成與分析等功能。

它區別于其他一些AI瀏覽器工具的主要區別在于其 透明可控的交互界面,支持高效的人機協同參與。該系統基于微軟的Agent構建框架 AutoGen 構建,目前還處在原型研究階段。

核心功能包括:

???????? 協同規劃:用戶和AI通過聊天和計劃編輯器協作創建并修訂分步執行計劃。
?? 協同任務:用戶可直接通過網頁瀏覽器或聊天界面實時介入并指導任務執行。Magentic-UI 能在需要時主動確認或要求協助。
??? 操作防護:敏感操作需經用戶明確批準后方可執行。
?? 計劃學習與檢索:從過往任務中學習經驗以優化未來自動化流程,并將優秀方案保存至計劃庫。在后續任務中可自動或手動調用已存儲的計劃。
?? 并行任務執行:支持多任務并行運行,會話狀態指示器會實時提示 Magentic-UI 何時需要您的輸入或任務已完成。

設計架構

請添加圖片描述

Magentic-UI 的底層系統是由一組從 AutoGen 的 Magentic-One 系統(如上圖所示)改造而來的專業化 Agent 組構成,各Agent通過模塊化協作實現不同功能:

Agent功能說明

總控代理(Orchestrator)
  • 功能定位:基于大語言模型(LLM)的主控智能體,負責與用戶協同制定計劃、決策何時請求用戶反饋,并向其他智能體分配子任務。
  • 協作流程
    1. 與用戶共同制定分步執行計劃;
    2. 動態判斷需用戶介入的節點;
    3. 將子任務分派至其他智能體執行。
網頁瀏覽代理(WebSurfer)
  • 功能定位:配備網頁瀏覽器的 LLM 智能體,支持多輪次網頁交互操作。
  • 核心能力
    • 根據總控代理的指令,執行點擊、輸入、滾動、頁面跳轉等操作;
    • 超越 AutoGen 多模態網頁瀏覽器:新增標簽管理、選項選擇、文件上傳及多模態查詢支持。
代碼執行代理(Coder)
  • 功能定位:配備 Docker 代碼執行容器的 LLM 智能體。
  • 核心能力
    • 編寫并執行 Python 和 Shell 命令;
    • 將執行結果反饋至總控代理。
文件處理代理(FileSurfer)
  • 功能定位:集成 Docker 容器與 MarkItDown 包文件轉換工具的 LLM 智能體。
  • 核心能力
    • 定位 Magentic-UI 控制目錄下的文件;
    • 將文件轉換為 Markdown 格式并支持內容問答。
用戶代理(UserProxy)
  • 功能定位:代表用戶與系統交互的代理角色。
  • 協作模式:總控代理可將任務直接委派給用戶(而非其他智能體)完成。

用戶交互流程

用戶利用 Magentic UI 的交互流程可以用下圖表示:

具體步驟執行

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/908605.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/908605.shtml
英文地址,請注明出處:http://en.pswp.cn/news/908605.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Python實現快速排序的三種經典寫法及算法解析

今天想熟悉一下python的基礎寫法,那就從最經典的快速排序來開始吧: 1、經典分治寫法(原地排序) 時間復雜度:平均O(nlogn),最壞O(n) 空間復雜度:O(logn)遞歸棧空間 特點:通過左右指針…

海康網絡攝像頭實時取幀轉Opencv數組格式(h,w,3),已實現python、C#

海康攝像頭取幀都是有官方demo的,但是將海康格式的數據轉為Opencv格式的沒有相關demo,而大部分深度學習圖像檢測算法(如YOLO),都是用opencv格式的圖像作為輸入,因此將海康格式數據轉為opencv格式兼容性更強 需要代碼請私信聯系&a…

職坐標IT教育物聯網全棧開發實戰:傳感器到云平臺全鏈路

物聯網全棧開發涉及從終端感知到云端服務的全流程技術整合,其核心在于構建完整的“端-管-云-用”技術鏈條。為幫助開發者系統掌握這一能力,課程圍繞四大模塊展開:傳感器數據采集與處理、通信協議適配與優化、云平臺架構設計及跨平臺應用開發。…

LUFFY(路飛): 使用DeepSeek指導Qwen強化學習

論文標題 Learning to Reason under Off-Policy Guidance 論文地址 https://arxiv.org/pdf/2504.14945 代碼地址 https://github.com/ElliottYan/LUFFY 作者背景 上海人工智能實驗室,西湖大學,南京大學,香港中文大學 動機 目前大模型…

Android Camera Hal中通過Neon指令優化數據拷貝

背景描述: Camera apk普通相機模式錄像操作時,一般是同時請求兩個流,即預覽流和錄像流。對于兩個流輸出圖像格式和分辨率相同的情況下,是不是可以通過一個流拷貝得到另一個流的數據,進而節省掉一個Sensor輸出處理兩次…

WPS word 已有多級列表序號

wps的word中,原來已生成的文檔里,已存在序號。比如,存在2、2.1、2.1.1、2.1.1.1、2.1.1.1.1 5層序號,而且已分為5級。但增加內容的時候,并不會自動增加序號,應該如何解決? 原來長這樣&#xff…

從零開始制作小程序簡單概述

以下是結合案例的“從零制作小紅書風格小程序”的全流程指南,采用小紅書爆款筆記的結構呈現,并附CSDN參考資源👇: 一、核心開發步驟(附工具推薦) 賬號與定位 ? 注冊類型選擇:個人店&#xff08…

【Go語言基礎【13】】函數、閉包、方法

文章目錄 零、概述一、函數基礎1、函數基礎概念2、參數傳遞機制3、返回值特性3.1. 多返回值3.2. 命名返回值3.3. 錯誤處理 二、函數類型與高階函數1. 函數類型定義2. 高階函數(函數作為參數、返回值) 三、匿名函數與閉包1. 匿名函數(Lambda函…

網絡編程之服務器模型與UDP編程

一、服務器模型 在網絡通信中,通常要求一個服務器連接多個客戶端 為了處理多個客戶端的請求,通常有多種表現形式 1、循環服務器模型 一個服務器可以連接多個客戶端,但同一時間只能連接并處理一個客戶的請求 socket() 結構體 bind() listen() …

open3D:三維點云處理

open3d 點云數據處理 爆肝5萬字??Open3D 點云數據處理基礎(Python版)_python 點云 焊縫-CSDN博客 如何用NumPy讀取和保存點云數據 - 知乎 讀取并可視化點云 np.loadtxt 從txt中讀取點集,并open3d顯示單個點云 txt內容:每行皆…

使用聯邦多軌跡圖神經網絡(GNNs)結合稀缺數據預測嬰兒腦連接|文獻速遞-深度學習醫療AI最新文獻

Title 題目 Predicting infant brain connectivity with federated multi-trajectory GNNs using scarce data 使用聯邦多軌跡圖神經網絡(GNNs)結合稀缺數據預測嬰兒腦連接 01 文獻速遞介紹 多模態影像下的嬰兒腦連接演化預測:聯邦學習與…

[特殊字符] 深入理解 Linux 內核進程管理:架構、核心函數與調度機制

Linux 內核作為一個多任務操作系統,其進程管理子系統是核心組成部分之一。無論是用戶應用的運行、驅動行為的觸發,還是系統調度決策,幾乎所有操作都離不開進程的創建、調度與銷毀。本文將從進程的概念出發,深入探討 Linux 內核中進…

第16節 Node.js 文件系統

Node.js 提供一組類似 UNIX(POSIX)標準的文件操作API。 Node 導入文件系統模塊(fs)語法如下所示: var fs require("fs") 異步和同步 Node.js 文件系統(fs 模塊)模塊中的方法均有異步和同步版本&#xff…

《探秘局域網廣播:網絡世界的 “大喇叭”》

揭開局域網廣播的神秘面紗 在當今數字化時代,網絡已成為人們生活和工作中不可或缺的一部分。從日常的網頁瀏覽、社交媒體互動,到企業級的數據傳輸、云計算應用,網絡通信無處不在。在這個龐大而復雜的網絡世界里,數據如同信息流在各個節點之間穿梭,而局域網廣播則是其中一種…

基于Ubuntu22.04安裝SVN服務器之倉庫遷移

基于Ubuntu22.04安裝SVN服務器之倉庫遷移 第一步: 停止svn服務器 第一步: 停止svn服務器 1)建議遷移的時候先把SN服務器停掉,以免操作失敗。 svnserve -d -r /usr/svn第二步:dump出svn代碼庫 1)通過dump出舊的svn服務器上的代碼…

Unity UI 性能優化終極指南 — Image篇

🎯 Unity UI 性能優化終極指南 — Image篇 🧩 Image 是什么? Image 是UGUI中最常用的基本繪制組件支持顯示 Sprite,可以用于背景、按鈕圖標、裝飾等是UI性能瓶頸的頭號來源之一,直接影響Draw Call和Overdraw &#x1…

「Java基本語法」代碼格式與注釋規范

Java代碼的基本格式 Java代碼的規范格式是編寫和維護Java程序的基礎,其中包括類定義、方法定義、代碼縮進、大括號位置等。 1.核心規則 每個Java文件必須包含一個公共類(public class),且Java源文件的文件名必須和這…

2025年AI編程工具推薦

目錄 👑 **一、全能型AI開發環境(IDE)**🛠? **二、AI代碼助手與插件**🎯 **三、垂直領域工具**🇨🇳 **四、國產工具精選**🔮 **五、創新前沿工具**?? **選型建議** 2025年&#x…

【工具使用】STM32CubeMX-FreeRTOS操作系統-信號標志、互斥鎖、信號量篇

一、概述 無論是新手還是大佬,基于STM32單片機的開發,使用STM32CubeMX都是可以極大提升開發效率的,并且其界面化的開發,也大大降低了新手對STM32單片機的開發門檻。 ????本文主要講述STM32芯片FreeRTOS信號標志、互斥鎖和信號…

ArrayList和LinkedList(深入源碼加擴展)

ArrayList 和 LinkedList 是 Java 集合框架中兩種常用的列表實現,它們在底層數據結構、性能特點和適用場景上有顯著的區別。以下是它們的詳細對比以及 ArrayList 的擴容機制。 1. ArrayList 和 LinkedList 的底層區別 (1) 底層數據結構 ArrayList: 基于動態數組(Dynamic Ar…