AI Agent 時代開幕-Manus AI與OpenAI Agent SDK掀起新風暴

【本周AI新聞: AI Agent 時代開幕-Manus AI與OpenAI Agent SDK掀起新風暴】 https://www.bilibili.com/video/BV1bkQyYCEvQ/?share_source=copy_web&vd_source=32ed33e1165d68429b2e2eb4749f3f26

最近AI圈子里最火的話題非Manus莫屬!這款由中國武漢創業公司“蝴蝶效應”推出的通用AI代理自上周發布以來,在全球范圍內掀起了一陣熱潮。不僅在國內備受矚目,在國際科技圈也頻頻刷屏。連推特聯合創始人杰克·多西(Jack Dorsey)和Hugging Face產品負責人維克多·穆斯塔爾(Victor Mustar)都對其贊不絕口,甚至有人稱其為“第二個DeepSeek”——畢竟,這款AI的實力和它的“出身”都讓人意想不到。

Manus到底是什么?

官方介紹稱,Manus是全球首個真正意義上的“通用AI代理”。它并不像傳統AI聊天機器人那樣僅依賴單一大模型,而是集成了多個AI模型(包括Anthropic的Claude 3.5 Sonnet和阿里巴巴的開源Qwen的微調版本),并通過多個獨立運行的代理協作完成各種任務。換句話說,它不僅會聊天,更具備主動執行復雜任務的能力。

當然,雖然熱度空前,但能親自體驗到Manus的用戶少之又少。當前,僅有不到1%的候補名單用戶收到了邀請碼,而Manus的Discord頻道成員卻已超過18.6萬,足見市場期待值之高。

MIT科技評論的實測

MIT科技評論最近拿到了Manus的測試權限。整體體驗下來,這款AI確實像一個超高效的智能實習生。它有時候會誤解指令,甚至偶爾偷懶,但邏輯清晰、適應力強,而且給出詳細反饋后會顯著改進。雖然目前并不完美,但確實充滿潛力。

Manus的界面設計簡潔,默認語言為英語。登陸后,用戶會看到一個類似ChatGPT或DeepSeek的主頁,左側顯示歷史對話記錄,中間是聊天輸入框。此外,官方還提供了一系列示例任務,如商業策略制定、交互式學習以及定制化音頻冥想等。

一個獨特的功能是**“Manus’s Computer”**窗口,允許用戶實時查看Manus執行任務的過程,甚至在關鍵時刻介入調整,這點比大多數AI助手都更透明。

為了評測Manus的能力,測試員設置了三個任務:

  1. 列出知名的中國科技記者
  2. 搜尋紐約市兩居室房源
  3. 推薦“35歲以下創新者”候選人
任務1:尋找中國科技記者

初版名單僅包含5個記者,外加5個“榮譽提名”。部分記者的代表作被標注,部分卻沒有。問Manus原因,得到的答案令人哭笑不得——“偷懶了。”
它直言自己在“優化研究效率”的過程中,部分信息沒補充完整。在要求統一標準后,它迅速調整,最終給出了30名記者的詳細列表,并附上了他們目前所在的媒體和代表作。值得一提的是,Manus的輸出可以直接下載為Word或Excel文件,方便后續整理和分享。

不過,它在處理付費墻內容時遇到了障礙,許多新聞網站識別其為“可疑行為”并拒絕訪問。如果未來版本能在遇到此類問題時主動請求用戶協助,體驗會更進一步。

任務2:搜尋紐約房源

Manus起初誤解了“某種戶外空間”的概念,直接篩掉了所有沒有私人陽臺或露臺的房源。但經過調整,它最終生成了一個分層推薦列表,類似Wirecutter風格,包括“最佳整體選擇”、“性價比最高”和“豪華選項”等類別。這項任務花了不到半小時,比整理記者名單快得多,可能是因為房地產數據更公開、結構化程度更高。

任務3:“35歲以下創新者”候選人

這個任務的難度最大。Manus需要研究往年榜單、制定搜索策略、篩選候選人,并確保多元化。然而,由于無法訪問學術論文和部分新聞網站,研究進展受限。三小時后,它僅找到3個完整背景資料的候選人。最終,在強制要求下,它湊出了50個名字,但部分領域和機構過度集中,反映出研究仍有漏洞。在進一步補充“中國候選人”后,它確實找到了一些合適的人選,但不少是國內媒體常見的“明星創新者”。

最終評測

從實測來看,Manus確實是一個直觀、適合無代碼背景用戶的AI工具。在某些任務上,它比ChatGPT DeepResearch表現更好,尤其擅長在開放網絡上進行深入研究。但它的處理速度較慢,特別是涉及大范圍搜索時,效率還有提升空間。

然而,它的穩定性仍需優化。測試過程中,Manus偶爾崩潰,甚至因服務器負載過高拒絕創建新任務。相比ChatGPT DeepResearch,它的任務失敗率更高。Manus的首席科學家Peak Ji表示,團隊正努力改善這一問題。而根據中國媒體36Kr的報道,每次任務的成本僅約2美元,遠低于DeepResearch的20美元,成本優勢明顯。

Manus的一大亮點是透明且可定制的工作流程。它會主動詢問問題,并在“知識”記憶中保留用戶的重要指令,以便未來任務中使用。每個任務的操作步驟也可以回放和分享,提高了可控性和協作體驗。

雖然Manus當前仍存在一些短板,但它已經展示了中國AI公司在通用智能代理上的獨特創新能力,不再只是跟隨西方步伐,而是在自主塑造AI技術的發展方向。未來,如果服務器架構得到優化,它有望成為白領、獨立開發者和小型團隊的新寵

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/897970.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/897970.shtml
英文地址,請注明出處:http://en.pswp.cn/news/897970.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

多時間尺度的配電網深度強化學習無功優化策略的Python示例代碼框架

以下是一個簡單的多時間尺度的配電網深度強化學習無功優化策略的Python示例代碼框架,用于幫助你理解如何使用深度強化學習(以深度Q網絡 DQN 為例)來處理配電網的無功優化問題。在實際應用中,你可能需要根據具體的配電網模型和需求…

劍指 Offer II 081. 允許重復選擇元素的組合

comments: true edit_url: https://github.com/doocs/leetcode/edit/main/lcof2/%E5%89%91%E6%8C%87%20Offer%20II%20081.%20%E5%85%81%E8%AE%B8%E9%87%8D%E5%A4%8D%E9%80%89%E6%8B%A9%E5%85%83%E7%B4%A0%E7%9A%84%E7%BB%84%E5%90%88/README.md 劍指 Offer II 081. 允許重復選擇…

Webpack 前端性能優化全攻略

文章目錄 1. 性能優化全景圖1.1 優化維度概覽1.2 優化效果指標 2. 構建速度優化2.1 緩存策略2.2 并行處理2.3 減少構建范圍 3. 輸出質量優化3.1 代碼分割3.2 Tree Shaking3.3 壓縮優化 4. 運行時性能優化4.1 懶加載4.2 預加載4.3 資源優化 5. 高級優化策略5.1 持久化緩存5.2 模…

虛擬電商-數據庫分庫分表(二)

本文章介紹:使用Sharding-JDBC實現數據庫分庫分表,數據庫分片策略,實現數據庫按月分表 一、Sharding-JDBC使用 1.1.準備環境 步驟一:分庫分表sql腳本導入 創建了兩個數據庫:chongba_schedule0 和chongba_schedule1…

向量數據庫對比以及Chroma操作

一、向量數據庫與傳統類型數據庫 向量數據庫(Vector Storage Engine)與傳統類型的數據庫如關系型數據庫(MySQL)、文檔型數據庫(MongoDB)、鍵值存儲(Redis)、全文搜索引擎&#xff0…

python列表基礎知識

列表 創建列表 1.列表的定義:可變的,有序的數據結構,可以隨時添加或者刪除其中的元素 2.基本語法:字面量【元素1,元素2,元素3】使用[]創建列表 定義變量:變量名稱【元素1,元素2&…

Node.js 的模塊作用域和 module 對象詳細介紹

目錄 代碼示例 1. 創建模塊文件 module-demo.js 2. 導入模塊并使用 module-demo.js 運行結果 總結 在 Node.js 中,每個文件都是一個獨立的模塊,具有自己的作用域。與瀏覽器 JavaScript 代碼不同,Node.js 采用模塊作用域,這意味…

美暢物聯丨WebRTC 技術詳解:構建實時通信的數字橋梁

在互聯網技術飛速發展的今天,實時通信已成為數字生活的核心需求。WebRTC作為一個開源項目,憑借卓越的技術實力與創新理念,為網頁和移動應用帶來了顛覆性的實時通信能力。它突破了傳統通信方式的限制,實現了音頻、視頻和數據在用戶…

excel中兩個表格的合并

使用函數: VLOOKUP函數 如果涉及在excel中兩個工作表之間進行配對合并,則: VLOOKUP(C1,工作表名字!A:B,2,0) 參考: excel表格中vlookup函數的使用方法步驟https://haokan.baidu.com/v?pdwisenatural&vid132733503560775…

單引號與雙引號在不同編程語言中的使用與支持

在編程語言中,單引號和雙引號是常見的符號,它們通常用來表示字符和字符串。然而,如何使用這兩種符號在不同的編程語言中有所不同,甚至有一些語言并不區分單引號和雙引號的用途。本文將詳細介紹不同編程語言中單引號與雙引號的支持…

怎么鑒別金媒v10.51和v10.5的區別!單單從CRM上區分!

2.怎么鑒別程序是10.5還是10.51 ?* 作為商業用戶,升級完全沒有這個擔心,但是這次升級從全局來看清晰度不是很高,不像10.5的升級后臺UI都變化了!你說有漏洞但是我沒遇到過 所以我也不知道升級了啥只能看版本數字是無法區…

python腳本實現服務器內存和cpu使用監控,并記錄日志,可以設置閾值和采樣頻率

Python 腳本,實現以下功能: 按日期自動生成日志文件(例如 cpu_mem_20231001.csv)當 CPU 或內存超過閾值時觸發記錄獨立記錄報警事件(保存到 alert.log)支持自定義閾值和監控間隔 腳本代碼 import psutil …

【Oracle】19c數據庫控制文件多路徑配置

一、關閉數據庫(2個節點實例都要關閉) srvctl stop database -d ora19c 二、多路徑控制文件 打開其中一個節點到nomount狀態 sqlplus / as sysdba startup nomount; [oracleora19c1:/home/oracle]$ rman target / RMAN> restore controlfile to…

大模型訓練全流程深度解析

前些天發現了一個巨牛的人工智能學習網站,通俗易懂,風趣幽默,忍不住分享一下給大家。點擊跳轉到網站。https://www.captainbed.cn/north 文章目錄 1. 大模型訓練概覽1.1 訓練流程總覽1.2 關鍵技術指標 2. 數據準備2.1 數據收集與清洗2.2 數據…

【Linux】進程(1)進程概念和進程狀態

🌟🌟作者主頁:ephemerals__ 🌟🌟所屬專欄:Linux 目錄 前言 一、什么是進程 二、task_struct的內容 三、Linux下進程基本操作 四、父進程和子進程 1. 用fork函數創建子進程 五、進程狀態 1. 三種重…

lws-minimal-ws-server前端分析

index.html index.html是前端入口 <html><head><meta charsetutf-8 http-equiv"Content-Language" content"en"/><!-- 引入js --><script src"/example.js"></script></head><body><img s…

L1-7 統一命名規范(java)

你所在的公司剛剛招收了幾位程序員&#xff0c;然而這些程序員之前在不同的公司工作&#xff0c;所以他們習慣的變量命名規范可能存在差異&#xff0c;需要讓他們都習慣公司要求的命名規范&#xff0c;然而這樣可能會降低他們的工作效率。 你的上司找到了你&#xff0c;希望你…

Flexus應用服務器L實例、X實例以及ECS(彈性計算服務)之間的區別及其適用場景

為了更好地理解Flexus應用服務器L實例、X實例以及ECS&#xff08;彈性計算服務&#xff09;之間的區別及其適用場景&#xff0c;下面我將通過具體的例子來說明每種類型的使用情況。 1. Flexus L實例 特點: 針對高并發和負載均衡進行了優化。它可能包括更快的網絡接口、更高效…

WebRTC中音視頻服務質量QoS之RTT衡量網絡往返時延的加權平均RTT計算機制?詳解

WebRTC中音視頻服務質量QoS之RTT衡量網絡往返時延加權平均RTT計算機制?的詳解 WebRTC中音視頻服務質量QoS之RTT衡量網絡往返時延加權平均RTT計算機制?的詳解 WebRTC中音視頻服務質量QoS之RTT衡量網絡往返時延加權平均RTT計算機制?的詳解前言一、 RTT 網絡往返時延的原理?1、…

odbus TCP轉Modbus RTU網關快速配置案例

Modbus TCP 轉Modbus RTU網關快速配置案例 在工業自動化領域&#xff0c;Modbus 協議以其簡潔和高效而著稱&#xff0c;成為眾多設備通信的首選。 隨著技術的發展和應用場景的變化&#xff0c;Modbus 協議也發展出了不同的版本&#xff0c;其中 Modbus TCP 和 Modbus RTU 是兩種…