【本周AI新聞: AI Agent 時代開幕-Manus AI與OpenAI Agent SDK掀起新風暴】 https://www.bilibili.com/video/BV1bkQyYCEvQ/?share_source=copy_web&vd_source=32ed33e1165d68429b2e2eb4749f3f26
最近AI圈子里最火的話題非Manus莫屬!這款由中國武漢創業公司“蝴蝶效應”推出的通用AI代理自上周發布以來,在全球范圍內掀起了一陣熱潮。不僅在國內備受矚目,在國際科技圈也頻頻刷屏。連推特聯合創始人杰克·多西(Jack Dorsey)和Hugging Face產品負責人維克多·穆斯塔爾(Victor Mustar)都對其贊不絕口,甚至有人稱其為“第二個DeepSeek”——畢竟,這款AI的實力和它的“出身”都讓人意想不到。
Manus到底是什么?
官方介紹稱,Manus是全球首個真正意義上的“通用AI代理”。它并不像傳統AI聊天機器人那樣僅依賴單一大模型,而是集成了多個AI模型(包括Anthropic的Claude 3.5 Sonnet和阿里巴巴的開源Qwen的微調版本),并通過多個獨立運行的代理協作完成各種任務。換句話說,它不僅會聊天,更具備主動執行復雜任務的能力。
當然,雖然熱度空前,但能親自體驗到Manus的用戶少之又少。當前,僅有不到1%的候補名單用戶收到了邀請碼,而Manus的Discord頻道成員卻已超過18.6萬,足見市場期待值之高。
MIT科技評論的實測
MIT科技評論最近拿到了Manus的測試權限。整體體驗下來,這款AI確實像一個超高效的智能實習生。它有時候會誤解指令,甚至偶爾偷懶,但邏輯清晰、適應力強,而且給出詳細反饋后會顯著改進。雖然目前并不完美,但確實充滿潛力。
Manus的界面設計簡潔,默認語言為英語。登陸后,用戶會看到一個類似ChatGPT或DeepSeek的主頁,左側顯示歷史對話記錄,中間是聊天輸入框。此外,官方還提供了一系列示例任務,如商業策略制定、交互式學習以及定制化音頻冥想等。
一個獨特的功能是**“Manus’s Computer”**窗口,允許用戶實時查看Manus執行任務的過程,甚至在關鍵時刻介入調整,這點比大多數AI助手都更透明。
為了評測Manus的能力,測試員設置了三個任務:
- 列出知名的中國科技記者
- 搜尋紐約市兩居室房源
- 推薦“35歲以下創新者”候選人
任務1:尋找中國科技記者
初版名單僅包含5個記者,外加5個“榮譽提名”。部分記者的代表作被標注,部分卻沒有。問Manus原因,得到的答案令人哭笑不得——“偷懶了。”
它直言自己在“優化研究效率”的過程中,部分信息沒補充完整。在要求統一標準后,它迅速調整,最終給出了30名記者的詳細列表,并附上了他們目前所在的媒體和代表作。值得一提的是,Manus的輸出可以直接下載為Word或Excel文件,方便后續整理和分享。
不過,它在處理付費墻內容時遇到了障礙,許多新聞網站識別其為“可疑行為”并拒絕訪問。如果未來版本能在遇到此類問題時主動請求用戶協助,體驗會更進一步。
任務2:搜尋紐約房源
Manus起初誤解了“某種戶外空間”的概念,直接篩掉了所有沒有私人陽臺或露臺的房源。但經過調整,它最終生成了一個分層推薦列表,類似Wirecutter風格,包括“最佳整體選擇”、“性價比最高”和“豪華選項”等類別。這項任務花了不到半小時,比整理記者名單快得多,可能是因為房地產數據更公開、結構化程度更高。
任務3:“35歲以下創新者”候選人
這個任務的難度最大。Manus需要研究往年榜單、制定搜索策略、篩選候選人,并確保多元化。然而,由于無法訪問學術論文和部分新聞網站,研究進展受限。三小時后,它僅找到3個完整背景資料的候選人。最終,在強制要求下,它湊出了50個名字,但部分領域和機構過度集中,反映出研究仍有漏洞。在進一步補充“中國候選人”后,它確實找到了一些合適的人選,但不少是國內媒體常見的“明星創新者”。
最終評測
從實測來看,Manus確實是一個直觀、適合無代碼背景用戶的AI工具。在某些任務上,它比ChatGPT DeepResearch表現更好,尤其擅長在開放網絡上進行深入研究。但它的處理速度較慢,特別是涉及大范圍搜索時,效率還有提升空間。
然而,它的穩定性仍需優化。測試過程中,Manus偶爾崩潰,甚至因服務器負載過高拒絕創建新任務。相比ChatGPT DeepResearch,它的任務失敗率更高。Manus的首席科學家Peak Ji表示,團隊正努力改善這一問題。而根據中國媒體36Kr的報道,每次任務的成本僅約2美元,遠低于DeepResearch的20美元,成本優勢明顯。
Manus的一大亮點是透明且可定制的工作流程。它會主動詢問問題,并在“知識”記憶中保留用戶的重要指令,以便未來任務中使用。每個任務的操作步驟也可以回放和分享,提高了可控性和協作體驗。
雖然Manus當前仍存在一些短板,但它已經展示了中國AI公司在通用智能代理上的獨特創新能力,不再只是跟隨西方步伐,而是在自主塑造AI技術的發展方向。未來,如果服務器架構得到優化,它有望成為白領、獨立開發者和小型團隊的新寵!