Manus AI比OpenAI Operator更先進嗎?

Manus AI比OpenAI Operator更先進嗎?

通過自動化任務,自主代理讓我們的生活變得更輕鬆,同時也改變了我們與技術的互動方式。去年,OpenAI 通過推出預定任務和操作員代理,為人工智慧聊天機器人帶來了代理功能,而 Anthropic 也通過在 Claude 上使用計算機實現了同樣的功能。現在,中國通過 Manus AI 進入了自主人工智慧代理的世界,與美國同行展開正面競爭。這種新型代理聊天機器人可以利用實時資料檢索、多步驟推理和 API 整合,通過簡單的提示執行復雜的任務,而無需人工監督。在 Manus AI 與 Operator 的對比中,我們將探討中國有史以來第一個人工智慧代理的功能,並將其效能與 OpenAI 在 ChatGPT 上的代理進行比較。

什麼是 Manus AI?

Manus AI 是中國自主研發的人工智慧聊天機器人,可以在雲端非同步完成端到端的任務。與 Grok 和 ChatGPT 等其他聊天機器人不同,Manus 不僅能回答問題、生成內容和提供想法,還能做更多事情。它可以搜尋網路、進行分析、編寫完整的程式碼塊,並自始至終獨立執行任務。

它就像一個多代理系統,由計算機使用者代理、網路搜尋代理、資料分析代理以及更多其他代理組成。利用這些代理工具,聊天機器人可以編寫自己的程式碼,在自己的沙盒中執行程式碼,並在沒有任何人工干預的情況下提供最終結果。也就是說,你可以給它分配任務,關上膝上型電腦,等待任務完成後的通知。

它已經在 Upwork 和 Fiverr 等自由職業平臺上自主完成任務,甚至還參加了 Kaggle 競賽,展示了它的各種能力。雖然有些使用者稱它為“通用的 Devin AI”,但總的來說,Manus AI 集深度研究、操作員、程式碼執行和 MCP(模型上下文協議)於一身!

相關閱讀:Manus:太瘋狂了,中國又一新型自主AI代理

Manus AI 與現有自主代理的對比

Manus AI 的介面類似於 OpenAI 的 ChatGPT 和 Anthropic 的 Claude 3.7,它能在螢幕上實時顯示思維過程,並提供分屏開啟回復的選項。此外,它還提供了在獨立資料夾中訪問所有相關檔案的許可權,與 Claude 的人工智慧類似。

儘管如此,Manus AI 似乎比其他現有的代理工具更加智慧。原因如下

  • 避免多餘任務:它能識別重複的內容或以前完成的任務,避免不必要的重複。
  • 適應新指令:使用者可以在它工作時修改指令,而 Manus AI 會立即根據新的準則進行調整。
  • 更快的響應時間:與其他人工智慧模型相比,Manus AI 處理任務的速度更快。

什麼是ChatGPT Operator?

Operator 是 OpenAI 的一個人工智慧代理,通過 ChatGPT 介面與網頁瀏覽器互動,自主執行任務。它能與按鈕、選單和文字欄位等網頁元素進行互動,執行填寫表格、線上下單和預約等任務。

該功能目前只面向美國和英國的 ChatGPT 專業版使用者,旨在實現重複性線上任務的自動化。雖然它可以獨立執行,但會提示使用者確認特定操作,尤其是涉及登入憑據或付款等敏感資訊的操作。

Manus AI與OpenAI Operator:功能比較

功能 Manus AI OpenAI Operator
自主任務執行 通過將複雜任務分解為可執行步驟,能夠自主規劃和執行復雜任務,直接交付完整結果。 設計用於自主瀏覽網頁瀏覽器,以執行線上購物、預約和填寫表格等任務。
工具整合 在沙盒環境中整合各種工具,包括瀏覽器、程式碼編輯器和應用程式介面,以實現任務自動化。 在網頁瀏覽器中執行,與按鈕和文字欄位等網頁元素互動,以執行任務。
多模態支援 支援多模式輸入和輸出,包括文字、影象等,以處理不同格式的複雜任務。 主要側重於通過瀏覽器互動自動執行基於網路的任務。
效能 在 GAIA 基準測試中取得了優異的效能,單任務成本約為 2 美元,大大低於同類服務。 目前處於研究預覽階段,將根據使用者反饋不斷開發和完善。
可用性 處於測試階段,只能通過邀請碼訪問。感興趣的使用者可通過官方網站申請測試版訪問許可權。 作為研究預覽版提供給美國和英國的 ChatGPT Pro 使用者,並計劃逐步擴大訪問範圍。

Manus AI與OpenAI Operator:效能比較

既然我們已經熟悉了 Manus AI 和 OpenAI Operator 的功能,那就讓我們來試試這些功能,看看這兩種模式的效能如何。在 Manus AI 與 OpenAI Operator 對比的這一部分,我們將在兩個模型上測試三種不同的提示,並比較它們的響應。以下是我們要測試的 3 個任務:

  1. 構建一個遊戲
  2. 設計一個房間
  3. 建立一個網站

任務 1:製作遊戲

在第一個任務中,我們將測試這些代理人工智慧模型的遊戲製作能力。我們將讓它們製作一款 Minecraft 風格的超級馬里奧遊戲,看看它們誰做得更好。

提示詞:Make me a super mario game in Minecraft style.

Source: https://manus.im/

Manus AI響應情況

 

OpenAI Operator響應情況

比較分析

Manus AI 首先以步驟清單的形式列出計劃。它搜尋每個需求並收集各種遊戲元素(如紋理、角色等)的相關資料。然後,該模型在其編碼視窗中編寫遊戲邏輯的 js 程式碼,包括收集的資料,然後在自己的沙盒中執行。在整個過程中,它會顯示每個思考步驟,有時還會根據需要返回並更改任務列表。

OpenAI Operator 使用 CSS 和 JavaScript 建立了一個基於 HTML 的簡單遊戲。它首先設定了基本的遊戲結構,然後在網上搜尋要新增的角色和其他細節。每一步,它都會在動態瀏覽器介面上實時顯示進展情況。在製作遊戲時,它在瀏覽器上開啟了一個現有的超級馬里奧遊戲,然後將其用作模板。

任務 2:設計房間

在下一個任務中,讓 Manus AI 和 OpenAI Operate 從頭開始設計一個空間。我們將向它們提供空間的尺寸、我們需要的傢俱清單和預算。讓我們看看它們能否設計出空間,並在預算範圍內為我們找到合適的產品。

提示詞:Design a 14×16 ft room with a calm, pop culture vibe, including a workspace and bed area. Use plants and decor, starting from scratch with a $15,000 budget. List products to buy and their arrangement for a stylish look.

Source: https://x.com/PriyanshKSingh/status/1897734666314301832

Manus AI響應情況

OpenAI Operator響應情況

比較分析

Manus AI 做出了出色的迴應,為房間的不同部分選擇了傢俱,並進行了整體佈局。雖然最初的佈局是二維的,但它還根據要求建立了三維佈局和北歐風格的設計。在整個過程中,大部分決定都是由聊天機器人做出的,只有在做出迴應後才會詢問使用者的反饋和修改意見。

OpenAI Operator 首先搜尋傢俱和裝飾品,然後列出符合預算的所選物品清單,最後根據所選物品設計佈局。雖然網路搜尋是自主進行的,但它在繼續之前會不斷要求使用者確認每一件物品,因此自始至終都需要人工監督。

任務 3:建立網站

在最後一項任務中,我們將考察這兩個代理工具在建立網站方面的能力。我們將要求這兩個模型建立一個學習量子計算的教育網站。讓我們看看它們能給我們帶來什麼。

提示詞:Create a dynamic teaching webpage for quantum computing.

Source: https://x.com/roxasorag/status/1897670878554648604

Manus AI響應情況

 

對比分析

與之前的任務類似,Manus AI 也能快速理解提示並獲得結果。它實時顯示了整個思考過程,甚至隨著程序不斷修改最初的計劃。最後,代理聊天機器人為量子計算建立了一個多頁面、高度互動的學習中心。

OpenAI Operator 的步驟較少,但在網站建設方面花費了更多時間。它通過實時網路搜尋來了解如何進行提示,並展示了思考過程。最後,它確實編寫了網站的 html 程式碼,但生成的網頁在多次嘗試後仍無法開啟。

總體比較摘要

Task Manus AI OpenAI Operator
構建遊戲 在自己的沙盒中自主地逐步計劃、收集資源、編寫和執行程式碼。 建立一個基於 HTML 的簡單遊戲,搜尋資源並使用現有模板。
設計房間 提供完整的佈局、產品建議和預算分配。根據要求生成 3D 佈局和備用樣式。 進行產品網路搜尋,建立佈局,但需要使用者頻繁確認。
建立網站 建立一個具有實時推理功能的多頁互動量子計算學習中心。 執行網路搜尋,生成程式碼,但未能呈現可正常執行的網頁。

小結

在 Manus AI 與 OpenAI 的 Operator 的對比中,兩個模型都展示了令人印象深刻的自主執行任務的能力。不過,Manus AI 似乎擁有更先進、更獨立的方法和更快的執行速度。

它能高效地計劃和執行多步驟任務,最大限度地減少冗餘,並動態地適應新指令。此外,它還能在使用者干預最少的情況下生成完整的功能性輸出,顯示出卓越的執行能力。

另一方面,OpenAI 的 Operator 擅長基於網路的結構化自動化,但仍然嚴重依賴使用者確認,缺乏 Manus AI 的自主水平。因此,Manus AI 已經奠定了堅實的基礎,並標誌著其作為中國首個人工智慧代理的地位。到目前為止,它的表現有望成為現有自主代理(如 OpenAI 的 Operator)的替代品。

評論留言