Manus的爆火預示著AI 正在從單純的文本生成和圖像識別邁向更復雜的交互場景。字節跳動近期推出的開源項目 UI-TARS Desktop 為我們展示了一種全新的可能性:能夠通過自然語言理解和處理來控制計算機界面。這款工具代表了人工智能與人機交互領域的重大突破,為用戶提供了一種全新的、更加自然的方式來操作計算機系統。
在項目落地實踐中,高效穩定的底層模型支撐很關鍵,PPIO派歐云作為一站式AIGC云服務平臺,提供高性能的 API 服務,涵蓋了最新的 DeepSeek、QwQ 等系列模型,低價、穩定、快速,僅需一行代碼即可調用。
PPIO x UI-Tars 圖文使用教程
-
配置前置條件
(1)獲取 【API Base URL】:固定為:https://api.ppinfra.com/v3/openai
(2) 獲取 【API Key】:登錄派歐云控制臺API密鑰管理頁面,點擊創建按鈕。注冊賬號填寫邀請碼【VOJL20】得代金券
(3)生成并保存【API密鑰】
!!注意:密鑰在服務端是加密存儲,請在生成時保存好密鑰;若遺失可以在控制臺上刪除并創建一個新的密鑰。
(4)獲取需要使用的模型ID,推薦使用:
-
deepseek/deepseek-v3-0324
-
deepseek/deepseek-r1-turbo
-
deepseek/deepseek-v3-turbo
-
qwen/qwq-32b
其他模型ID、最大上下文及價格可參考:模型列表
2. 安裝和配置UI-Tars
👉前往:https://github.com/bytedance/UI-TARS-desktop/releases/tag/Agent-TARS-v1.0.0-alpha.5
下載安裝最新版本的客戶端(目前只支持mac系統)
(1)下載完成后點擊左下角【設置】
(2)先打開【Use custom model name】的按鈕,在【Model Name】處填寫官網的模型名稱,在【API Key】處填寫創建的密鑰,最后在【Custom Endpoint】填寫官網的Base URL,最后點擊Save即可
運行效果展示
輸入我們準備好的prompt:
使用網絡瀏覽器查詢舊金山當前的天氣情況。
UI - TARS 憑借其強大的自然語言理解與處理技術,精準地執行了我們 “獲取舊金山天氣信息” 的指令。當下達指令后,它通過瀏覽器查到舊金山地區的天氣數據源。最終,清晰、準確地為我們呈現當下的天氣信息,復雜交互場景中其執行能力與信息獲取能力有所表現。
熱門三方平臺集成
PPIO支持在20+主流平臺中調用最新模型。
👉 查看使用教程:https://ppinfra.com/docs/third-party/overview
通用對話客戶端:Chatbox、LobeChat、Nextchat、ChatHub、CherryStudio
通用AI助手:OpenManus
代碼開發工具:Cursor、CLINE
開發/API平臺:Dify、OneAPI、RAGFlow、FastGPT
生產力套件集成:Word、WPS Office AI,這些是辦公軟件集成AI功能
智能翻譯工具:沉浸式翻譯、歐路詞典、流暢閱讀、沉浸式導讀
知識管理工具:思源筆記、Obsidian、AnythingLLM
……