PPIO × UI-TARS:用自然語言操控電腦,AI Agent 的極致體驗

Manus的爆火預示著AI 正在從單純的文本生成和圖像識別邁向更復雜的交互場景。字節跳動近期推出的開源項目 UI-TARS Desktop 為我們展示了一種全新的可能性:能夠通過自然語言理解和處理來控制計算機界面。這款工具代表了人工智能與人機交互領域的重大突破,為用戶提供了一種全新的、更加自然的方式來操作計算機系統。

在項目落地實踐中,高效穩定的底層模型支撐很關鍵,PPIO派歐云作為一站式AIGC云服務平臺,提供高性能的 API 服務,涵蓋了最新的 DeepSeek、QwQ 等系列模型,低價、穩定、快速,僅需一行代碼即可調用。

PPIO x UI-Tars 圖文使用教程

  1. 配置前置條件

(1)獲取 【API Base URL】:固定為:https://api.ppinfra.com/v3/openai

(2) 獲取 【API Key】:登錄派歐云控制臺API密鑰管理頁面,點擊創建按鈕。注冊賬號填寫邀請碼【VOJL20】得代金券

(3)生成并保存【API密鑰】

!!注意:密鑰在服務端是加密存儲,請在生成時保存好密鑰;若遺失可以在控制臺上刪除并創建一個新的密鑰。

(4)獲取需要使用的模型ID,推薦使用:

  • deepseek/deepseek-v3-0324

  • deepseek/deepseek-r1-turbo

  • deepseek/deepseek-v3-turbo

  • qwen/qwq-32b

其他模型ID、最大上下文及價格可參考:模型列表

2. 安裝和配置UI-Tars

👉前往:https://github.com/bytedance/UI-TARS-desktop/releases/tag/Agent-TARS-v1.0.0-alpha.5

下載安裝最新版本的客戶端(目前只支持mac系統)

(1)下載完成后點擊左下角【設置】

(2)先打開【Use custom model name】的按鈕,在【Model Name】處填寫官網的模型名稱,在【API Key】處填寫創建的密鑰,最后在【Custom Endpoint】填寫官網的Base URL,最后點擊Save即可

運行效果展示

輸入我們準備好的prompt:

使用網絡瀏覽器查詢舊金山當前的天氣情況。

UI - TARS 憑借其強大的自然語言理解與處理技術,精準地執行了我們 “獲取舊金山天氣信息” 的指令。當下達指令后,它通過瀏覽器查到舊金山地區的天氣數據源。最終,清晰、準確地為我們呈現當下的天氣信息,復雜交互場景中其執行能力與信息獲取能力有所表現。

熱門三方平臺集成

PPIO支持在20+主流平臺中調用最新模型。

👉 查看使用教程:https://ppinfra.com/docs/third-party/overview

通用對話客戶端:Chatbox、LobeChat、Nextchat、ChatHub、CherryStudio

通用AI助手:OpenManus

代碼開發工具:Cursor、CLINE

開發/API平臺:Dify、OneAPI、RAGFlow、FastGPT

生產力套件集成:Word、WPS Office AI,這些是辦公軟件集成AI功能

智能翻譯工具:沉浸式翻譯、歐路詞典、流暢閱讀、沉浸式導讀

知識管理工具:思源筆記、Obsidian、AnythingLLM

……

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/75130.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/75130.shtml
英文地址,請注明出處:http://en.pswp.cn/web/75130.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

電腦屏保壁紙怎么設置 桌面壁紙設置方法詳解

電腦桌面壁紙作為我們每天面對的第一視覺元素,不僅能夠彰顯個人品味,還能營造舒適的工作或娛樂氛圍。電腦桌面壁紙怎么設置呢?下面本文將為大家介紹Windows和macOS兩大主流操作系統中設置電腦桌面壁紙的方法,幫助大家快速設置個性…

popupwindow攔截返回點擊

目的:彈窗只有點擊按鈕可以關閉。 前提:彈窗內有輸入框 試了網上的一些方法 設置彈窗焦點 setFocusable(false) (會導致軟鍵盤無法顯示)重寫 onBackPressed 方法 (不會走這里)為 popupwindow 設置 onKey…

數學知識——矩陣乘法

使用矩陣快速冪優化遞推問題 對于一個遞推問題,如遞推式的每一項系數都為常數,我們可以使用矩陣快速冪來對算法進行優化。 一般形式為: F n F 1 A n ? 1 F_nF_1A^{n-1} Fn?F1?An?1 由于遞推式的每一項系數都為常數,因此對…

GitHub 趨勢日報 (2025年04月07日)

GitHub 趨勢日報 (2025年04月07日) 本日報由 TrendForge 系統生成 https://trendforge.devlive.org/ 📈 今日整體趨勢 Top 10 排名項目名稱項目描述今日獲星語言1microsoft/markitdownPython tool for converting files and office documents to Markdown.? 1039P…

ROS多設備交互

ROS多設備連接同一個Master:ROS Master多設備連接-CSDN博客 在多個PC端連接同一個ROS Master后,接下來就可以實現不同設備之間的話題交流,Master主機端啟動不同PC端的功能包等功能了 盡管多個PC端擁有不同的ROS工作空間,但是只要…

基于國內環境 在Ubuntu 上安裝 Docker 指南

前言 在容器化技術主導云原生時代的今天,Docker 憑借其輕量化、高移植性和秒級部署能力,已成為開發與運維的必備工具。然而,國內用戶在 Ubuntu 系統上安裝 Docker 時,常因 ?官方鏡像源訪問受限、網絡延遲高、依賴包安裝失敗 等問…

數據結構:二叉樹(三)·(重點)

二叉樹的存儲結構 ?叉樹?般可以使?兩種結構存儲,?種順序結構,?種鏈式結構。 順序結構 順序結構存儲就是使?數組來存儲,?般使?數組只適合表?完全?叉樹,因為不是完全?叉樹會有 空間的浪費,完全?叉樹更適合…

EasyExcel實現圖片導出功能(記錄)

背景:在舊系統的基礎上,導出一些工單信息時,現需要新添加處理人的簽名或者簽章,這就涉及圖片的上傳、下載、寫入等幾個操作。 1、EasyExcel工具類 (1)支持下拉框的導出。 import com.alibaba.excel.Easy…

Android Material Design 3 主題配色終極指南:XML 與 Compose 全解析

最小必要顏色配置 <!-- res/values/themes.xml --> <style name"Theme.MyApp" parent"Theme.Material3.DayNight"><!-- 基礎三原色 --><item name"colorPrimary">color/purple_500</item><item name"col…

【Git】“warning: LF will be replaced by CRLF”的解決辦法

一、原因分析 不同操作系統的換行符標準不同&#xff1a; ? Windows&#xff1a;使用 CRLF&#xff08;\r\n&#xff09;表示換行&#xff1b; ? Linux/Mac&#xff1a;使用 LF&#xff08;\n&#xff09;表示換行 Git 檢測到本地文件的換行符與倉庫設置或目標平臺不兼容時…

PyTorch 深度學習實戰(33):聯邦學習與隱私保護

在上一篇文章中,我們探討了多模態學習與CLIP模型的應用。本文將深入介紹聯邦學習(Federated Learning)這一新興的分布式機器學習范式,它能夠在保護數據隱私的前提下實現多方協作的模型訓練。我們將使用PyTorch實現一個基礎的聯邦學習框架,并在圖像分類任務上進行驗證。 一…

藍橋杯 web 展開你的扇子(css3)

普通答案&#xff1a; #box:hover #item1{transform: rotate(-60deg); } #box:hover #item2{transform: rotate(-50deg); } #box:hover #item3{transform: rotate(-40deg); } #box:hover #item4{transform: rotate(-30deg); } #box:hover #item5{transform: rotate(-20deg); }…

LLM驅動的智能體:基于GPT的對話智能體開發指南

前言 大語言模型&#xff08;LLM, Large Language Model&#xff09;正在徹底改變智能體&#xff08;Agent&#xff09;的設計和實現方式。從簡單的聊天機器人到復雜的自動化助手&#xff0c;基于GPT等LLM的對話智能體已經在客服、教育、辦公自動化、編程助手等領域得到了廣泛…

深度解析 C# 中介者模式:設計與實戰應用

中介者模式&#xff08;Mediator Pattern&#xff09;是一種行為型設計模式&#xff0c;其核心思想是將多個對象之間的交互集中到一個中介者對象中&#xff0c;從而減少對象之間的直接交互&#xff0c;降低耦合度。在實現復雜系統時&#xff0c;中介者模式有助于提高系統的可維…

每日算法-250408

記錄今天解決的兩道 LeetCode 算法題&#xff0c;主要涉及二分查找的應用。 1283. 使結果不超過閾值的最小除數 題目描述 思路 核心思路是 二分查找。 解題過程 為什么可以使用二分&#xff1f; 關鍵在于單調性。對于一個固定的數組 nums&#xff0c;當除數 divisor 增大時&…

MySQL的子查詢

一、前言 MySQL 子查詢是指嵌套在其他 SQL 語句&#xff08;如 SELECT、WHERE、FROM 等&#xff09;內部的查詢。用于輔助主查詢完成復雜的數據篩選或計算。 二、子查詢分類 標量子查詢 描述&#xff1a;返回 單行單列&#xff08;一個值&#xff09;&#xff0c;常用于比較運…

Linux 基礎入門操作 前言 VIM的基本操作 2

1 VIM的背景介紹 Vi 的誕生與1976年&#xff0c;Vim 的前身是 Vi&#xff08;Visual Editor&#xff09;&#xff0c;由 Bill Joy 在 BSD Unix 系統上開發&#xff0c;作為 ed&#xff08;行編輯器&#xff09;的改進版本&#xff0c;提供全屏編輯功能&#xff0c;成為 Unix/L…

Java:Set操作

目錄 Set 轉 List Set 轉 List Set<String>set new HashSet<String>(); set.add("c"); set.add("d"); set.add("a"); set.add("a");//方法一&#xff1a; List<String>list new ArrayList<String>(set);//…

算力驅動未來:從邊緣計算到高階AI的算力革命

算力驅動未來&#xff1a;從邊緣計算到高階AI的算力革命 摘要 本文深入探討了不同算力水平&#xff08;20TOPS至160TOPS&#xff09;在人工智能領域的多樣化應用場景。從邊緣計算的實時目標檢測到自動駕駛的多傳感器融合&#xff0c;從自然語言處理的大模型應用到AI for Scie…

虛擬機上安裝openEuler和openGauss數據庫

1.虛擬機版本選擇VM 16 PRO 2.openEuler版本選擇openEuler-22.03-LTS-SP4-x86_64 下載地址&#xff1a;https://mirrors.aliyun.com/openeuler/openEuler-22.03-LTS-SP4/ISO/x86_64/openEuler-22.03-LTS-SP4-x86_64-dvd.iso 3.虛擬機安裝openEuler過程&#xff1a; 4.安裝ope…