browser-use開源程序使 AI 代理可以訪問網站,自動完成特定的指定任務,告訴您的計算機該做什么,它就會完成它。

一、軟件介紹

文末提供程序和源碼下載

? ? ? browser-use開源程序使 AI 代理可以訪問網站,自動完成特定的指定任務,瀏覽器使用是將AI代理與瀏覽器連接的最簡單方法。告訴您的計算機該做什么,它就會完成它。

二、快速開始

使用 pip (Python>=3.11):

pip install browser-use
Install Playwright: ?安裝 Playwright:

playwright install chromium
Spin up your agent: ?啟動您的代理:

from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
from dotenv import load_dotenv
load_dotenv()

async def main():
? ? agent = Agent(
? ? ? ? task="Compare the price of gpt-4o and DeepSeek-V3",
? ? ? ? llm=ChatOpenAI(model="gpt-4o"),
? ? )
? ? await agent.run()

asyncio.run(main())
Add your API keys for the provider you want to use to your .env file.
將要使用的提供程序的 API 密鑰添加到 .env 文件中。

OPENAI_API_KEY=
ANTHROPIC_API_KEY=
AZURE_ENDPOINT=
AZURE_OPENAI_API_KEY=
GEMINI_API_KEY=
DEEPSEEK_API_KEY=

?使用 UI 進行測試

簡單地運行 gradio 示例:

uv pip install gradio
python examples/ui/gradio_demo.py

三、演示

任務 :將雜貨添加到購物車,然后結帳。

提示:將我最新的 LinkedIn 關注者添加到 Salesforce 中的潛在客戶中。

提示 :閱讀我的簡歷并找到 ML 工作,將它們保存到一個文件中,然后在新的標簽頁中開始申請它們,如果你需要幫助,就問我。

提示 :在 Google Docs 中寫一封信給我爸爸,感謝他所做的一切,并將文檔保存為 PDF

提示 :在 Hugging face 上查找具有 cc-by-sa-4.0 許可證的模型,并按點贊數排序,將前 5 名保存到文件中

四、其他

Agent ?代理
?Improve agent memory (summarize, compress, RAG, etc.)
改進代理內存(summarize、compress、RAG 等)
?Enhance planning capabilities (load website specific context)
增強規劃功能(加載網站特定上下文)
?Reduce token consumption (system prompt, DOM state)
減少 Token 消耗(系統提示符、DOM 狀態)
DOM Extraction ?DOM 提取
?Improve extraction for datepickers, dropdowns, special elements
改進日期選擇器、下拉列表、特殊元素的提取
?Improve state representation for UI elements
改進 UI 元素的狀態表示
Rerunning tasks ?重新運行任務
?LLM as fallback ?LLM作為 fallback
?Make it easy to define workflow templates where LLM fills in the details
輕松定義工作流模板,其中LLM填寫詳細信息
?Return playwright script from the agent
從代理處返回 playwauthor 腳本
Datasets ?數據
?Create datasets for complex tasks
為復雜任務創建數據集
?Benchmark various models against each other
將各種模型相互進行基準測試
?Fine-tuning models for specific tasks
針對特定任務微調模型
User Experience ?用戶體驗
?Human-in-the-loop execution
人機交互執行
?Improve the generated GIF quality
提高生成的 GIF 質量
?Create various demos for tutorial execution, job application, QA testing, social media, etc.
為教程執行、工作申請、QA 測試、社交媒體等創建各種演示。

五、軟件下載

夸克網盤分享

本文信息來源于GitHub作者地址:https://github.com/browser-use/browser-use

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/75853.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/75853.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/75853.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

CAD格式轉換器:Acme CAD Converter

Acme CAD Converter 是一款專業的多功能 CAD 文件管理工具,支持 ?DWG/DXF/DWF 文件查看、批量格式轉換及版本降級?,適用于工程設計、圖紙歸檔等場景?。軟件兼容 AutoCAD R2.5 至 2023 版本文件?,可輸出為 PDF、JPEG、TIFF、SVG 等 20 格式…

vmware虛擬機上Ubuntu或者其他系統無法聯網的解決方法

一、檢查虛擬機是否開啟了網絡服務 打開方式:控制面板->-管理工具--->服務 查找 VMware DHCP Service 和VMware NAT Service ,確保這兩個服務已經啟動。如下圖,沒有啟動就點擊啟動。 二、設置網絡類型 我們一般使用前兩種多一些&…

數據結構與算法:基礎與進階

🌟 各位看官好,我是maomi_9526! 🌍 種一棵樹最好是十年前,其次是現在! 🚀 今天來學習C語言的相關知識。 👍 如果覺得這篇文章有幫助,歡迎您一鍵三連,分享給更…

使用分布式鎖和樂觀鎖解決超賣問題

在電商、秒殺等高并發場景中,“超賣”問題指庫存被過量扣減,導致實際庫存不足。以下是使用 分布式鎖 和 樂觀鎖 解決超賣問題的原理與實現方案: 一、超賣問題的核心原因 多個并發請求同時讀取庫存余量,并在本地計算后發起寫操作&…

盛水最多的容器

本題有兩種解法,一種是暴力解法,直接暴力枚舉出所有的體積比較出最大的即可,但是時間復雜度達到n方。超出了限制,另一種解法就是利用單調性解法,我們著重介紹一下單調性解法。 單調性解法: 體積vh*w&…

操作系統概述(3)

批處理系統 1.單道批處理系統 單道批處理系統是成批地處理作用,并且始終只有一道作業在內存中的系統。優點:提高系統資源的利用率和系統吞吐量。缺點:系統中的資源得不到充分利用。 2.多道批處理系統 引入多道程序設計技術,是…

數字身份DID協議:如何用Solidity編寫去中心化身份合約

本文提出基于以太坊的自主主權身份(SSI)實現方案,通過擴展ERC-734/ERC-735標準構建鏈上身份核心合約,支持可驗證聲明、多密鑰輪換、屬性隱私保護等特性。設計的三層架構體系將身份控制邏輯與數據存儲分離,在測試網環境…

【目標檢測】【深度學習】【Pytorch版本】YOLOV2模型算法詳解

【目標檢測】【深度學習】【Pytorch版本】YOLOV2模型算法詳解 文章目錄 【目標檢測】【深度學習】【Pytorch版本】YOLOV2模型算法詳解前言YOLOV2的模型結構YOLOV2模型的基本執行流程YOLOV2模型的網絡參數YOLOV2模型的訓練方式 YOLOV2的核心思想前向傳播階段反向傳播階段 總結 前…

第421場周賽:數組的最大因子得分、

Q1、數組的最大因子得分 1、題目描述 給你一個整數數組 nums。 因子得分 定義為數組所有元素的最小公倍數(LCM)與最大公約數(GCD)的 乘積。 在 最多 移除一個元素的情況下,返回 nums 的 最大因子得分。 注意&…

機器學習(神經網絡基礎篇)——個人理解篇5(梯度下降中遇到的問題)

在神經網絡訓練中,計算參數的梯度是關鍵步驟。numerical_gradient 方法旨在通過數值微分(中心差分法)計算損失函數對網絡參數的梯度。然而,該方法的實現存在一個關鍵問題,導致梯度計算錯誤。 1、錯誤代碼示例&#xf…

40常用控件_WindowFrame的影響

window frame 的影響 如果 widget 作為一個窗口(帶有標題欄,最小化,最大化,關閉按鈕),那么在計算尺寸和坐標的 時候就有兩種算法.包含 window frame 和 不包含 window frame. 其中x(),y0,frameGeometry(), pos(),move() 都是按照包含 window frame 的方式來計算 的. 其中 geome…

Nginx搭建API網關服務教程-系統架構優化 API統一管理

超實用!用Nginx搭建API網關服務,讓你的系統架構更穩更強大!🚀 親們,今天來給大家種草一個超級實用的API網關搭建方案啦!👀 在如今的Web系統架構中,一個穩定、高性能、可擴展的API網…

USB設備老是提示有問題,如何解決

問題描述:有一臺usb設備一旦不小心碰了下,后面就在右下角提示“無法識別的USB設備”“跟這臺計算機連接的前一個USB設備0工作不正常,WIndows無法識別它”。我這個是明確知道那個設備,如果不知道也可以同樣解決。 解決方法&#xf…

數據操作語言

一、DML的核心操作類型 1.添加數據(INSERT) (1)手動插入:逐行插入數據,適用于少量數據。 INSERT INTO 表名 (字段1, 字段2) VALUES (值1, 值2);(2)批量導入:通過外部文件導入數據,適用于大數據場景

【Python】案例:計算股票收益率和波動率

【Python】案例:計算股票收益率和波動率: 1、案例需求2、數據準備3、案例實現 1、案例需求 在分析股票數據時,我們需要從這些數據中得到一些關鍵指標進行評估,比如收益率、波動率,其中收益率又可以細分為簡單收益率和…

geoserver搭建Docker一鍵直接安裝并上傳tif影像預覽

geoserver搭建Docker一鍵直接安裝 文章目錄 geoserver搭建Docker一鍵直接安裝前言一、Docker拉取Geoserver二、運行后使用geoserver進行數據管理進入geoserver調整語言登錄geoserver上傳一個tif影像建立工作空間并上傳自己的tif數據建立圖層預覽 總結 前言 使用docker安裝geos…

STM32看門狗應用實戰:獨立看門狗與窗口看門狗深度解析(下) | 零基礎入門STM32第九十五步

主題內容教學目的/擴展視頻看門狗什么是看門狗,原理分析,啟動喂狗方法,讀標志位。熟悉在程序里用看門狗。 師從洋桃電子,杜洋老師 📑文章目錄 一、看門狗應用架構分析1.1 系統監控流程圖1.2 雙看門狗應用場景對比 二、…

nacos集群啟動問題

根據您的描述,Nacos集群只能啟動兩個節點,可能的原因和解決方法如下: 1. 集群配置問題 ? 原因:cluster.conf文件中可能只配置了兩個節點的地址,導致第三個節點無法加入集群。 ? 解決方法: ? 檢查每個…

【C語言】跳臺階

相信你是最棒噠!!! 一、題目描述 二、題目代碼 1.斐波那契數列 2.DFS深度搜索 總結 一、題目描述 一只青蛙一次可以跳上1級臺階,也可以跳上2級。求該青蛙跳上一個n級的臺階總共有多少種跳法(先后次序不同算不同的結果…

指紋瀏覽器技術架構解析:高并發批量注冊業務的工程化實踐——基于分布式指紋引擎與防關聯策略的深度實現

一、技術背景與行業痛點 在跨境電商、廣告投放、問卷調查等場景中,批量注冊與多賬號矩陣運營已成為剛需。然而,主流平臺(如亞馬遜、Facebook、Google)的風控系統通過瀏覽器指紋追蹤(Canvas/WebGL/WebRTC等&#xff09…