一、軟件介紹
文末提供程序和源碼下載
? ? ? browser-use開源程序使 AI 代理可以訪問網站,自動完成特定的指定任務,瀏覽器使用是將AI代理與瀏覽器連接的最簡單方法。告訴您的計算機該做什么,它就會完成它。
二、快速開始
使用 pip (Python>=3.11):
pip install browser-use
Install Playwright: ?安裝 Playwright:
playwright install chromium
Spin up your agent: ?啟動您的代理:
from langchain_openai import ChatOpenAI
from browser_use import Agent
import asyncio
from dotenv import load_dotenv
load_dotenv()
async def main():
? ? agent = Agent(
? ? ? ? task="Compare the price of gpt-4o and DeepSeek-V3",
? ? ? ? llm=ChatOpenAI(model="gpt-4o"),
? ? )
? ? await agent.run()
asyncio.run(main())
Add your API keys for the provider you want to use to your .env file.
將要使用的提供程序的 API 密鑰添加到 .env 文件中。
OPENAI_API_KEY=
ANTHROPIC_API_KEY=
AZURE_ENDPOINT=
AZURE_OPENAI_API_KEY=
GEMINI_API_KEY=
DEEPSEEK_API_KEY=
?使用 UI 進行測試
簡單地運行 gradio 示例:
uv pip install gradio
python examples/ui/gradio_demo.py
三、演示
任務 :將雜貨添加到購物車,然后結帳。
提示:將我最新的 LinkedIn 關注者添加到 Salesforce 中的潛在客戶中。
提示 :閱讀我的簡歷并找到 ML 工作,將它們保存到一個文件中,然后在新的標簽頁中開始申請它們,如果你需要幫助,就問我。
提示 :在 Google Docs 中寫一封信給我爸爸,感謝他所做的一切,并將文檔保存為 PDF
提示 :在 Hugging face 上查找具有 cc-by-sa-4.0 許可證的模型,并按點贊數排序,將前 5 名保存到文件中
四、其他
Agent ?代理
?Improve agent memory (summarize, compress, RAG, etc.)
改進代理內存(summarize、compress、RAG 等)
?Enhance planning capabilities (load website specific context)
增強規劃功能(加載網站特定上下文)
?Reduce token consumption (system prompt, DOM state)
減少 Token 消耗(系統提示符、DOM 狀態)
DOM Extraction ?DOM 提取
?Improve extraction for datepickers, dropdowns, special elements
改進日期選擇器、下拉列表、特殊元素的提取
?Improve state representation for UI elements
改進 UI 元素的狀態表示
Rerunning tasks ?重新運行任務
?LLM as fallback ?LLM作為 fallback
?Make it easy to define workflow templates where LLM fills in the details
輕松定義工作流模板,其中LLM填寫詳細信息
?Return playwright script from the agent
從代理處返回 playwauthor 腳本
Datasets ?數據
?Create datasets for complex tasks
為復雜任務創建數據集
?Benchmark various models against each other
將各種模型相互進行基準測試
?Fine-tuning models for specific tasks
針對特定任務微調模型
User Experience ?用戶體驗
?Human-in-the-loop execution
人機交互執行
?Improve the generated GIF quality
提高生成的 GIF 質量
?Create various demos for tutorial execution, job application, QA testing, social media, etc.
為教程執行、工作申請、QA 測試、社交媒體等創建各種演示。
五、軟件下載
夸克網盤分享
本文信息來源于GitHub作者地址:https://github.com/browser-use/browser-use