使用 browser-use 加 deepSeek 打造你的个人 AI 代理!
最近 DeepSeek 火的不要不要的,之前的科大讯飞、百度的文心一言、Kimi等没有让更多的普通用户对 AI 产生兴趣,反而是 DeepSeek 的出现让更多的用户了解到了 AI 的强大,越来越多的用户开始使用 AI,并探索 AI 的强大功能。
本文将介绍如何使用 browser-use 和 DeepSeek 自动化处理自己的任务,将以实际案例出发完成一个例子。
什么是 browser-use ?
browser-use 是一款使用 AI 代理浏览器操作的开源软件,browser-use 为浏览器自动化提供功能强大但简单的接口,使AI代理可以访问网站并执行用户的任务。
比如你设定一个查找商品的任务,然后 browser-use 会自动启动浏览器代替人类进行网上搜索,然后分析搜索结果进行操作,直至完成设置的目标任务。
运行软件前置准备
在打造个人代理之前,你的电脑需要安装 Python3.11,如果你电脑上的 Python版本不是3.11,你可以使用 pyenv 进行版本管理。
安装 pyenv
如果你的电脑 Python 是 3.11 可以忽略此步骤。
curl https://pyenv.run | bash
常用命令:
- 安装 Python 版本:
pyenv install 3.11.0
- 切换版本:
pyenv global 3.11.0
或pyenv local 3.9.1
(对于项目) - 查看已安装的版本:
pyenv versions
申请 DeepSeek API KEY
DeepSeek API 默认会有10块钱额度,完全可以测试使用。
打开官网平台:platform.deepseek.com/
1、创建 KEY
2、保存 KEY
key 只会展示一次,所以要复制保存好。
Python和DeepSeek API KEY都搞好了,那么我们就开始下面 browser-use 的安装和使用。
安装 browser-use
pip install browser-use
playwright install
使用 browser-use
创建一个目录文件夹,这个文件夹可以放在任何地方,建议你放在合适的文件夹下,比如创建了文件夹 browser-use。
然后我们进入 browser-use 文件夹,创建如下两个文件:
- .env
- agnet.py
.env 文件内容
DEEPSEEK_API_KEY=替换成你上面申请的 deepseek api key
OPENAI_API_KEY=
OPENAI_API_KEY 是chatgpt的api key,因为在国内无法访问openai,所以这个无法使用。
agnet.py 内容
from langchain_openai import ChatOpenAI
from browser_use import Agent
from dotenv import load_dotenv
from pydantic import SecretStr
import os
load_dotenv()
import asyncio
# DEEPSEEK_API_KEY 环境变量
api_key = os.getenv('DEEPSEEK_API_KEY')
# 初始化模型
llm = ChatOpenAI(
base_url='https://api.deepseek.com',
model='deepseek-chat',
api_key=SecretStr(api_key)
)
async def main():
# 使用模型创建代理
agent = Agent(
task="打开百度,搜索deepseek",
llm=llm,
use_vision=False
)
result = await agent.run()
print(result)
asyncio.run(main())
运行代理
在创建好的文件夹下打开终端,然后运行命令:
python3 agnet.py
运行代理后如下:
这样我们就完成了简单的代理任务!
总结
随着AI越来越强大,基于AI 的 Agent也变得越来越强大,未来我们重复性的任务或者普通的任务完全可以让AI帮我们完成。
本篇内容主要介绍了 browser-use的安装和简单使用,后面我会发更多的 browser-use 或者其他代理的高级使用方法!希望更多的人了解 AI Agent,会用 AI Agent。