最近 DeepSeek 火的不要不要的,之前的科大讯飞、百度的文心一言、Kimi等没有让更多的普通用户对 AI 产生兴趣,反而是 DeepSeek 的出现让更多的用户了解到了 AI 的强大,越来越多的用户开始使用 AI,并探索 AI 的强大功能。
本文将介绍如何使用 browser-use 和 DeepSeek 自动化处理自己的任务,将以实际案例出发完成一个例子。
browser-use 是一款使用 AI 代理浏览器操作的开源软件,browser-use 为浏览器自动化提供功能强大但简单的接口,使AI代理可以访问网站并执行用户的任务。
比如你设定一个查找商品的任务,然后 browser-use 会自动启动浏览器代替人类进行网上搜索,然后分析搜索结果进行操作,直至完成设置的目标任务。
在打造个人代理之前,你的电脑需要安装 Python3.11,如果你的电脑上的 Python3.11,你可以使用 pyenv 进行版本管理。
如果你的电脑 Python 是 3.11 可以忽略此步骤。
curl https://pyenv.run | bash
常用命令:
pyenv install 3.11.0
pyenv global 3.11.0
或 pyenv local 3.9.1
(对于项目)pyenv versions
DeepSeek API 默认会有10块钱额度,完全可以测试使用。
打开官网平台:https://platform.deepseek.com/
key 只会展示一次,所以要复制保存好。
Python和DeepSeek API KEY都搞好了,那么我们就开始下面 browser-use 的安装和使用。
pip install browser-use
playwright install
创建一个目录文件夹,这个文件夹可以放在任何地方,建议你放在合适的文件夹下,比如创建了文件夹 browser-use。
然后我们进入 browser-use 文件夹,创建如下两个文件:
DEEPSEEK_API_KEY=替换成你上面申请的 deepseek api key OPENAI_API_KEY=
OPENAI_API_KEY 是chatgpt的api key,因为在国内无法访问openai,所以这个无法使用。
from langchain_openai import ChatOpenAI from browser_use import Agent from dotenv import load_dotenv from pydantic import SecretStr import os load_dotenv() import asyncio # DEEPSEEK_API_KEY 环境变量 api_key = os.getenv('DEEPSEEK_API_KEY') # 初始化模型 llm = ChatOpenAI( base_url='https://api.deepseek.com', model='deepseek-chat', api_key=SecretStr(api_key) ) async def main(): # 使用模型创建代理 agent = Agent( task="打开百度,搜索deepseek", llm=llm, use_vision=False ) result = await agent.run() print(result) asyncio.run(main())
在创建好的文件夹下打开终端,然后运行命令:
python3 agnet.py
运行代理后如下:
这样我们就完成了简单的代理任务!
随着AI越来越强大,基于AI 的 Agent也变得越来越强大,未来我们重复性的任务或者普通的任务完全可以让AI帮我们完成。
本篇内容主要介绍了 browser-use的安装和简单使用,后面我会发更多的 browser-use 或者其他代理的高级使用方法!希望更多的人了解 AI Agent,会用 AI Agent。