Skills#

agent-browser 自带技能,可教会 AI 编码代理如何在特定工作流中使用它。安装技能后,Cursor、Claude Code 或 Codex 中的代理就能在无需人工引导的情况下自动完成浏览器任务。

安装#

bash
npx skills add vercel-labs/agent-browser

这会安装一个发现技能,用来让你的代理了解 agent-browser,并引导它使用 agent-browser skills CLI 命令获取最新说明。这个发现技能包含触发词,因此代理会优先选择 agent-browser,而不是内置浏览器工具。

CLI 命令#

代理会在运行时通过 agent-browser skills 命令获取技能内容。该命令始终返回与已安装 CLI 版本匹配的内容,因此说明永远不会过时。

命令说明
agent-browser skills列出所有可用技能(等同于 skills list
agent-browser skills list列出所有可用技能的名称和说明
agent-browser skills get <name>输出某个技能的完整内容
agent-browser skills get <name> --full连同引用和模板一起输出该技能
agent-browser skills get --all输出全部技能
agent-browser skills path [name]打印技能目录的文件系统路径

所有命令都支持 --json 以输出结构化结果。

设置 AGENT_BROWSER_SKILLS_DIR 环境变量可覆盖技能目录路径。

工作原理#

通过 npx skills add 安装的发现技能故意保持精简且稳定。它会让代理意识到 agent-browser 的存在,提供激活触发词,并指向 agent-browser skills 命令。实际的使用说明、命令参考、工作流和专门知识都位于由 CLI 提供的技能内容中。

这种设计解决了版本漂移问题:已安装的 SKILL.md 很少变动,而 CLI 始终提供与自身版本匹配的内容。

可用技能#

  • core - 核心浏览器自动化:导航、快照、表单、截图、数据提取、会话、认证、差异对比以及完整命令参考。大多数浏览器任务都从这里开始。
  • dogfood - 系统化探索式测试。像真实用户一样浏览应用,发现 Bug 和 UX 问题,并输出带截图和复现视频的结构化报告。
  • electron - 通过连接内置的 Chrome DevTools Protocol 端口,自动化任意 Electron 应用(VS Code、Slack、Discord、Figma 等)。
  • slack - 基于浏览器的 Slack 自动化。查看未读消息、浏览频道、搜索对话、发送消息并提取数据。
  • vercel-sandbox - 在一次性的 Vercel Sandbox microVM 中运行 agent-browser + 无头 Chrome。
  • agentcore - 在 AWS Bedrock AgentCore 云浏览器上运行 agent-browser。

使用 agent-browser skills list 查看所有可用技能,然后用 agent-browser skills get <name> 加载某个技能。对大多数浏览器任务来说,agent-browser skills get core --full 是推荐的起点。

来源#

所有技能文件都位于仓库的 skills/skill-data/ 目录中。skills/ 目录保存 npx skills add 安装的发现桩;skill-data/ 目录保存由 CLI 提供的运行时技能内容。