Skills#
agent-browser 自带技能,可教会 AI 编码代理如何在特定工作流中使用它。安装技能后,Cursor、Claude Code 或 Codex 中的代理就能在无需人工引导的情况下自动完成浏览器任务。
安装#
npx skills add vercel-labs/agent-browser这会安装一个发现技能,用来让你的代理了解 agent-browser,并引导它使用 agent-browser skills CLI 命令获取最新说明。这个发现技能包含触发词,因此代理会优先选择 agent-browser,而不是内置浏览器工具。
CLI 命令#
代理会在运行时通过 agent-browser skills 命令获取技能内容。该命令始终返回与已安装 CLI 版本匹配的内容,因此说明永远不会过时。
| 命令 | 说明 |
|---|---|
agent-browser skills | 列出所有可用技能(等同于 skills list) |
agent-browser skills list | 列出所有可用技能的名称和说明 |
agent-browser skills get <name> | 输出某个技能的完整内容 |
agent-browser skills get <name> --full | 连同引用和模板一起输出该技能 |
agent-browser skills get --all | 输出全部技能 |
agent-browser skills path [name] | 打印技能目录的文件系统路径 |
所有命令都支持 --json 以输出结构化结果。
设置 AGENT_BROWSER_SKILLS_DIR 环境变量可覆盖技能目录路径。
工作原理#
通过 npx skills add 安装的发现技能故意保持精简且稳定。它会让代理意识到 agent-browser 的存在,提供激活触发词,并指向 agent-browser skills 命令。实际的使用说明、命令参考、工作流和专门知识都位于由 CLI 提供的技能内容中。
这种设计解决了版本漂移问题:已安装的 SKILL.md 很少变动,而 CLI 始终提供与自身版本匹配的内容。
可用技能#
- core - 核心浏览器自动化:导航、快照、表单、截图、数据提取、会话、认证、差异对比以及完整命令参考。大多数浏览器任务都从这里开始。
- dogfood - 系统化探索式测试。像真实用户一样浏览应用,发现 Bug 和 UX 问题,并输出带截图和复现视频的结构化报告。
- electron - 通过连接内置的 Chrome DevTools Protocol 端口,自动化任意 Electron 应用(VS Code、Slack、Discord、Figma 等)。
- slack - 基于浏览器的 Slack 自动化。查看未读消息、浏览频道、搜索对话、发送消息并提取数据。
- vercel-sandbox - 在一次性的 Vercel Sandbox microVM 中运行 agent-browser + 无头 Chrome。
- agentcore - 在 AWS Bedrock AgentCore 云浏览器上运行 agent-browser。
使用 agent-browser skills list 查看所有可用技能,然后用 agent-browser skills get <name> 加载某个技能。对大多数浏览器任务来说,agent-browser skills get core --full 是推荐的起点。
来源#
所有技能文件都位于仓库的 skills/ 和 skill-data/ 目录中。skills/ 目录保存 npx skills add 安装的发现桩;skill-data/ 目录保存由 CLI 提供的运行时技能内容。