文件与剪贴板#
agent-browser 可以上传文件、捕获下载、通过 file:// URL 读取本地文件、写入 PDF 和截图,并与浏览器剪贴板交互。
上传文件#
bash
agent-browser snapshot -i
agent-browser upload @e4 ./invoice.pdf
agent-browser upload @e4 ./front.png ./back.png选择器必须指向文件输入框。对于多文件输入,支持传入多个文件路径。
下载#
bash
agent-browser download @e5 ./report.csv
agent-browser wait --download ./archive.zip --timeout 30000当某个特定元素触发下载时使用 download。当其他动作启动下载、你需要等待它完成时使用 wait --download。
为浏览器触发的下载设置默认下载目录:
bash
agent-browser --download-path ./downloads open https://app.example.com如果没有设置 --download-path,下载会进入临时目录,并在浏览器关闭时被清理。
截图和 PDF#
bash
agent-browser screenshot ./page.png
agent-browser screenshot --full ./page-full.png
agent-browser screenshot --screenshot-format jpeg --screenshot-quality 80 ./page.jpg
agent-browser pdf ./page.pdf也可以通过以下方式配置截图默认值:
| 设置 | 说明 |
|---|---|
--screenshot-dir / AGENT_BROWSER_SCREENSHOT_DIR | 默认截图输出目录 |
--screenshot-format / AGENT_BROWSER_SCREENSHOT_FORMAT | png 或 jpeg |
--screenshot-quality / AGENT_BROWSER_SCREENSHOT_QUALITY | JPEG 质量,范围 0 到 100 |
本地文件#
bash
agent-browser --allow-file-access open file:///Users/me/report.pdf
agent-browser --allow-file-access open file:///path/to/page.html
agent-browser screenshot ./local-file.png--allow-file-access 仅适用于 Chromium。它允许 file:// 页面加载内容,并通过 fetch 和 XHR 等浏览器 API 访问其他本地文件。
剪贴板#
bash
agent-browser clipboard read
agent-browser clipboard write "Hello, world"
agent-browser clipboard copy
agent-browser clipboard pastecopy 和 paste 会模拟平台针对当前选择内容或聚焦元素的键盘快捷键。当你想直接设置剪贴板文本时使用 write。