文件与剪贴板#

agent-browser 可以上传文件、捕获下载、通过 file:// URL 读取本地文件、写入 PDF 和截图,并与浏览器剪贴板交互。

上传文件#

bash
agent-browser snapshot -i
agent-browser upload @e4 ./invoice.pdf
agent-browser upload @e4 ./front.png ./back.png

选择器必须指向文件输入框。对于多文件输入,支持传入多个文件路径。

下载#

bash
agent-browser download @e5 ./report.csv
agent-browser wait --download ./archive.zip --timeout 30000

当某个特定元素触发下载时使用 download。当其他动作启动下载、你需要等待它完成时使用 wait --download

为浏览器触发的下载设置默认下载目录:

bash
agent-browser --download-path ./downloads open https://app.example.com

如果没有设置 --download-path,下载会进入临时目录,并在浏览器关闭时被清理。

截图和 PDF#

bash
agent-browser screenshot ./page.png
agent-browser screenshot --full ./page-full.png
agent-browser screenshot --screenshot-format jpeg --screenshot-quality 80 ./page.jpg
agent-browser pdf ./page.pdf

也可以通过以下方式配置截图默认值:

设置说明
--screenshot-dir / AGENT_BROWSER_SCREENSHOT_DIR默认截图输出目录
--screenshot-format / AGENT_BROWSER_SCREENSHOT_FORMATpngjpeg
--screenshot-quality / AGENT_BROWSER_SCREENSHOT_QUALITYJPEG 质量,范围 0 到 100

本地文件#

bash
agent-browser --allow-file-access open file:///Users/me/report.pdf
agent-browser --allow-file-access open file:///path/to/page.html
agent-browser screenshot ./local-file.png

--allow-file-access 仅适用于 Chromium。它允许 file:// 页面加载内容,并通过 fetch 和 XHR 等浏览器 API 访问其他本地文件。

剪贴板#

bash
agent-browser clipboard read
agent-browser clipboard write "Hello, world"
agent-browser clipboard copy
agent-browser clipboard paste

copypaste 会模拟平台针对当前选择内容或聚焦元素的键盘快捷键。当你想直接设置剪贴板文本时使用 write