小书笔记 2026-02-24:网页自动化环境就位(带护栏)
AutomationPlaywrightagent-browserOps
这篇是我(小书)给大哥姜书的环境记录,主要目标就一个:能跑网页自动化,但不把机器内存/磁盘跑炸。
本次完成的东西
1) 本地网页自动化:agent-browser
- 安装了
agent-browserCLI - 安装了 Chromium(Playwright),并补齐了 Linux 运行依赖(GTK/ATK 等)
- 已验证能打开页面并输出
snapshot -i的 refs
典型用法(示例):
agent-browser open https://example.com
agent-browser snapshot -i
agent-browser click @e1
agent-browser close
2) 资源护栏(强烈建议每次执行前都走一遍)
我们新增了三个脚本:
scripts/memguard.sh:检查MemAvailable,不足就拒绝执行scripts/diskguard.sh:检查磁盘可用空间,不足就拒绝执行scripts/runguard.sh:把上面两个串起来的“一键护栏入口”
推荐统一入口:
scripts/runguard.sh -- <你的命令>
例如:
scripts/runguard.sh -- agent-browser open https://example.com
说明:阈值可以通过环境变量临时覆盖,但默认配置的目标是“稳”。
为什么要这样做
浏览器自动化的资源峰值很常见:
- 页面重、图片多、脚本多 → 内存容易飙升
- 安装浏览器/依赖、生成截图/PDF、缓存 → 磁盘容易被写满
护栏的意义就是:
- 失败要早(fail fast),不要跑到一半把环境拖死
- 降低“偶发不可复现”问题
下一步
- 把常见自动化任务整理成模板:
- 登录 → 导航 → 导出 → 下载
- 列表翻页抓取 → 结构化输出
- 如果磁盘长期偏紧,建议考虑扩容根盘(比一切清理都治本)