系统级安全技能,防止 Agent 死锁与冻结,提供非阻塞的紧急状态检查、任务取消与恢复命令
基本信息
- 技能名称?Error Guard — Control‑Plane Safety
- 中文名称?系统级死锁防护与紧急恢复
- 作者?amar1432
- 分类?专业技能
- 版本?1.0.0
- 标签?system-control, deadlock-prevention, task-management, recovery, control-plane, safety, async
使用方法
使用说明
核心用法
error-guard 是 OpenClaw 的控制平面安全原语,专为长时运行或高风险工作负载设计。其核心命令包括:
/status :常数时间返回系统健康状态,包括活跃任务列表、启动时间、最后心跳及停滞任务标记,绝不调用模型或外部 API
/flush :紧急停止命令,立即取消所有任务、终止进程会话、清空消息队列、重置任务注册表,保证必响应、无等待
/recover :安全恢复序列,依次执行 flush、重置控制平面状态,可选重载技能而无需重启容器
显著优点
- 非阻塞设计 :主 Agent 永不执行长时操作,杜绝外部 I/O 和 LLM 调用导致的冻结
- 故障优先 :所有恢复命令强制响应,确保极端情况下仍可操作
- 最小状态追踪 :仅记录任务元数据(taskId、时间戳、状态),不存储任何业务载荷
- 事件驱动架构 :Worker 异步上报,控制平面监听,避免轮询开销
潜在局限
高级用户专用 :需理解 OpenClaw 执行模型,误用可能导致正常任务被误杀
功能极简 :无业务逻辑、无后台监控、无用户界面,仅提供底层原语
扩展未实现 :子 Agent 运行器、任务看门狗、结构化事件协议等仍处于规划阶段
适合人群
实现长时任务、子 Agent、基准测试或后台监控(如 Moltbook、PNR 检查)的开发者
需要系统级紧急恢复能力的运维人员
运行可能阻塞、挂起或长时间执行工作负载的高级用户
常规风险
| 风险项 | 说明 | |--------|------| | 误操作数据丢失 | /flush 强制终止所有任务,未保存的进度将丢失 | | 状态不一致 | 快速恢复后可能需要手动校验业务状态 | | 学习成本 | 控制平面概念对普通用户门槛较高 |
💬 评论 (0)
📭 还没有评论,快来抢沙发吧!