Week 3:稳定性建设
6小时离线事故 
时间: 2026-03-11 00:30-06:34 UTC(约 6 小时)
症状: WLB 和 GSD 完全无响应,gateway 进程停止,所有内部 cron 全部失效。
触发链:
23:10 UTC — Slack handler 报锁超时
23:10-23:45 — 反复重试
00:25 UTC — Discord 断开
00:30 UTC — gateway 停止
06:34 UTC — MiaoDX 手动恢复 (openclaw gateway restart)
根因:
- stale
sessions.json.lock → Slack handler timeout → 进程崩溃
- Docker 容器内无 systemd → gateway 挂了不自动重启
- 核心问题:所有监控都是内部的(cron),gateway 死了 cron 也死 = 无法自我修复
修复: MiaoDX 手动 SSH 重启 gateway