遇到问题不慌,按步骤恢复
常见故障类型
- 启动失败
- 无响应
- 数据丢失
- 性能骤降
- 安全事件
故障 1:启动失败
症状
openclaw start
# Error: ...
排查步骤
# 1. 检查日志
openclaw logs --tail 100
# 2. 检查配置
openclaw config check
# 3. 检查端口
lsof -i :3000
# 4. 检查依赖
openclaw doctor
常见原因与解决
| 原因 | 解决 |
|---|---|
| 端口被占用 | kill -9 <PID> 或换端口 |
| 配置错误 | 修复配置文件 |
| 权限不足 | sudo 或修改权限 |
| 依赖缺失 | 重装依赖 |
故障 2:无响应
症状
openclaw chat "test"
# 一直等待,无响应
排查步骤
# 1. 检查服务状态
openclaw status
# 2. 检查 API Key
echo $DEEPSEEK_API_KEY
# 3. 测试网络
curl -I https://api.deepseek.com
# 4. 检查日志
openclaw logs --tail 50
常见原因与解决
| 原因 | 解决 |
|---|---|
| API Key 错误 | 重新设置 |
| 网络问题 | 检查网络/代理 |
| API 限流 | 等待或换模型 |
| 内存不足 | 增加内存 |
故障 3:数据丢失
症状
- 对话历史消失
- 配置丢失
- 知识库清空
恢复步骤
# 1. 检查备份
ls ~/backups/
# 2. 恢复数据库
psql openclaw < ~/backups/openclaw_20260312.sql
# 3. 恢复配置
cp ~/backups/config.yaml ~/.openclaw/
# 4. 恢复知识库
cp -r ~/backups/workspace ~/.openclaw/
预防措施
# 配置自动备份
heartbeat:
tasks:
- name: auto-backup
schedule: "0 2 * * *"
action: |
pg_dump openclaw > ~/backups/openclaw_$(date +%Y%m%d).sql
tar czf ~/backups/workspace_$(date +%Y%m%d).tar.gz ~/.openclaw/workspace
故障 4:性能骤降
症状
- 响应时间突然变长
- CPU/内存占用高
- 频繁超时
排查步骤
# 1. 检查资源
top
df -h
free -m
# 2. 检查日志
openclaw logs --grep "slow"
# 3. 检查数据库
psql -c "SELECT COUNT(*) FROM messages;"
# 4. 性能分析
openclaw stats --performance
解决方案
| 原因 | 解决 |
|---|---|
| 内存不足 | 增加内存或限制历史 |
| 数据库过大 | 清理或迁移 |
| 并发过高 | 限制并发 |
| 网络延迟 | 换节点或优化网络 |
故障 5:安全事件
症状
- 异常登录
- 数据泄露
- API 滥用
应急响应
# 1. 立即停止服务
openclaw stop
# 2. 撤销所有 Token
openclaw token revoke --all
# 3. 检查日志
openclaw logs --audit
# 4. 分析影响
openclaw security audit
恢复步骤
# 1. 更新所有密钥
export DEEPSEEK_API_KEY="new-key"
export API_TOKEN="new-token"
# 2. 加固安全
# 修改配置,启用更多安全措施
# 3. 重启
openclaw start
# 4. 监控
openclaw logs -f
完整恢复流程
场景:服务器崩溃
# 1. 检查服务器状态
ssh user@server
systemctl status openclaw
# 2. 检查数据
ls -la ~/.openclaw/data/
# 3. 恢复数据(如有备份)
aws s3 cp s3://backup-bucket/latest.tar.gz .
tar xzf latest.tar.gz -C /
# 4. 重启服务
systemctl restart openclaw
# 5. 验证
openclaw status
openclaw chat "test"
场景:数据库损坏
# 1. 停止服务
openclaw stop
# 2. 备份损坏数据库
cp ~/.openclaw/data/openclaw.db ~/.openclaw/data/openclaw.db.corrupt
# 3. 恢复备份
psql openclaw < ~/backups/latest.sql
# 4. 重启
openclaw start
# 5. 验证数据
openclaw history --count
监控与预警
配置告警
alerts:
- name: service-down
condition: health_check_failed
action:
- send-telegram
- send-email
- name: high-error-rate
condition: error_rate > 5%
action: send-telegram
- name: disk-full
condition: disk_usage > 90%
action: send-telegram
监控指标
# CPU
top -l 1 | grep "CPU usage"
# 内存
vm_stat | grep "free"
# 磁盘
df -h /
# 网络
ping -c 3 api.deepseek.com
灾难恢复计划
准备阶段
-
定期备份
- 数据库:每天
- 配置:每周
- 知识库:每天
-
监控告警
- 服务状态
- 性能指标
- 安全事件
-
文档记录
- 恢复步骤
- 联系人
- 密码管理
响应阶段
-
确认问题
- 检查日志
- 分析影响
- 确定优先级
-
止损
- 停止服务
- 隔离问题
- 保护数据
-
恢复
- 恢复数据
- 重启服务
- 验证功能
复盘阶段
-
分析原因
- 根因分析
- 影响评估
-
改进措施
- 修复漏洞
- 加强监控
- 更新文档
常用恢复命令
# 检查服务
openclaw status
# 查看日志
openclaw logs --tail 100
# 重启服务
openclaw restart
# 恢复备份
openclaw restore ~/backups/latest.tar.gz
# 导出数据
openclaw export --all
# 安全检查
openclaw security audit
联系支持
官方支持
- Email: support@openclaw.ai
- Discord: discord.com/invite/claw…
- GitHub Issues: github.com/openclaw/op…
中文支持
- 微信: yang1002378395
- 备注: "OpenClaw 故障"
💬 你遇到过什么故障?评论区分享!
🎯 需要故障恢复服务?微信:yang1002378395