事故现场
研发反馈,2025-06-01 docker全服务宕机,见截图
排查过程
1、journalctl命令查看50h前 docker相关命令--> 看到docker服务重启
journalctl --since "50 hours ago" | grep docker
2、COMMAND=/bin/systemctl restart docker 命令是谁执行的?哪个ip执行的?
journalctl -u sshd --since "2025-06-01 22:00:00" 查看这个时间哪个ip登陆机器
3、Accepted password for root from 180.164.98.75 port 19478 ssh2 -->找到罪魁祸首
后面发现这个ip是****,这里不做阐述了
总结
通过journalctl命令,查看服务器操作日志,找到服务器故障原因