记一次服务器故障排查过程,docker全服务宕机异常排查过程/journalctl命令排查过程

57 阅读1分钟

事故现场

研发反馈,2025-06-01 docker全服务宕机,见截图

image.png

排查过程

1、journalctl命令查看50h前 docker相关命令--> 看到docker服务重启

journalctl --since "50 hours ago" | grep docker

image.png

2、COMMAND=/bin/systemctl restart docker 命令是谁执行的?哪个ip执行的?

journalctl -u sshd --since "2025-06-01 22:00:00" 查看这个时间哪个ip登陆机器

image.png

3、Accepted password for root from 180.164.98.75 port 19478 ssh2 -->找到罪魁祸首

后面发现这个ip是****,这里不做阐述了

总结

通过journalctl命令,查看服务器操作日志,找到服务器故障原因