作为SRE小伙伴,最近得到研发小伙伴反馈,线上某台Linux服务器ssh登陆缓慢,在输入密码敲上回车后还需要10s左右才能连接上。
首先我使用堡垒机尝试登陆了一次,事实证明ssh确实很慢。
1、怀疑是因为服务器sshd进程过多导致,通过执行指令
ps -ef |grep sshd && who
发现登陆用户并不是很多;
2、怀疑是服务器负载过高导致,通过执行指令
uptime && netstat -anop |wc -l
发现服务器load值和进程连接数都不是很高;
3、在我们自有的监控系统中,查看对应IP的基础监控,也未发现有网络、I/O等异常现象;
4、作为星火的忠实用户,我键入了如下内容:讯飞星火
linux服务器,ssh登陆比较慢,要好几秒才登陆进入成功
给出的查询结果大致是通过如下两个方式进行解决:
Dns 反向解析问题:修改/etc/ssh/sshd_config,将UseDNS设置为no
GSSAPI 认证问题:修改/etc/ssh/sshd_config,在GSSAPIAuthentication这一行,将其设置为no
但是我通过查看/etc/ssh/sshd_config配置发现UseDNS和GSSAPIAuthentication的配置项都是no,显然也不是这个原因;
5、查看系统日志:vim /var/log/messages发现有如下报错:
dbus[26709]: [system] Failed to activate service 'org.freedesktop.login1': timed out
6、严谨一些,又查看了ssh链接日志:vim /var/log/secure发现有类似报错:
pam_systemd(crond:session): Failed to create session: Failed to activate service 'org.freedesktop.login1': timed out
7、好现在问题原因找到:
[system] Failed to activate service 'org.freedesktop.login1': timed out
星火搜索了一波,意思大概就是:
当dbus的服务有重启后,systemd-logind服务没有跟随重启导致
通过指令systemctl status systemd-logind查看服务状态,果然可以看到有上面类似报错,
现在只需要重启该服务即可解决问题:
systemctl restart systemd-logind