一次python进程卡死情况排查(上)

5,012 阅读1分钟

最近发现线上python服务会卡死,进程还在,但所有线程都是sleep状态。查了些资料定位了一下问题:

top -Hp 1

strace -T -tt -e trace=all -p 1
#定位到进程卡在29

cd /proc/1/fd
ls -l
#查看到29对应的是:29 -> socket:[51457776]
#拿到卡在的socket的inode为51457776

netstat -ent|grep 51457776

查看发现在服务卡死在一个网络请求上。