现场系统报附件无法上传和下载。附件系统是一个单独的子系统,通过sftp服务上传到存储。
1.拿回weblogic日志分析,后台报了很多无法长传和下载的错误。了解到最近没有发布增量,现象是在上班期间突然之间不能用。
2.再次分析中间件日志,发现都是在操作sftp这一块报错。我觉得拿回Linux操作系统的message日志。
3.分析message日志,发现了大量sftp的错误:
Oct 18 15:08:04 PPS-EAMHC107 sftp-server[16089]: error: process_write: write failed
Oct 18 15:08:04 PPS-EAMHC107 sftp-server[16089]: error: process_write: write failed
Oct 18 15:08:04 PPS-EAMHC107 sftp-server[16089]: error: process_write: write failed
Oct 18 15:08:04 PPS-EAMHC107 sftp-server[16089]: error: process_write: write failed
4.到网上搜索了一下这个错误,大致是两个原因:
a. ulimit -a file size有限制,注意是应用连的那个账号
b. 磁盘空间不够
5.验证了上面的两个原因都不成立。之前附件服务是没有启动nmon监控的,当出了问题之后开始启动监控,5s采集一次。
6.分析了半天nmon监控的结果,发现磁盘IO异常的高,召集了其他厂家,发现有一个厂家正在迁移附件,迁移的时间和我们系统出问题的时间吻合,问题找到了。
总结:揣测process_write: write failed发生这种错误,就是资源不够用,到底是那种资源,需要在多个方面监控。
本文为CSDN博主「深圳gg」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。 原文链接:blog.csdn.net/stevendbagu…