首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
生产问题排查
订阅
用户3044305672338
更多收藏集
微信扫码分享
微信
新浪微博
QQ
59篇文章 · 0订阅
记一次CPU过高排查过程
存在的问题 上周突然在部署一点很简单的新业务之后,上线没多久突然OOM,大部分接口访问超时,甚至有的直接失败,刚开始以为是查询了什么了大数据导致的,结果看了下CPU,300%。 排查思路 最开始我先看
利用 Arthas 精准定位 Java 应用 CPU 负载过高问题
以前碰到类似问题,可能会考虑使用 top -Hp 加 jstack 命令去排查,虽然能大致定位到问题范围,但有效信息还是太少了,多数时候还是要靠猜。今天向大家推荐一款更高效更精准的工具:Arthas!Arthas 是 Alibaba 开源的 Java 诊断工具,能够帮助我们快速…
面试官:应用上线后Cpu使用率飙升如何排查?
大家好,我是飘渺。 上次面试官问了个问题:应用上线后Cpu使用率飙升如何排查? 其实这是个很常见的问题,也非常简单,那既然如此我为什么还要写呢?因为上次回答的时候我忘记将线程PID转换成16进制的命令
线上问题定位追溯步骤
1. 服务报错,返回服务器错误(Http-code为500); 2. 服务无法访问 3. 服务很慢,很久才能返回结果
记一次线上并发问题
最近因为经济下滑,导致公司没有以前那么多的借款人,借款金额少,投资人就需要抢。 以下代码只是例子,不代表真实代码。 更新 数据出错。
同事牛逼啊,写了个隐藏 bug,我排查了 3 天才解决问题
最近线上监控 SFTP 连接频繁爆表,通过重启某个系统,连接数迅速下降,系统就能恢复正常,初步判断是应用程序连接未关闭的问题导致的。 LZ通过 IDE 全局搜索排查,SFTP 连接使用了 jsch 包,确实有一些功能点使用了SFTP 连接而未关闭的情况,或者不在 finally…
一次缓存性能问题排查
从数据分析来看,sql优化的用处不大,并不是返回了大量数据缺少索引,此次可以跳过。 出现场景:当网站并发访问高,一个缓存如果失效,可能出现多个进程同时查询DB,同时设置缓存的情况,如果并发确实很大,这也可能造成DB压力过大,还有缓存频繁更新的问题。 处理方法:对缓存查询加锁,如…
一次完整的JVM堆外内存泄漏故障排查记录| Java Debug 笔记
记录一次线上JVM堆外内存泄漏问题的排查过程与思路,其中夹带一些JVM内存分配机制以及常用的JVM问题排查指令和工具分享,希望对大家有所帮助。 在整个排查过程中,我也走了不少弯路,但是在文章中我仍然会把完整的思路和想法写出来,当做一次经验教训,给后人参考,文章最后也总结了下内存…
异步影响的业务问题线上排查
某次测试同学使用时,发生用户存在于我方开户表中,但是取消充值订单时,第三方系统报错,告知我方该用户在第三方系统中没有查找到,关键这种情况还是时不时发生的。 当用户注销使用的时候,我们只会删除在线表中的数据,没有删除开户表中的数据,导致后面取消订单的时候,通过了我方系统的验证,但…
一次连锁反应的线上事故
阶段1: 某一天业务高峰开始没多久,突然线上系统大量超时报警,看日志是调用a服务的接口不可用,查看事发最早的日志,发现是a服务的慢sql导致db拖挂了,同时导致所有接口慢,此时用户在不停的重试,导致慢的更慢,api的tomcat连接数也打满了。排查发现那条慢sql没有建立对应的…