首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
线上问题排查
订阅
larrystd
更多收藏集
微信扫码分享
微信
新浪微博
QQ
5篇文章 · 0订阅
一个诡异的 200ms 延迟问题排查过程
最近生产环境 Nginx 遇到了部分请求延迟增加200ms的情况,深入排查解决后觉得挺有意义的(包括排查过程),所以这里记录分享一下。
RocketMQ 消息队列冷读问题的分析与优化
对于RocketMQ来讲,如果消费比较及时,大部分读取仅通过PageCache就完成了,但是冷读的消费者,读取的消息已经从pageCache中被驱逐了,此时消息的读取会从磁盘中读取
字节一面:你负责的业务系统,流量突然提升100倍QPS,你怎么办?
大家好,我是田螺。 分享一道字节面试场景题:假设你负责的业务系统,流量突增,比如QPS暴增100倍,你要怎么处理? 有些伙伴一听完题目,就不假思索回答,那就加机器呀、扩容什么的。当然,这个不能算
记一次线程池误用导致线上 OOM 故障的排查与解决过程
最近接到了一个线上问题处理任务,要对一个多年前上线目前仍承载重要业务的老系统因为最近频繁发生崩溃的问题进行排查解决。最终定位到问题发生的原因其实不复杂。不仅从技术上,也从流程思考系统稳定性实践方法。
记一次JAVA 线上故障排查完整套路
线上故障主要会包括cpu、磁盘、内存以及网络问题,而大多数故障可能会包含不止一个层面的问题,所以进行排查时候尽量四个方面依次排查一遍。同时例如jstack、jmap等工具也是不囿于一个方面的问题的,基本上出问题就是df、free、top 三连,然后依次jstack、jmap伺候…