首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
线上问题排查
订阅
寧宁甯啊
更多收藏集
微信扫码分享
微信
新浪微博
QQ
76篇文章 · 0订阅
一次非常典型的 JVM OOM 事故 (要注意 where 1 = 1 哦)
当面对 JVM OOM 时,你会紧张吗 ? 会不会手足无措 ? 这篇文章,分享前段时间帮一位同学梳理面对 JVM OOM 事故时的解题思路。 首先从对话中,我们可以看到内存溢出呈现两种情况: 运行一段
线上问题排查指南
前言 最近经常有小伙伴问我,遇到了线上问题要如何快速排查。 这非常考验工作经验了。 有些问题你以前遇到,如果再遇到类似的问题,就能很快排查出导致问题的原因。 但如果某个问题你是第一次遇到,心中可能会有
一次生产环境OOM排查
一、背景 前几天下午飞书告警群里报起了java.lang.OutOfMemoryError: unable to create new native thread告警,看见后艾特了对应的项目负责人但是
【后端性能优化】接口耗时下降60%,CPU负载降低30%
一个很小的优化,产生了非常好的效果…… 很多人对 GC 原理了然于胸,但是苦于没有实践经验,因此本篇文章将分享我的GC 优化实践。
不作死就不会死!Redis缩容导致线上大规模故障的惨痛经历
唉,小趴菜我最近又犯事了,怎么会是捏?Redis缩容又故障了,这次可是核心业务炸了呢,故障的原因充分体现了不作死就不会死的名言。
聊一次线程池使用不当导致的生产故障
1 抢救 2023 年 10月 27 日,是一个风和日丽的周五,我正在开车上班的路上。难得不怎么堵车,原本心情还是很不错的。可时间来到 08:50 左右,飞书突然猛烈的弹出消息、告警电话响起,轻松的氛
【线上故障复盘】RPC 线程池被打满,1024个线程居然不够用?
昨天晚上,我刚到家里打开公司群,就看见群里有人讨论:线上环境出现大量RPC请求报错,异常原因:被线程池拒绝……
工作六年,我学会了用 Arthas 来辅助我的日常工作
如何通过 arthas 来解决日常工作中的疑难问题,如何通过 arthas 处理工作以前需要 debug,需要打印日志才能找的 bug。 集合案例来谈谈如何使用 arthas 这些命令。
浅析大促备战过程中出现的fullGc,我们能做什么?
为应对618、双11大促,经常会发生流量过大导致Jvm出现大量young Gc 和 部分full GC的情况,使得性能下降,可用率降低等情况。本文将借助Jvm的垃圾回收机制,介绍如何避免full gc
工作十几年,第一次在线上遇到死锁问题
概述 最近一直在为系统的稳定性努力着,但凡线上有一些问题,都不轻易放过。尤其是在2023年,大环境不好的情况下,如果it团队系统稳定性都做的不好的话,很容易提桶走人的。 事情是这样的,在2023年3月