首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
稳定性
订阅
huajia
更多收藏集
微信扫码分享
微信
新浪微博
QQ
18篇文章 · 0订阅
一次生产环境OOM排查
一、背景 前几天下午飞书告警群里报起了java.lang.OutOfMemoryError: unable to create new native thread告警,看见后艾特了对应的项目负责人但是
线上FullGC问题排查实践——手把手教你排查线上问题
当我们遇到线上cpu使用率过高的情况时,可以先查看是否是full gc引起的问题,注意要看的是jvm的监控,或者使用jstat相关命令查看。不要被机器内存监控所误导。
用Arthas解决线上正则表达式导致CPU100%的问题
在项目中,我们常常会面临CPU过高或堆内存溢出的问题,解决这类问题通常需要查看线程的堆栈信息。本文将重点介绍两种线程排查工具:jstack和Arthas。最后,我们将引入一个线上的真实案例进行说明。
记一次线上问题引发的对 Mysql 锁机制分析 | 京东物流技术团队
最近双十一开门红期间组内出现了一次因 Mysql 死锁导致的线上问题,当时从监控可以看到数据库活跃连接数飙升,导致应用层数据库连接池被打满,后续所有请求都因获取不到连接而失败 整体业务代码精简逻
记一次线上问题 → 菜鸟杀手,事务为什么没生效
实际项目中很容易踩坑的一个问题,不只是新手,很多老手也容易忽略这个点 不是事务没生效,而是事务自动提交,多次数据库操作根本就不在一个事务中!
【线上问题】CompletableFuture与线程池使用不当导致服务整个挂掉
Informal Essay By English It is always a pleasure to learn 背景 在某一个风和日丽的早上,小组同事说昨晚线上服务有20分钟左右的不可用,当时内
线上故障处理手册
通常处理线上问题的三板斧是重启-回滚-扩容,能够快速有效的解决问题,但是根据我多年的线上经验,这三个操作略微有些简单粗暴,解决问题的概率也非常随机,并不总是有效。这边总结下通常我处理应用中遇到的故障的解决方案。 每一层都有可能出现问题,越底层出现问题,影响面越大。所以每一个层次…
又一批长事务,P0故障谁来背锅?
最近几周,发生过多起因为事务问题引起的服务报错。现象为数据库连接池连接占满,数据库连接长时间等待,最终导致请求线程hang住,服务大面积报错。这个时候,服务资源、数据库资源大量空闲,但就是进行不下去,影响是比较恶劣的。 谁来背锅?当然是架构师。因为这次所有的服务都活着,没运维什…
记一次ThreadLocal引发的线上故障,年终奖没了,可能还面临辞退
记一次ThreadLocal引发的线上故障,年终奖没了,可能还面临辞退,前几天,在工作不太忙的时候,为了展示我在工作中积极主动,技术能力较强,并给领导留个好印象。
聊一聊故障管理平台的建设
重试依然失败怎么办?这个问题曾经一直困扰我。因为每次处理这种问题时往往很棘手,需要在线上手动执行一些命令,是比较危险的人肉运维工作。