首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
线上问题排查
订阅
菜鸟熊
更多收藏集
微信扫码分享
微信
新浪微博
QQ
26篇文章 · 0订阅
记一次雪花算法遇到的 生产事故!
你好,我是悟空。 最近生产环境遇到一个问题: 现象:创建工单、订单等地方,全都创建数据失败。 初步排查:报错信息为duplicate key,意思是保存数据的时候,报主键 id 重复,而这些 id 都
接口耗时2000多秒!我人麻了!
接口耗时2000多秒!我人麻了! 前几天早上,有个push服务不断报警,报了很多次,每次都得运维同学重启服务来维持,因为这个是我负责的,所以我顿时紧张了起来,匆忙来到公司,早饭也不吃了,赶紧排查!
“周五魔咒”再现:一次内存泄漏引发的线上危机与复盘
在一个阳光明媚的周五傍晚,虽然还未到周末,但我已然沉浸在这即将到来的自由时光中无法自拔。秃然,奇怪的事情发生了~ 一个服务在疯狂的FULLGC报警,把我的思绪从美好的吃喝玩乐中拉回了现实。。。
记一次redis热key、大key引发的线上事故
如何应对reids的大key、热key ,大key、热key如何定义,产生的原因,遇到问题我们应该如何分析,如何去解决
总结过往遇到的一些常见技术问题以及可能的原因和解决的思路方法
💻总结过往遇到的一些常见技术问题以及可能的原因和解决的思路方法 🎞️关于故障的一些历史故事: 客户来电,某公务员办公平台服务访问很慢,大量白屏 线上告警等
生产环境的Kafka无法正常消费了——跨机房消费和一个消费者配置项惹的祸
本文先记录了一次在生产环境中排查并解决Kafka无法正常消费的过程,然后介绍如何复现此次故障,最后结合源代码分析出故障的原因。
Spring项目中用了这种解耦模式,经理对我刮目相看
前言 不知道大家在项目中有没有遇到过这样的场景,根据传入的类型,调用接口不同的实现类或者说服务,比如根据文件的类型使用 CSV解析器或者JSON解析器,在调用的客户端一般都是用if else去做判断,
Java服务,CPU100%问题如何快速定位?
上篇《Java 服务,内存 OOM 问题如何快速定位?》发布后,有朋友在评论留言,问 CPU100% 的性能问题,如何找到相关服务,如何定位问题代码,也非常考验技术人的功底,今天简单说下思路。 假设,服务器上部署了若干 Java 站点服务,以及若干 Java 微服务,突然收到运…
重大事故!IO问题引发线上20台机器同时崩溃
几年前的一个下午,公司里码农们正在安静地敲着代码,突然很多人的手机同时“哔哔”地响了起来。本来以为发工资了,都挺高兴!打开一看,原来是告警短信故障回顾告警提示“线程数过多,超出阈值”,“CPU空闲率太
一次线上事故,导致公司损失400万
一、 顺丰高级开发工程师在线执行了 Redis 危险命令导致某公司损失 400 万 一个命令损失数百万,这,需要赔偿吗? 代码不规范,同事两行泪,撸码需谨慎! 处于好奇考虑,我来测试一下,这到底是什么