首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
经典问题
订阅
流传_
更多收藏集
微信扫码分享
微信
新浪微博
QQ
8篇文章 · 0订阅
gdb 提示 coredump 文件 truncated 问题排查
在 c/cpp 类的程序开发中进程遇到 coredump,偶尔会遇到 coredump truncate 问题,影响 core 后的问题排查。coredump truncate 大部分是由于 core limits 和剩余磁盘空间引发的。这种比较好排查和解决。今天我们要分析的一…
Kernel trace tools(一):中断和软中断关闭时间过长问题追踪
1. 问题背景 在工作中,我们经常遇到业务的进程网络延迟高。基于此前分析同类问题的丰富经验,造成上述问题的原因有很多种。我们发现以下两种原因经常出现在我们的视野中。 hardirq 关闭时间过长。 softirq 关闭时间过长。 hardirq 关闭时间过长会导致调度延迟,本地…
追踪将服务器CPU耗光的原因
前面我们讨论系统调用的时候结论是耗时200ns-15us不等。不过我今天说的我的这个遭遇可能会让你进一步认识系统调用的真正开销。在本节里你会看到一个耗时2.5ms的connect系统调用,注意是毫秒,相当于2500us! 当时是我的一个线上云控接口,是nginx+lua写的。正…
一次百万长连接压测 Nginx OOM 的问题排查分析
在最近的一次百万长连接压测中,32C128G的四台Nginx频繁出现OOM,出现问题时的内存监控如下所示。排查的过程记录如下。现象描述这是一个websocket百万长连接收发消息的压测环境,客户端jm
为你总结了N个真实线上故障,从容应对面试官!
很多人在面试时,会被问到这样的问题:遇到过什么系统故障?怎么解决的?下面是笔者根据自己15年互联网研发经历总结的多个线上故障真实案例。相信可以帮你从容应对面试官的提问!本文图不多,但内容很干!理解为主
简单的 HTTP 调用,为什么时延这么大?
背景最近项目测试遇到个奇怪的现象,在测试环境通过ApacheHttpClient调用后端的HTTP服务,平均耗时居然接近39.2ms。可能你乍一看觉得这不是很正常吗,有什么好奇怪的?其实不然,我再来说
重大事故!IO问题引发线上20台机器同时崩溃
几年前的一个下午,公司里码农们正在安静地敲着代码,突然很多人的手机同时“哔哔”地响了起来。本来以为发工资了,都挺高兴!打开一看,原来是告警短信故障回顾告警提示“线程数过多,超出阈值”,“CPU空闲率太