首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
运维
订阅
ITvlog
更多收藏集
微信扫码分享
微信
新浪微博
QQ
12篇文章 · 0订阅
Linux内核参数调优实战:生产环境性能翻倍
上周线上服务扛不住流量,运维群里一顿排查,最后发现是内核参数没调。 默认配置跑个开发环境还行,生产环境就是在给自己挖坑。 把这次调优过程记录一下,都是踩过的坑。
TCP连接问题排查手册:从握手超时到连接泄漏
前言 做后端这些年,TCP相关的问题排查过无数次。连接超时、连接被重置、端口耗尽、TIME_WAIT堆积……每种问题都有自己的套路。 这篇文章把我遇到过的典型问题和排查方法整理一下。不讲TCP协议原理
Linux磁盘IO排查与性能优化实战
服务器慢,CPU和内存都正常,很可能是磁盘IO的问题。 但很多人排查到这一步就卡住了——知道是IO问题,不知道具体哪个进程、哪个文件、怎么优化。 这篇把磁盘IO排查的思路和工具整理一下。
Bash脚本实战:从重复劳动中解放出来
写了十年运维脚本,最深的体会是:Bash不难,难的是写出不坑人的脚本。 见过太多"能跑"但一改就崩的脚本,也踩过不少自己挖的坑。这篇把我积累的经验整理出来,都是血泪教训。
网络延迟与丢包问题排查实战
服务响应慢、接口超时、用户反馈卡顿,很多时候问题出在网络层面。延迟高、丢包、抖动这些问题看起来简单,排查起来却需要一套系统的方法。 本文整理网络延迟和丢包问题的排查思路和常用工具,配合实际案例。
Linux进程排查实战:strace和lsof救命指南
服务起不来,日志没报错。进程在跑,但就是不干活。 这种问题最恶心,看日志看不出问题,看监控也没异常。 这时候就需要strace和lsof这两个神器了。 strace:跟踪系统调用 strace能看到进
新人入职,我是怎么快速接手20台服务器的
刚入职新公司,领导说:这20台服务器你来管。 然后甩给我一个Excel表格,里面就写了IP和密码,其他啥都没有。 前任留下的文档?不存在的。 分享一下我是怎么快速上手的。 Day 1:摸清家底 第一步
管理100台服务器是什么体验?Python一行代码搞定
前言 运维日常: 登录服务器A,执行命令 登录服务器B,执行同样命令 登录服务器C... 这太痛苦了!用Python + Fabric实现批量自动化。
Ansible自动化运维:从入门到批量管理100台服务器
背景:运维的噩梦 去年公司扩张,服务器从10台涨到100+台。以前的运维方式: 问题来了: 改到一半忘了改到哪了 有几台配置漏了没发现 凌晨3点被叫起来改配置,困得要死还要一台台登录 后来用了Ansi
Linux系统性能排查实战指南:从定位到解决
前言 上周线上服务器突然变慢,用户反馈接口响应从200ms飙到2s。 登上服务器一看,load average飙到20多(4核机器),但具体是什么原因导致的?CPU?内存?磁盘IO?网络? 花了2小时