首页
AI Coding
数据标注
NEW
沸点
课程
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
日志查询
订阅
杜炼
更多收藏集
微信扫码分享
微信
新浪微博
QQ
11篇文章 · 0订阅
无人运维遥不可及?让我们从AIOps建立运维大脑说起
本文根据裴丹老师在〖2018 Gdevops全球敏捷运维峰会北京站〗现场演讲内容整理而成。 裴丹,清华大学计算机系长聘副教授、特别研究员、青年千人。目前主要研究AIOps,与多家大型互联网公司在AIOps领域均有合作。在美国UCLA获得了博士学位,之后加入美国AT&T研究院担任…
一个系统,搞定闲鱼服务端复杂问题告警-定位-快速处理
服务端问题排查对开发而言是家常便饭,问题并不可怕但要花大量时间去处理;另一方面故障的快速解决至关重要。 目前问题排查最大的障碍是什么呢?我们认为有以下几个原因: 大量的告警信息。 链路的复杂性。 排查过程繁复。 依赖经验。 实际工作中的排查思路并非无迹可寻,排查思路和手段可以沉…
我们不一样!运维自动化典型案例观止
本文从实际出发,探究本质,梳理出业内几个经典的运维自动化架构,有理论有架构,有图有文有实践。不仅让你看到架构是什么样的,更让你知道如何实现这个架构,并且坦诚告诉你该系统在真实生产业务中的特点和问题。
云端的SRE发展与实践
SRE(Site Reliability Engineering)是Google于2003年提出的概念,将软件研发引入运维工作。现在渐渐已经成为各大互联网公司技术团队的标配。美团点评作为综合性多业务的互联网+生活服务平台,覆盖“吃住行游购娱”各个领域,SRE就会面临一些特殊的挑战。
掌握运维必备技能--问题故障定位
有时候会遇到一些疑难杂症,并且监控插件并不能一眼立马发现问题的根源。这时候就需要登录服务器进一步深入分析问题的根源。那么分析问题需要有一定的技术经验积累,并且有些问题涉及到的领域非常广,才能定位到问题。所以,分析问题和踩坑是非常锻炼一个人的成长和提升自我能力。如果我们有一套好的分析工具,那将是事半功倍,能够帮助大家快速定位问题,节省大家很多时间做更深入的事情。
调用链与日志的关联式跟踪查询
长假过完,相信无缘支付宝中国锦鲤的你一定已经回来工作了。虽然轻轻松松与全球免单大礼包失之交臂,但不要丧气,小编悄悄为你准备了一份秘籍,助你在2018年最后不到三个月的时间里成功逆袭,斩获年终奖的大锦鲤! 本月小编将带大家一起了解UAVStack的调用链技术,讲述调用链技术的源起…
看苏宁易购的运营保障体系如何hold住818大促
运营质量的好坏关系着用户的体验。苏宁易购是如何保障818 大促线上服务质量的? 运营质量的好坏关系着用户的体验。在日常的业务运营过程中,商品无货、页面或券过期、商铺下架、视频无法播放等问题都严重影响用户体验。如果仅凭运营的人工监控和维护来保证服务质量,不仅效率低,而且效果也不佳…
如何运用结构化思维进行故障处理
导读:运用结构化思维进行故障处理,其目的是为了将故障应急操作标准化,进而提升处理效率。 近期收到朋友赠送的一本书—《深入浅出MySQL》。闲暇之余,阅读了部分章节,书中针对故障处理一节,给我印象颇深。书中提炼出的一些方法论,正是我之前在团队中推广的方法。其目的是为了将故障应急操…
Linux 问题故障定位,看这一篇就够了
有时候会遇到一些疑难杂症,并且监控插件并不能一眼立马发现问题的根源。这时候就需要登录服务器进一步深入分析问题的根源。那么分析问题需要有一定的技术经验积累,并且有些问题涉及到的领域非常广,才能定位到问题。所以,分析问题和踩坑是非常锻炼一个人的成长和提升自我能力。如果我们有一套好的…
shell 在手分析服务器日志不愁😝
经常要看服务器日志, 总结了一份很实用的分析服务器日志 shell 命令!