首页
首页
AI Coding
NEW
沸点
课程
直播
活动
AI刷题
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
会员
登录
注册
酷家乐监控与SRE技术团队
掘友等级
群核科技
酷家乐监控与SRE技术团队的实践分享
获得徽章 0
动态
文章
专栏
沸点
收藏集
关注
作品
赞
10
文章 10
沸点 0
赞
10
返回
|
搜索文章
最新
热门
酷家乐基于前端错误栈实现根因应用的解析
基于微应用构建的前端体系存在一个难题,即难以将收集的日志准确关联到目标应用程序。本篇文章意在构建一个系统来解析前端错误日志异常栈的关联应用
混沌工程在酷家乐的实践
酷家乐混沌工程平台Chaoslab是基于阿里巴巴ChaosBlade工具并结合酷家乐业务特色设计并实现的。 Chaoslab能够提供低成本、场景丰富的故障演练服务以及高效便捷的强弱依赖分析能力,帮助
定位时长缩减90%:酷家乐魔方语言在提升根因分析中的应用
在Takintalks稳定性技术交流社区的分享,介绍魔方语言在酷家乐根因分析中实现一分钟自动化定位的实践
酷家乐基于ClickHouse实现的调用链全保留方案实践
在分布式系统中,前端发起的一次请求可能经过了多个微服务、多台机器、多个中间件,这使得排查问题变得艰难,调用链通常是帮助开发同学排查线上问题的重要手段,本文将介绍调用链全保留的实践方案。
【故障调查】一个Thanos按天聚合查询偏移8小时的Bug
指标系统在监控领域是最核心的系统之一,这次我们遇到查询时间粒度为天的数据时,存在8h偏移。本篇文章详细记录整个排查过程。
【故障调查】一个查询导致ClickHouse集群崩溃?
背景 ClickHouse 在我们监控系统中发挥着举足轻重的作用,目前不仅承担着日志的写入,调用链、指标以及前端监控都有广泛的使用。 下面是一个异常查询导致的集群无响应的排查案例。 问题表象 从酷家乐
ClickHouse 在酷家乐指标系统中的实践
本文介绍了高基数、云原生指标监控和业务场景监控的区别。监控与大数据的数据仓库架构不同,支持各种ETL。为了满足对数据的高实效性要求,我们使用 Prometheus 这类数据库,但无法解决高基数问题..
【前端技术】puppeeter截图推送助力酷家乐稳定性运营
在公司级日常稳定性运营过程中,通常需要关注各种数据趋势,普通的做法是人工登录监控系统进行观察,但这通常繁琐耗时而无趣的,在酷家乐,通过实现系统自动截图推送到企业微信的方式,为大家节约了很多时间
ClickHouse 使用 tokenbf_v1 索引加速日志查询
根据监控日志的特点,我们对 message 字段添加了 tokenbf_v1 索引,能有效提高日志查询速度。
ClickHouse在酷家乐日志监控系统中的实践
日志是线上定位问题排障的重要工具之一,对于可观测领域而言是不可或缺的。在日志系统中,稳定性、成本、易用性以及可扩展性都极为重要。因此团队着手开启日志系统新时代!
下一页
个人成就
文章被点赞
189
文章被阅读
18,251
掘力值
833
关注了
3
关注者
151
收藏集
0
关注标签
0
加入于
2023-05-04