首页
沸点
课程
数据标注
HOT
AI Coding
更多
直播
活动
APP
插件
直播
活动
APP
插件
搜索历史
清空
创作者中心
写文章
发沸点
写笔记
写代码
草稿箱
创作灵感
查看更多
登录
注册
确定删除此收藏集吗
删除后此收藏集将被移除
取消
确定删除
确定删除此文章吗
删除后此文章将被从当前收藏集中移除
取消
确定删除
编辑收藏集
名称:
描述:
0
/100
公开
当其他人关注此收藏集后不可再更改为隐私
隐私
仅自己可见此收藏集
取消
确定
微服务
订阅
吹散的蒲公英
更多收藏集
微信扫码分享
微信
新浪微博
QQ
21篇文章 · 0订阅
巧用机器学习定位云服务器故障
随着腾讯云业务的扩大,母机数量越来越多。为减少人力并实现母机故障的自动化定位,本文尝试利用机器学习算法,通过对历史故障母机的日志数据学习,训练模型实现自动化分析定位母机故障原因。 对于每一单母机故障我们都需要定位出背后真实的故障原因,以便对相应的部件进行更换以及统计各种部件故障…
细致解析:kubernets整体架构
一、Kubernetes 是 Google 团队发起并维护的基于 Docker 的开源容器集群管理系统,它不仅支持常见的云平台,而且支持内部数据中心。 master为集群唯一入口,需要做高可用。 每一个node节点都提供一部分计算能力和存储能力。(运行容器的节点) kubele…
Docker 和 Kubernetes 从听过到略懂:给程序员的旋风教程
早在 Docker 正式发布几个月的时候,LeanCloud 就开始在生产环境大规模使用 Docker,在过去几年里 Docker 的技术栈支撑了我们主要的后端架构。这是一篇写给程序员的 Docker 和 Kubernetes 教程,目的是让熟悉技术的读者在尽可能短的时间内对 …
Kubernetes 预测性集群伸缩
在这篇文章中,科赛网后端研发工程师高朋首先介绍了 Cluster Auto Scaler 的主要设计、功能和他们对 Cluster-Autoscaler 的一些改动,使得这个组件可以支持预测性伸缩。 Kubernetes 本身有很多方面的 scaling,包括 Pod 的垂直扩…
go程序基于阿里云CodePipeline的一次devops实践
最近朋友有个项目代码托管用的码云,测试服务器(阿里云ECS)只有一台,三四个人开发,于是想基于阿里云的CodePipeline快速打造一套自动化cicd的流程,使用docker来进行多套环境部署。 阿里云CodePipeline是兼容Jenkins标准的、提供快速可靠的持续集成…
[译] 时间序列异常检测算法
在 Statsbot 中, 我们不断回顾了异常检测方法的发展,并在此基础上重新完善了我们的模型。 本文概述了最常用的时间序列异常检测算法及其优缺点。 本文针对的是只想了解一下异常检测技术现状的无经验读者。我们不想用复杂的数学模型来唬人,所以我们把所有的数学原理推导都放在下面的推…
时序数据异常检测(2)指数平滑方法
上文我们使用LOF-ICAD方法实现了时序数据的异常检测, 这次我们介绍一种更为常见的方法-------指数平滑. 指数平滑的方法, 其原理就是通过拟合出一个近似的模型来对未来进行预测, 我们可以通过这个预测来和实际的值进行比较, 如果差距过大, 我们就可以判定这个点是异常的.
AIOps核心技术和算法要点
AIOps已经逐渐兴起,AI算法已较为成熟,使之与运维结合到了一起,下面列出AIOps相关技术和算法要点,有空了再展开写,懂大数据和机器学习的基本都知道各个组件及算法的作用。
[译] Docker 的学习和应用
容器(Container)对于提高软件研发和数据存储的安全性、再生性,以及可扩展性都大有用途。它们的兴起是当今科技潮流中最重要的部分之一。 Docker 就是一个在容器中研发、部署以及运行程序的平台。实际上,Docker 就是集装箱的同义词。如果你是或是立志想要成为一名软件开发…
自动化时序异常检测的可扩展通用框架
虽然计算软硬件的快速发展已经极大地提高了应用的性能,但大型集群中依然存在各类软硬件问题,影响了用户体验和收益。系统需要不间断运行,对系统的监控也必须持续进行。从数据分析角度来看,只有不间断监控大量时序数据才能监测到潜在的故障或异常。由于系统异常或软件bug很多,人工监控几乎是不…