OCP工具简介、集群管理 – 资源管理(1)、租户管理 – 租户性能管理、告警管理-OceanBase告警级别

1,878 阅读3分钟

开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第24天,点击查看活动详情

@[toc]

第六章:OCP工具简介

6.6 集群管理 – 资源管理(1)

在这里插入图片描述• 可以查看 磁盘、分区副本、CPU 和 内存的趋势图 • 可以按Zone来查看资源情况

6.7 集群管理 – 资源管理(2)

在这里插入图片描述 • 查看每个 Zone 下的 已分配内存、已分配CPU、已使用磁盘 三个属性值,用来判断同一类型资源在 Zone 内机器上的使用率是否基本一致,如果基本一致则表明负载均衡 • 根据已使用磁盘百分比来判断集群的磁盘容量是否够用,当磁盘使用到量到达磁盘容量80%时,则可以考虑增加机器进行扩容,使磁盘水位保持正常水位

6.8 租户管理 – 租户资源管理

在这里插入图片描述 • 在资源使用区域通过时间条件筛选,查看最近一周、一个月、六个月、一年或自定义时间段内的 磁盘、分区副本、CPU和内存信息

6.9 租户管理 – 租户性能管理

在这里插入图片描述• 支持对性能与SQL、事务、存储与缓存进行统计和监控 • 可以按统计周期监控,也可以查看实时数据 • 可以按Zone及OBServer查看数据

6.10 租户管理 – SQL诊断

可以对可疑SQL、TopSQL和SlowSQL进行诊断,诊断识别风险语句,规避风险 在这里插入图片描述

6.11 告警管理-OceanBase告警级别

级别英文定义中文定义颜色说明
1Down停服完全不可用,需要立即介入修复
2Critical严重系统可用性下降,需要紧急修复,避免完全不可用,如内存使用率大于90%持续3分钟
3Alert警告系统仍然可用,但是即将达到不可用状态,需要采取措施防止可用性下降,如OB租户连接数大于上限的80%
4Caution注意根据趋势判定,系统关键性能指标正在下降,但是还没达到触发警告的程度,此次可通过排查发现潜在的问题,避免警告产生
5Info提醒绿操作提醒,本质上不是告警,通常是管理员执行重要操作,如集群下线

• 告警范围包括OceanBase集群、OceanBase租户、服务、服务器主机等 • 为避免告警数量过多导致的告警风暴,告警通道支持配置聚合

6.12 告警管理-告警项

在这里插入图片描述配置告警的范围、触发条件、检测周期、告警等级等信息

6.13 告警管理-查看告警事件

在这里插入图片描述控制台的告警事件列表用于查看和检索全部告警。告警事件列表支持丰富的搜索条件,其中关键字搜索会匹配告警概述、告警详情和所有标签的值

6.14 告警管理-告警通道

在这里插入图片描述告警本身是独立的功能,未配置通道和订阅时,只能通过控制台的告警事件页面查看告警。通过配置告警通道和告警订阅,用户可以接收告警通知消息