开启掘金成长之旅!这是我参与「掘金日新计划 · 12 月更文挑战」的第24天,点击查看活动详情
@[toc]
第六章:OCP工具简介
6.6 集群管理 – 资源管理(1)
• 可以查看 磁盘、分区副本、CPU 和 内存的趋势图
• 可以按Zone来查看资源情况
6.7 集群管理 – 资源管理(2)
• 查看每个 Zone 下的 已分配内存、已分配CPU、已使用磁盘 三个属性值,用来判断同一类型资源在 Zone 内机器上的使用率是否基本一致,如果基本一致则表明负载均衡
• 根据已使用磁盘百分比来判断集群的磁盘容量是否够用,当磁盘使用到量到达磁盘容量80%时,则可以考虑增加机器进行扩容,使磁盘水位保持正常水位
6.8 租户管理 – 租户资源管理
• 在资源使用区域通过时间条件筛选,查看最近一周、一个月、六个月、一年或自定义时间段内的 磁盘、分区副本、CPU和内存信息
6.9 租户管理 – 租户性能管理
• 支持对性能与SQL、事务、存储与缓存进行统计和监控
• 可以按统计周期监控,也可以查看实时数据
• 可以按Zone及OBServer查看数据
6.10 租户管理 – SQL诊断
可以对可疑SQL、TopSQL和SlowSQL进行诊断,诊断识别风险语句,规避风险
6.11 告警管理-OceanBase告警级别
| 级别 | 英文定义 | 中文定义 | 颜色 | 说明 |
|---|---|---|---|---|
| 1 | Down | 停服 | 紫 | 完全不可用,需要立即介入修复 |
| 2 | Critical | 严重 | 红 | 系统可用性下降,需要紧急修复,避免完全不可用,如内存使用率大于90%持续3分钟 |
| 3 | Alert | 警告 | 橙 | 系统仍然可用,但是即将达到不可用状态,需要采取措施防止可用性下降,如OB租户连接数大于上限的80% |
| 4 | Caution | 注意 | 蓝 | 根据趋势判定,系统关键性能指标正在下降,但是还没达到触发警告的程度,此次可通过排查发现潜在的问题,避免警告产生 |
| 5 | Info | 提醒 | 绿 | 操作提醒,本质上不是告警,通常是管理员执行重要操作,如集群下线 |
• 告警范围包括OceanBase集群、OceanBase租户、服务、服务器主机等 • 为避免告警数量过多导致的告警风暴,告警通道支持配置聚合
6.12 告警管理-告警项
配置告警的范围、触发条件、检测周期、告警等级等信息
6.13 告警管理-查看告警事件
控制台的告警事件列表用于查看和检索全部告警。告警事件列表支持丰富的搜索条件,其中关键字搜索会匹配告警概述、告警详情和所有标签的值
6.14 告警管理-告警通道
告警本身是独立的功能,未配置通道和订阅时,只能通过控制台的告警事件页面查看告警。通过配置告警通道和告警订阅,用户可以接收告警通知消息