指标告警列表
云数据库 GaussDB在ManageOne监控配置中内置了一部分阈值告警规则,本章节提供这部分指标类告警上报的详细信息列表。
查看阈值告警规则
-
使用浏览器,通过地址“https://
ManageOne运维面主页的访问地址
:31943”,登录ManageOne运维面,或通过地址“https://
ManageOne主门户的访问地址
”,登录ManageOne主门户,选择“运维中心(OC)”,进入ManageOne运维面。
- 密码方式:输入账号和密码。
-
默认账号:bss_admin
对于从8.2.0或更早版本升级上来的ManageOne,默认账号为admin。
-
默认密码:参见《华为云Stack 8.3.1 账户一览表》的“A类(Portal)”页签中,“ManageOne运维面”账户对应的默认密码。
-
- USB Key方式:插入已预置用户证书的USB Key,选择设备和用户证书,并输入PIN码。
- 密码方式:输入账号和密码。
-
选择“监控 > 监控配置 > 阈值告警规则”,进入阈值告警规则页面。
-
在左侧导航栏单击“全部资源 > 云资源 > 数据库 > 云数据库 GaussDB > 云数据库 GaussDB”,在右侧列表的来源列筛选“系统预置”,即可看到GaussDB服务预置的阈值告警规则。
指标告警列表
关键字段说明:
- 采集间隔:每次采集指标数据的间隔。例如:采集间隔为1分钟,每隔一分钟会采集一次指标数据。
- 上报告警采集次数:代表连续采集指标超过阈值次数超过该设定值,系统会上报告警,反之则清除告警。例:连续3次采集CPU指标>=90,则上报5023110告警;如果连续3次采集CPU指标<90,则清除当前告警。
告警ID
告警名称
告警等级
告警阈值
上报告警采集次数
清除告警阈值
清除告警采集次数
指标
采集间隔(min/次)
5023112
云数据库 GaussDB实例磁盘容量不足
紧急
>=80%
3
<80%
3
实例数据磁盘已使用百分比
1
5023113
云数据库 GaussDB组件磁盘容量不足
紧急
>=80%
3
<80%
3
节点磁盘已使用百分比
1
5023119
云数据库 GaussDB组件事务执行时间过长
紧急
>=86400s
3
<86400s
3
数据库最长事务的执行时长
1
5023120
云数据库 GaussDB节点磁盘IO带宽占用率过高
紧急
>=95%
3
<95%
3
磁盘io带宽占用率
1
5023082
云数据库 GaussDB主机流控时间超阈值
紧急
>=10s
3
<10s
3
主机流控时间
1
5023086
云数据库 GaussDB动态内存使用率高
紧急
>=70%
3
<70%
3
动态内存使用率
1
5023110
云数据库 GaussDB 节点CPU使用率过高
重要
>=90%
3
<90%
3
CPU使用率
1
5023111
云数据库 GaussDB节点内存使用率过高
重要
>=90%
3
<90%
3
内存使用率
1
5023114
云数据库 GaussDB节点数据磁盘写入变慢
重要
>=15ms
1
<15ms
3
数据磁盘单次写入花费的时间
1
5023115
云数据库 GaussDB节点数据磁盘单次平均读取花费时间过长
重要
>=15ms
1
<15ms
3
数据磁盘单次读取花费的时间
1
5023116
云数据库 GaussDB组件事务回滚率过高
重要
>=1%
3
<1%
3
用户事务回滚率
1
5023117
云数据库 GaussDB实例 80% SQL响应时间变慢
重要
>=10000μs
3
<10000μs
3
80% SQL的响应时间
1
5023118
云数据库 GaussDB实例 95% SQL响应时间变慢
重要
>=50000μs
3
<50000μs
3
95% SQL的响应时间
1
5023083
云数据库 GaussDB备机redo进度超阈值
重要
>=1073741824b
3
<1073741824b
3
备机redo进度(该指标用于统计分片内备机redo进度,表示备机和主机的差距,该值为实时值)
1
5023084
云数据库 GaussDB活跃会话率高
重要
>=80%
3
<80%
3
活跃会话率(该指标用于统计当前处于活跃工作状态会话占总会话数比率,该值为实时值)
1
5023085
云数据库 GaussDB在线会话率高
重要
>=90%
3
<90%
3
在线会话率(该指标用于统计CN(分布式)/主DN(集中式)上的在线会话比例,该值为实时值)
1