告警解释
=======
此告警对应指标“oma进程内存占用”,此指标反映om_agent进程占用的内存大小。
告警属性
告警ID
告警级别
告警类型
告警归属
业务类型
是否可自动清除
5101757
巡检配置
业务质量告警
租户面
云数据库 GaussDB 节点
是
告警参数
类别
参数名称
参数含义
定位信息
云服务
产生告警的云服务
实例ID
产生告警的实例ID
节点ID
产生告警的节点ID
巡检名称
产生告警的巡检名称
指标编码
产生告警的指标编码
附加信息
租户名称
产生告警的租户名称
实例名称
产生告警的实例名称
租户ID
产生告警的租户ID
云服务
产生告警的云服务
服务
产生告警的服务
微服务
产生告警的微服务
告警源IP
告警源IP
节点角色
产生告警节点的节点角色
指标编码
产生告警节点的指标编码
指标采集值
产生告警节点的指标采集值
指标阈值
产生告警节点的指标阈值
对系统的影响
- 一般情况下,如果无变更,om_agent进程占用内存都是平稳的。不同的数据库内核版本之间,om_agent进程占用的内存会有差别,如果内核升级之后出现此指标上涨之后很快平稳,属于正常现象。
- 如果出现内存持续上涨不趋于平稳,可能会影响om_agent进程的运行,严重时会导致节点上内存资源耗尽,其他组件无法申请到内存。
可能原因
内存泄漏。
处理步骤
-
收到告警后,通过查看监控指标查看指标“oma进程内存占用”,确认指标情况以及触发告警的组件。
-
持续观察指标,确认是否趋于平稳,并同步排查是否有数据库内核的升级操作。
-
通过登录实例节点,登录到告警节点上,使用如下命令确认om_agent的内存占用情况。
-
执行命令,查询om-agent的父进程,获取om_agent父进程的PID。
ps -ef | grep 'om_agent.py'
-
确认RSS列的值和指标展示的是否一致,并联系技术支持处理。
ps -p '151334' v | grep -E '151334|PID'
-
告警清除
此告警修复后,系统会自动清除此告警,无需手工清除。
参考信息
不涉及。
更多详情请参考GaussDB 文档中心:doc.hcs.huawei.com/db/zh-cn/ga…