云数据库 GaussDB实例 95% SQL响应时间变慢

56 阅读2分钟

告警解释

=======

系统每一分钟检查云数据库 GaussDB的95%SQL响应时间,当连续三次监测到95%SQL响应时间超过设置的阈值50000μs(默认)时,产生此告警。

对系统的影响

GaussDB实例95% SQL响应时间变慢,导致业务响应变慢。

可能原因

  1. 数据库某种资源使用达到上限,导致线程池满,业务语句整体时延上涨。
  2. 单个语句执行时间超长,拉高整体指标,但大部分业务运行正常。
  3. 某种操作导致短时间出现大量慢SQL。

处理步骤

  1. 登录运营面,查看发生告警时间段一段时间内的关键指标情况。

    1. 使用浏览器,通过账号地址“https://域名”登录运营面。

    2. 在左上角菜单服务列表找到云数据库GaussDB,单击进入实例列表页面。

    3. 根据获取的实例ID和节点ID,查看对应实例、对应节点。

    4. 单击发生告警实例的“查看监控指标”按钮,查看实例指标监控。

    5. 在实例指标监控页面的右上角搜索框中输入指标的关键字“95”,进行模糊查询。

    6. 结合自身业务观察指标变化情况,确认并记录指标异常的开始时间。

      • 持续出现此问题且业务侧感知明显,需立即联系技术支持进行处理,确认规避措施。
      • 如果业务侧感知不明显,则需要继续定位。
  2. 参考ALM-5101181 Ops巡检-95% SQL的响应时间异常处理。

告警清除

此告警修复后,系统会自动清除此告警,无需手工清除。

参考信息

不涉及。

更多详情请参考GaussDB 文档中心:doc.hcs.huawei.com/db/zh-cn/ga…