Redis运维问题解决:连接异常

122 阅读2分钟

小亦平台会持续给大家科普一些运维过程中常见的问题解决案例,运维朋友们可以在常见问题及解决方案专栏查看更多案例。

1. 问题概述

2024年1月26日,某银行测试环境的应用出现Redis连接异常,具体表现为无法获取集群节点信息。排查发现Redis日志在特定时间段内缺失,且从节点全部关闭,导致集群高可用性失效。​ 2. 问题分析

分析过程:

  1. 应用日志检查:发现应用连接Redis时抛出cluster nodes获取异常。 ​
  2. Redis日志排查:2024/1/26 17:40至21:15期间无日志记录,无法直接判断Redis状态。集群负载正常,但监控缺失,无法追溯历史状态。 ​
  3. 集群状态检查:主节点运行正常,但所有从节点(Slave)均处于关闭状态。

分析结论:

  • Redis集群在故障时间段内可能因从节点未启动导致高可用性失效,且日志与监控缺失加剧了问题定位难度。

3. 解决方案与优化建议

优化措施: 建议启动从节点,保持redis高可用。 ​

如果您遇到类似问题或有其他疑问,欢迎提交工单:www.ces-xiaoyi.com.cn/#/workOrder… 小亦平台运维团队将为您提供专业支持!

​ 解锁小亦平台的更多功能:

小亦平台AI巡检Agent现已正式开放!🌟三步实现智能运维,get专业巡检报告:www.ces-xiaoyi.com.cn/#/next_cons…