【鲲苍提效】快速接入集中日志,精准定位故障源头,提升运维效率

91 阅读4分钟

汉得鲲苍基础架构管理平台的核心目标是为企业的异构系统提供简单高效的一站式统一闭环管理能力,包括统一资源(集群、主机、存储等)管理、统一应用及部署管理、统一监控管理、统一服务治理,帮助企业实现更快、更好、更全面的异构系统管理。

接下来我们将会提供一系列推文,介绍鲲苍平台的使用,帮助您快速了解本平台,给您更好的使用体验。

本文为系列推文的第二十一讲,将介绍如何通过鲲苍快速接入集中日志,精准定位故障源头,提升运维效率。

功能亮点

鲲苍集中日志能力可以帮助您精准定位故障源头,高效解决系统问题,及时发现问题并快速告警,确保系统稳定高效运行。

简单高效: 一键接入,简单高效。

功能全面: 支持服务维度实时查看,也支持集中日志维度检索与分析,点面结合。

快速告警: 系统内置集中日志快速告警,辅助及时发现问题,确保快速响应。

透明无侵入: 零代码修改,无需手动安装任何代理,降低接入成本,提升运维效率。

关键场景

场景一:实时查看应用日志

常用于如下两个场景(系统内置能力,无需安装额外集群组件):

  • 日常应用启动时,实时观察应用启动日志,确保关键应用(例如,中间件)顺利启动。

  • 日常问题重现时,实时观察应用运行日志,获取重现问题时的关键运行日志或者异常日志。

鲲苍支持如下几个维度实时查看应用日志:

◆ 应用管理/应用部署/容器应用:

容器组(Pod)支持查看容器日志及在线运行命令,同时支持查看容器组事件信息,方便排查应用运行故障。容器日志支持切换容器、自定义输出行数、查看重启前容器日志以及下载容器日志、重新连接、全屏展示等能力,日志组件支持Start/Stop Following、Go Top等常用操作。

◆ 应用管理/应用部署/主机应用:

应用实例(Ansible)支持查看部署日志,方便排查主机应用部署问题;组件详情支持查看各个组件运行日志,方便排查应用运行故障。同时支持下载日志、重新连接、全屏展示等能力,日志组件支持Start/Stop Following、Go Top等常用操作。

场景二:集中日志检索与分析

常用于定位线上生产环境应用故障,集中日志关联检索与分析。

前置准备

资源管理/容器集群管理: 安装Loki等集群组件,用于统一集中日志管理,同时支持如下配置:

  • 日志保留周期及定期清理日志

  • 自定义容器日志采集路径映射

  • 启用外部MINIO持久化日志存储

检索与分析

鲲苍提供两个入口方便快速日志检索与分析:均支持日志上下文、实时日志、导出日志等常用功能,同时均支持日志与调用链数据相互跳转进行关联分析等高级功能。

  • 服务可观测性/服务日志/日志检索分析: 集中日志通用关联检索与分析入口,支持手工自定义标签检索或者提前设置别名检索。

  • 服务管理/服务中心/服务实例: 定位到目标环境及应用,进入服务实例详情页,切换到服务日志页签,系统将会自动填充必要参数,直接检索分析即可。

想了解更多效率工具实际应用场景?请关注后续一系列推文~

欢迎在评论区留言,与我们一起探讨效率工具在您业务中的应用潜力~


联系我们: