1、Elasticsearch
1、巡检工具
elasticsearch巡检时主要采用了两种方式:curl 和 grafana
2、流程
首先查询集群状态,查询集群状态是否存在异常,异常集群信息优先记录,
其次是对集群做信息统计,该部分记录集群信息的详细说明,包含集群名称、数据量、索引量、分片数、数据点及总节点数等信息,该部分目的是为了比较各个集群中数据量、索引数及分片数的大小分配,以便更好筛选出容量较大的单个分片,着重筛选出单个分片索引大小大于30G
最后将异常状态集群信息及非正常索引信息(包含索引长度过长、索引分片存储值大)记录下来。
3、步骤
登录服务器后,
- 查看集群中单个索引分片容量大小:
http://localhost:9200/_cat/shards?h=index,shard,prirep,store,node&s=store:desc
- 查看索引的详细信息 http://localhost:9200/_cat/indices
- 集群服务IO监控信息、CPU、内存及网络信息由grafana监控获取
infra-grafana.hwwt2.com/d/na_nxrE_m…
2、elasticsearch集群
[ES集群信息]lue