ES集群启动问题排障

93 阅读1分钟

配置问题(1)

在这里插入图片描述

解决办法:修改配置文件config/jvm.option的xms大小,尽量调小一些,跟运行内存相匹配,调整后可正常运行。 在这里插入图片描述

配置问题(2):

在这里插入图片描述

报错原因:文件无权限问题。做法是切换到root用户,给es的目录添加用户权限:

chown  -R elasticsearch:elasticsearch /data/elasticsearch-6.1.1/

添加后即可正常启动。

其他配置问题:

注意:es安装目录下/config/elasticsearch.yml文件中的配置要没有错误,包括地址,变量位置(如果需要的话就配置,不需要就注掉,会有影响),还有相关的一些参数,要仔细对比。

用户问题

在这里插入图片描述

报错原因:未能以其他用户运行es集群(我使用的是es用户,切记创建特殊登录用户后要赋权),后续切换到es用户后即可正常启动。

内存问题

在这里插入图片描述

报错原因:此报错除了配置问题,可能还有系统资源负载太重的原因,内存剩余过少。使用top配合lsof命令查看,并且停止一些不必要的服务或者进程,或者关闭相关服务(基本),例如postfix,firewalld,iptables等。

数据不一致问题

在这里插入图片描述 注意:如果是使用的克隆机来做es集群,需要进入安装目录下的/data/下,删除nodes文件,里面有同步过来的数据,需要删除,不然会一直弹出数据不一致的报错信息,删除此文件后可正常运行。

其他问题

在这里插入图片描述

这个报错是提示回滚失败(应该是es底层自带的回滚机制),不用理会,可以正常运行,只是注意不要以其他用户短时间内多次重启es服务就可以。