全文检索 + 日志分析一键搞定!Elasticsearch(CentOS 7)轻松部署 + 远程访问!cpolar 内网穿透实验室第760 个成功挑战

0 阅读15分钟

在这里插入图片描述

软件名称:Elasticsearch(简称 ES)

操作系统支持:本文以 CentOS 7 为例,ES 同时支持 Linux(各发行版)、Windows、macOS 等主流系统。

软件介绍:Elasticsearch 是一款开源的分布式搜索和分析引擎,像个 “超级搜索引擎 + 数据分析师” 的结合体 —— 既能秒级从海量数据里揪出你要的内容(比如搜 “iPhone 15” 能精准匹配相关商品),又能做日志统计、价格分析这类聚合操作;用 Java 编写,支持 RESTful API,不管是 Python、Java 还是 Go 都能轻松集成,是中小团队做搜索、日志分析的首选工具。

在这里插入图片描述

Elasticsearch 的出色功能

Elasticsearch 就像数据界的 “闪电侠”+“账房先生”,核心功能简直戳中中小团队的痛点:

  • 全文检索天花板:比普通数据库的模糊搜索强 10 倍!搜 “苹果手机” 能匹配 “iPhone 15”“苹果 14 Pro”,还支持模糊搜、短语匹配、结果高亮,做商品搜索、文档检索超顺手。
  • 近实时分析:数据写入 1 秒内就能搜到,不管是日志分析还是实时监控,不用等半天才能看结果,像点外卖一样 “下单就快送”。
  • 零门槛部署:单机版搭起来不用复杂集群配置,CentOS 7 上几步就能跑起来,新手也能半小时上手,不像其他大数据工具要配一堆依赖。

在这里插入图片描述

实用场景

场景 1:中小电商商品搜索
  • 痛点:小店铺想做精准商品搜索,买商用搜索服务太贵,自己用 MySQL 写模糊查询又慢又不准;本地搭了 ES 却只能自己测试,客户 / 测试同事访问不了。
  • 爽点:在 CentOS 7 上部署 ES,用它做商品索引和检索,配合 cpolar 把 ES 端口映射到公网,测试同事异地就能验证搜索效果,客户也能直接体验 “秒搜” 的快感,成本不到商用服务的 1/10。
场景 2:企业日志分析
  • 痛点:公司服务器日志堆成山,靠人工翻找报错像 “大海捞针”;本地搭 ES 做日志分析,运维人员只能在公司电脑查看,加班回家想排查问题根本没办法。
  • 爽点:把服务器日志导入本地 ES 做聚合分析,用 cpolar 生成公网地址,运维在家用手机 / 笔记本就能访问 ES,随时查看日志趋势、定位报错,不用半夜跑回公司。

在这里插入图片描述

cpolar 内网穿透技术带来的便利

本来 Elasticsearch 部署在 CentOS 7 本地,就像把 “超级搜索引擎” 关在了自家小院里,只有你自己能进门用;而 cpolar 就像给小院装了个 “万能门”,不管你在地球哪个角落,都能推门进去用这个工具,而且全程不用动路由器、不用配 DDNS、不用申请公网 IP,主打一个 “傻瓜式便利”:

  1. 零成本打破内网壁垒:不用租公网服务器,不用给运营商打电话要公网 IP,一条命令装完 cpolar,本地 ES 的 9201 端口立刻变成公网可访问的地址,同事 / 客户输入链接就能用,省了服务器租金还省了配置时间。
  2. 配置简单到 “闭眼操作”:不用懂网络原理,登录 cpolar 的 web 界面,填个本地端口(比如 ES 的 9201),选个地区,点一下 “创建隧道” 就搞定,比煮泡面还简单;就算是技术小白,跟着步骤走 3 分钟就能出公网地址。
  3. 固定地址不翻车:cpolar 能申请固定二级子域名,不用每次重启都换地址 —— 之前用随机域名,刚给客户发完链接就失效,现在固定地址一劳永逸,演示、联调再也不用反复发新地址。
  4. 跨设备访问无限制:不管是用手机、平板,还是 Windows/Mac 电脑,只要能上网,就能访问本地的 ES 服务;比如在外喝咖啡,客户突然要看 ES 的商品搜索效果,掏出手机打开链接就能演示,不用慌手慌脚跑回电脑前。
  5. 报错少还易排查:cpolar 自带状态监控,能看到端口映射是否正常,就算 ES 启动出问题(比如文件描述符限制太低),也能通过公网地址快速验证修复效果,不用在本地和远程来回切换排查。

在这里插入图片描述

总结

Elasticsearch 本身就是中小团队 “用得起、用得会” 的搜索分析神器,在 CentOS 7 上单机部署就能搞定商品搜索、日志分析这类核心需求;而 cpolar 就像给 ES 装了 “翅膀”,彻底打破内网的限制 —— 不用复杂配置、不用额外花钱,就能让本地的 ES 服务变成 “公网可用” 的工具。

对开发者来说,这套组合拳既解决了 “本地搭环境” 的入门难题,又搞定了 “远程访问” 的核心痛点:半小时部署 ES,3 分钟配置 cpolar,不管是自己开发联调,还是给客户演示,都能低成本、高效率完成,堪称中小团队 / 个人开发者的 “效率神器”。

前面介绍了这么多,感兴趣的朋友按照下面的教程去安装吧!

本文将以CentOS 7操作系统为基础,详细讲解如何从零开始完成Elasticsearch的单机部署全过程:包括系统环境准备、JDK安装、Elasticsearch下载与配置、权限与安全设置、服务启动优化,以及关键的 远程访问配置。同时,针对常见的启动报错(如不能以root用户运行、文件描述符限制等问题),提供清晰、可操作的解决方案。

无论你是运维工程师、开发人员,还是对大数据技术感兴趣的爱好者,通过本指南,你都能在一台CentOS 7服务器上成功搭建并远程访问属于自己的Elasticsearch实例,为后续的索引、查询与集群扩展打下坚实基础。

fMYkgkivT

1.什么是Elasticsearch?

Elasticsearch能让你在海量数据中“秒级”查到想要的内容,并支持复杂的聚合分析。

核心特性

1.全文搜索(Full-Text Search)

  • 支持对文本内容进行高效、相关性排序的搜索(比如搜“苹果手机”,能匹配“iPhone 15”)。
  • 内置分词器(如中文需配合IK分词插件)。
  • 支持模糊搜索、短语匹配、高亮显示等。

2.近实时(Near Real-Time)

数据写入后,默认1秒内即可被搜索到(不是传统数据库的“立即可见”,但对大多数场景足够快)。

3.分布式 & 高可用

  • 数据自动分片(shard)并分布在多个节点上。
  • 支持水平扩展:加机器就能提升性能和容量。
  • 副本机制(replica)保证高可用,即使某个节点宕机,数据仍可访问。

4.RESTful API

  • 所有操作通过HTTP接口完成,使用JSON作为数据格式。
  • 易于与任何编程语言集成(Python、Java、Go等)。

5.强大的聚合分析(Aggregations)

  • 不只是“查找”,还能“统计”:

  • 类似SQL中的GROUP BY + COUNT/SUM/AVG,但更灵活强大。

6.Schema-free(动态映射)

  • 无需预先定义表结构(但建议显式定义mapping以优化性能和准确性)。
  • 插入JSON文档时,Elasticsearch自动推断字段类型(如 price: 7999 → long)。
场景说明
电商网站搜索用户输入关键词,快速返回相关商品
日志分析(ELK Stack)收集服务器/应用日志,用Kibana可视化(Logstash → Elasticsearch → Kibana)
APM(应用性能监控)如Elastic APM,追踪请求延迟、错误率
推荐系统基于用户行为做相似内容推荐
安全分析(SIEM)检测异常登录、网络攻击等

2.前提条件

  • 操作系统:CentOS 7
  • Java环境(Elasticsearch 8.x要求Java环境)
  • root或sudo权限

注意:Elasticsearch 8.x默认启用安全功能(TLS/HTTPS、内置用户等)。若仅用于本地测试,可选择关闭安全特性(不推荐生产环境)。

Elasticsearch是用Java编写的,因此需要[Java 环境](so.csdn.net/so/search?q… 环境&spm=1001.2101.3001.7020)。首先安装JDK(版本8或更高版本)。 查看当前安装的java版本:

java -version

image-20260226150539083

3.安装Elasticsearch

3.1 下载Elasticsearch

在Elasticsearch 官网下载最新版本的Elasticsearch。

选择适合你系统的版本(Linux、Windows等),下载并解压到合适的目录:

image-20260226152752241

点进去后会有下载命令,复制即可,我这里下载到/app目录下:

wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.17.29-linux-x86_64.tar.gz
wget https://artifacts.elastic.co/downloads/elasticsearch/elasticsearch-7.17.29-linux-x86_64.tar.gz.sha512
sha512sum -c elasticsearch-7.17.29-linux-x86_64.tar.gz.sha512
tar -xzf elasticsearch-7.17.29-linux-x86_64.tar.gz
mv elasticsearch-7.17.29 elasticsearch
cd elasticsearch

image-20260226153420300

配置文件路径:config/elasticsearch.yml:

vim config/elasticsearch.yml
# 节点名称(可选)
node.name: node-1

# 绑定所有 IP(允许远程访问,测试用;生产请限制 IP)
network.host: 0.0.0.0

# 修改 HTTP 端口(9200端口冲突)
http.port: 9201

 # 集群的名字,默认为 elasticsearch。可以根据需要修改。
cluster.name: my-app

# 在首次启动时指定初始主节点,用于集群发现。
cluster.initial_master_nodes: ["node-1"] 

image-20260226154559641

3.2 启动Elasticsearch

启动Elasticsearch服务:

./bin/elasticsearch

image-20260226160546391

错误提示说明Elasticsearch无法以root用户启动。出于安全考虑,Elasticsearch明确禁止使用root账户运行。请创建一个普通(非root)用户,并使用该用户来启动和管理Elasticsearch服务。

创建一个新的用户:

sudo useradd elasticsearch
sudo passwd elasticsearch 

将Elasticsearch相关目录的所有权递归地分配给elasticsearch用户和elasticsearch用户组,以确保该用户有权限读写这些文件和目录:

sudo chown -R elasticsearch:elasticsearch /app/elasticsearch/
sudo chown -R elasticsearch:elasticsearch /app/elasticsearch/data
sudo chown -R elasticsearch:elasticsearch /app/elasticsearch/logs

image-20260226163238744

以新用户身份启动Elasticsearch: 切换到新创建的elasticsearch用户:

su - elasticsearch
./app/elasticsearch/bin/elasticsearch

image-20260226163837966

如果启动Elasticsearch服务成功,可以加上-d参数来后台启动:

./bin/elasticsearch -d

验证是否安装成功:

curl http://localhost:9201

image-20260227140414179

在浏览器中输入:http://192.168.42.140/:9201 即可看到elasticsearch的响应结果:

image-20260227143306207

3.3 启动过程中遇到的问题

问题 1:文件描述符限制太低

image-20260227142651013

  • 当前值:4096
  • 要求至少:65535
  • 影响:Elasticsearch需要同时打开大量文件(索引、日志、网络连接等),限制过低会导致性能下降或崩溃。

解决方法:永久提升vm.max_map_count。

# 查看当前值
cat /proc/sys/vm/max_map_count

# 临时生效(重启失效)
sudo sysctl -w vm.max_map_count=262144

# 永久生效
echo "vm.max_map_count=262144" | sudo tee -a /etc/sysctl.conf
sudo sysctl -p

image-20260227142715722

问题 2:Bootstrap Check失败

image-20260227142846079

Linux系统对每个用户进程能打开的文件数量有限制。Elasticsearch是高并发、多文件系统应用(索引、日志、网络连接等),默认的4096远远不够。

解决方法:确认并修改对应配置。

1.确认limits配置已写入:

sudo vi /etc/security/limits.conf

确保包含以下内容(elasticsearch是你的运行用户):

elasticsearch soft nofile 65535
elasticsearch hard nofile 65535

2.确保PAM支持limits:

检查/etc/pam.d/su是否包含(取消注释):

session    required   pam_limits.so

3.完全退出并重新登录elasticsearch用户:

exit  # 退出当前 elasticsearch 会话
# 重新 ssh 登录或 su - elasticsearch
su - elasticsearch

4.验证当前限制

ulimit -n
#正确输出应为:65535

image-20260227143242045

4.Elasticsearch常规操作

确保Elasticsearch已正常运行,可通过curl http://localhost:9201 测试,返回类似以下JSON信息表示服务已就绪:

{
  "name" : "node-1",
  "cluster_name" : "my-app",
  "version" : { ... },
  "tagline" : "You Know, for Search"
}

4.1 查看集群健康状态:

curl -X GET "http://localhost:9201/_cluster/health?pretty"

返回status: green表示一切正常。image-20260227145313113

4.2 创建索引(Index)

curl -X PUT "http://localhost:9201/products?pretty"

索引名必须小写。

image-20260227145414449

4.3 写入文档(自动创建ID)

curl -X POST "http://localhost:9201/products/_doc" \
-H "Content-Type: application/json" \
-d '{
  "name": "iPhone 15",
  "price": 7999,
  "category": "phone"
}'

image-20260227145538638

4.4 写入文档(指定ID)

curl -X PUT "http://localhost:9201/products/_doc/1001" \
-H "Content-Type: application/json" \
-d '{
  "name": "MacBook Pro",
  "price": 15999,
  "category": "laptop"
}'

image-20260227145621909

4.5 查询文档

根据ID查询:

curl -X GET "http://localhost:9201/products/_doc/1001?pretty"

全文搜索(简单查询):

curl -X GET "http://localhost:9201/products/_search?q=name:iphone&pretty"

使用Query DSL(推荐):

curl -X POST "http://localhost:9201/products/_search" \
-H "Content-Type: application/json" \
-d '{
  "query": {
    "match": {
      "name": "iPhone"
    }
  }
}'

image-20260227145854110

也可以使用浏览器搜索:192.168.42.140:9201/products/_search

image-20260227144014099

4.6 更新文档

curl -X POST "http://localhost:9201/products/_doc/1001/_update" \
-H "Content-Type: application/json" \
-d '{
  "doc": {
    "price": 14999
  }
}'

更新后

image-20260227144132587

4.7 删除文档或索引

删除文档:

curl -X DELETE "http://localhost:9201/products/_doc/1001"

删除整个索引:

curl -X DELETE "http://localhost:9201/products"

image-20260227150134281

在去网页搜索发现报错是空的,代表删除成功:192.168.42.140:9201/products/_search

image-20260227150227330

那么问题来了,假设你在本地开发了一套基于Elasticsearch的搜索系统(比如商品搜索、日志分析等),运行在你自己的电脑上(localhost:9201)。

现在你想:

  • 让同事访问你的Elasticsearch接口进行联调?
  • 把本地数据展示给远程客户看?
  • 在公网测试一个依赖ES的Web应用?

但你的电脑在内网,没有公网IP,也没有服务器。这时候,传统方式需要配置路由器、DDNS、端口映射……非常麻烦,甚至不可行。

解决方案:用cpolar内网穿透!

5.安装cpolar实现随时随地开发

5.1 什么是cpolar?

cpolar是一款安全高效的内网穿透工具,无需公网IP或复杂配置,只需一条命令,即可将本地服务器、Web服务或任意端口映射到公网,让你随时随地远程访问内网应用,特别适合开发调试、远程运维和应急部署等场景。

5.2 部署cpolar

cpolar 可以将你本地电脑中的服务(如 SSH、Web、数据库)映射到公网。即使你在家里或外出时,也可以通过公网地址连接回本地运行的开发环境。

❤️以下是安装cpolar步骤:

使用一键脚本安装命令:

sudo curl https://get.cpolar.sh | sh

image-20250725104019896

安装完成后,执行下方命令查看cpolar服务状态:(如图所示即为正常启动)

sudo systemctl status cpolar

22e5adfaf290a17fc3384bb296055259

Cpolar安装和成功启动服务后,在浏览器上输入虚拟机主机IP加9200端口即:【http://ip:9200】访问Cpolar管理界面,使用Cpolar官网注册的账号登录,登录后即可看到cpolar web 配置界面,接下来在web 界面配置即可:

打开浏览器访问本地9200端口,使用cpolar账户密码登录即可,登录后即可对隧道进行管理。

8a6698b1bf26d64ba3645827fbfb1c29

6.配置公网地址

登录cpolar web UI管理界面后,点击左侧仪表盘的隧道管理——创建隧道:

  • 隧道名称:可自定义,本例使用了:ela,注意不要与已有的隧道名称重复
  • 协议:http
  • 本地地址:9201
  • 域名类型:随机域名
  • 地区:选择China Top

image-20260227161015537

创建成功后,打开左侧在线隧道列表,可以看到刚刚通过创建隧道生成了公网地址,接下来就可以在其他电脑或者移动端设备(异地)上,使用地址访问。

image-20260227161103974

访问成功。

image-20260227161247843

接下来可以尝试一下,在同事电脑创建索引~

curl -X PUT "http://24479b89.r2.cpolar.top/products?pretty"

image-20260227161839359

网页更新成功。

image-20260227161817252

7.保留固定公网地址

使用cpolar为其配置二级子域名(cpolar官网-安全的内网穿透工具 | 无需公网ip | 远程访问 | 搭建网站),该地址为固定地址,不会随机变化。

image-20250918151358733

点击左侧的预留,选择保留二级子域名,地区选择china Top,然后设置一个二级子域名名称,我使用的是elasticsearch,大家可以自定义。填写备注信息,点击保留。

image-20260227162119323

登录cpolar web UI管理界面,点击左侧仪表盘的隧道管理——隧道列表,找到所要配置的隧道,点击右侧的编辑

image-20260227162223775

修改隧道信息,将保留成功的二级子域名配置到隧道中

  • 域名类型:选择二级子域名
  • Sub Domain:填写保留成功的二级子域名
  • 地区: China Top

点击更新

image-20260227162317066

更新完成后,打开在线隧道列表,此时可以看到随机的公网地址已经发生变化,地址名称也变成了保留和固定的二级子域名名称。

image-20260227162356854

最后,我们使用固定的公网地址在任意设备的浏览器中访问,可以看到成功访问的页面,这样一个永久不会变化的二级子域名公网网址即设置好了。

image-20260227162426173

总结

本文系统讲解了在CentOS 7环境下从零开始单机部署Elasticsearch的全过程,涵盖系统依赖安装、Elasticsearch的RPM安装、关键配置项(如 的调整、服务启动与本地验证等基础操作。在此基础上,文章进一步引入内网穿透工具 cpolar,通过一条命令将本地9201端口映射至公网,实现远程调试与访问,极大提升了开发与演示效率,并强调了开放服务的安全风险与防护建议,为开发者提供了一套快速搭建和调试 Elasticsearch 环境的实用方案。