ELFK+ kafka 日志架构

161 阅读10分钟

实验架构

  • 两台electricsearch 服务器

    • 192.168.10.1

    • 192.168.10.10

  • 准备 3 台服务器做 Zookeeper 集群

    • 192.168.10.30

    • 192.168.10.40

    • 192.168.10.60

  • logsatsh 服务器 kibana filebeat

    • 192.168.10.20

image.png

部署ELK

java环境

java -version                                       #如果没有安装,yum -y install java
openjdk version "1.8.0_131"
OpenJDK Runtime Environment (build 1.8.0_131-b12)
OpenJDK 64-Bit Server VM (build 25.131-b12, mixed mode)

关闭防火墙

systemctl disable  --now   firewalld
setenforce 0
sed -i.bak 's/SELINUX=enforcing/SELINUX=disabled/'  /etc/selinux/config 
​

安装 Elasticsearch 软件

[root@localhost data]#ls
elasticsearch-6.7.2.rpm  elasticsearch-head-master.zip  node-v8.2.1.tar.gz  phantomjs-2.1.1-linux-x86_64.tar.bz2
​
[root@localhost data]#rpm -ivh elasticsearch-6.7.2.rpm
[root@localhost data]#cd /etc/elasticsearch/
[root@localhost elasticsearch]#mkdir bak 
[root@localhost elasticsearch]#cp -a *.yml  bak/
#备份

修改配置文件

[root@node1 elasticsearch]#vim elasticsearch.yml
17 cluster.name: my-elk-cluster
#修改集群名字



23 node.name: node1
24 node.master: true
25 node.data: true
#设置 节点名称 主从之间不能一致    24作为主节点   25作为数据节点



45 bootstrap.memory_lock: true
#内存锁开启  禁止使用  swap




59 network.host: 0.0.0.0
#监听地址
60 http.port: 9200
#  默认使用端口
61 transport.tcp.port: 9300
#内部传输端口



73 discovery.zen.ping.unicast.hosts: ["192.168.10.1:9300", "192.168.10.10:9300"]
#自动集群发现,加入主机名  使用单播 类似心跳线



[root@localhost elasticsearch]#grep -v "^#"  elasticsearch.yml 
cluster.name: my-elk-cluster
node.name: node1
node.master: true
node.data: true
path.data: /var/lib/elasticsearch
path.logs: /var/log/elasticsearch
bootstrap.memory_lock: true
network.host: 0.0.0.0 
http.port: 9200
transport.tcp.port: 9300
discovery.zen.ping.unicast.hosts: ["192.168.10.1:9300", "192.168.10.10:9300"]

修改系统配置

性能调优参数

[root@localhost elasticsearch]#vim /etc/security/limits.conf
......
*  soft    nofile          65536
*  hard    nofile          65536
*  soft    nproc           32000
*  hard    nproc           32000
*  soft    memlock         unlimited
*  hard    memlock         unlimited

修改systemd 服务管理器

/etc/systemd/system.conf 文件是用于配置 systemd 的,这是一种用于 Linux 操作系统的系统和服务管理器。通过这个文件,你可以自定义与系统操作、性能和行为相关的各种设置

  • DefaultTimeoutStartSec=:设置启动服务的默认等待时间
  • DefaultTimeoutStopSec=:设置停止服务的默认等待时间
  • DefaultRestartSec=:设置在重新启动服务之前的默认休眠时间
  • DefaultLimitNOFILE=:设置打开文件数量的默认限制
  • DefaultLimitNPROC=:设置进程数量的默认限制
  • DefaultLimitCORE=:设置核心文件大小的默认限制
  • DefaultEnvironment=:指定服务的默认环境变量

实际修改

[root@localhost elasticsearch]#vim /etc/systemd/system.conf
DefaultLimitNOFILE=65536
DefaultLimitNPROC=32000
DefaultLimitMEMLOCK=infinity

修改内核参数

Lucene 是一个高性能、全功能的文本搜索引擎库,用于实现高效的文本索引和搜索。它是用 Java 编写的,可以嵌入到各种应用程序中,以提供强大的全文搜索功能。Lucene 是许多流行搜索平台的核心,如 Apache Solr 和 Elasticsearch。

以下是 Lucene 的一些关键特性和功能:

  1. 文本索引:Lucene 提供了强大的文本索引功能,能够处理大规模文本数据并生成高效的索引。
  2. 全文搜索:支持复杂的查询语法,包括布尔查询、短语查询、通配符查询、模糊查询等。
  3. 可扩展性:Lucene 设计为模块化和可扩展的,允许用户根据需要扩展和定制其功能。
  4. 分词和分析:提供了丰富的分词器和分析器,用于将文本分解为可索引和可搜索的词语。
  5. 排序和评分:支持对搜索结果进行排序和评分,以提高搜索的准确性和相关性。
  6. 多语言支持:支持多种语言的文本处理和搜索。

优化elasticsearch用户拥有的内存权限 由于ES构建基于lucene, 而lucene设计强大之处在于lucene能够很好的利用操作系统内存来缓存索引数据,以提供快速的查询性能。lucene的索引文件segements是存储在单文件中的,并且不可变,对于OS来说,能够很友好地将索引文件保持在cache中,以便快速访问;因此,我们很有必要将一半的物理内存留给lucene ; 另一半的物理内存留给ES(JVM heap )。所以, 在ES内存设置方面,可以遵循以下原则:

  • 当机器内存小于64G时,遵循通用的原则,50%给ES,50%留给操作系统,供lucene使用
  • 当机器内存大于64G时,遵循原则:建议分配给ES分配 4~32G 的内存即可,其它内存留给操作系统,供lucene使用
[root@localhost elasticsearch]#vim /etc/sysctl.conf
#一个进程可以拥有的最大内存映射区域数,参考数据(分配 2g/262144,4g/4194304,8g/8388608)
vm.max_map_count=262144
​
sysctl -p
sysctl -a | grep vm.max_map_count

重启服务器 启动 elasticsearch

reboot
systemctl start elasticsearch.service
systemctl enable elasticsearch.service
netstat -antp | grep 9200

查看节点信息

浏览器访问  
http://192.168.10.1:9200  
http://192.168.10.10:9200 
查看节点 Node1、Node2 的信息。
​
浏览器访问 
http://192.168.10.1:9200/_cluster/health?pretty  
http://192.168.10.10:9200/_cluster/health?pretty
查看群集的健康情况,可以看到 status 值为 green(绿色), 表示节点健康运行。
​
​
浏览器访问 http://192.168.10.1:9200/_cluster/state?pretty  检查群集状态信息

安装插件

编译安装 Elasticsearch-head 插件 主从都可以安装

Elasticsearch 在 5.0 版本后,Elasticsearch-head 插件需要作为独立服务进行安装,需要使用npm工具(NodeJS的包管理工具)安装。 安装 Elasticsearch-head 需要提前安装好依赖软件 **node **和 phantomjs。 node:是一个基于 Chrome V8 引擎的 JavaScript 运行环境。 phantomjs:是一个基于 webkit 的JavaScriptAPI,可以理解为一个隐形的浏览器,任何基于 webkit 浏览器做的事情,它都可以做到。

编译安装node组件
#上传软件包 node-v8.2.1.tar.gz 到/opt
yum install gcc gcc-c++ make -y

cd /opt
tar zxvf node-v8.2.1.tar.gz

cd node-v8.2.1/
./configure
make && make install
安装 Elasticsearch-head 数据可视化工具
#上传软件包 elasticsearch-head-master.zip 到/opt
cd /opt
unzip elasticsearch-head-master.zip
cd /opt/elasticsearch-head/
npm install		 //安装依赖包
npm install --registry=https://registry.npmmirror.com   //指定源
修改 Elasticsearch 主配置文件
vim /etc/elasticsearch/elasticsearch.yml
......
--末尾添加以下内容--
http.cors.enabled: true				#开启跨域访问支持,默认为 false
http.cors.allow-origin: "*"			#指定跨域访问允许的域名地址为所有


http.cors.enabled: true
http.cors.allow-origin: "*"	

systemctl restart elasticsearch
#重启elasticsearch  服务
启动 elasticsearch-head 服务

必须在解压后的 elasticsearch-head 目录下启动服务,进程会读取该目录下的 gruntfile.js 文件,否则可能启动失败。

[root@localhost elasticsearch]#cd /opt/elasticsearch-head/
[root@localhost elasticsearch-head]# npm run start &
> elasticsearch-head@0.0.0 start /usr/local/src/elasticsearch-head
> grunt server

Running "connect:server" (connect) task
Waiting forever...
Started connect web server on http://localhost:9100

#elasticsearch-head 监听的端口是 9100
netstat -natp |grep 9100
测试插件
192.168.10.1:9100
192.168.10.10:9100

image.png

在192.168.10.20服务器部署 Logstash

安装服务

yum -y install java
java -version
yum -y install httpd
systemctl start httpd

安装logstash

cd /opt
[root@localhost opt]#  rpm -ivh logstash-6.7.2.rpm                          #开启服务
systemctl enable --now logstash.service
​
[root@localhost opt]# ln -s  /usr/share/logstash/bin/logstash   /usr/bin/
# 做软连接

使用logstash 收集日志

  • -f:通过这个选项可以指定 Logstash 的配置文件,根据配置文件配置 Logstash 的输入和输出流。
  • -e:从命令行中获取,输入、输出后面跟着字符串,该字符串可以被当作 Logstash 的配置(如果是空,则默认使用 stdin 作为输入,std然后退出。 out 作为输出)。
  • -t:测试配置文件是否正确,

安装kibana

root@localhost opt]# rpm -ivh kibana-6.7.2-x86_64.rpm 

修改配置

[root@localhost opt]# cd  /etc/kibana/
[root@localhost kibana]# cp kibana.yml  kibana.yml.bak -a
​
[root@localhost kibana]# vim kibana.yml2    server.port: 5601                  #打开端口
7    server.host: "0.0.0.0"         #监听端口
28   elasticsearch.hosts: ["http://192.168.10.1:9200", "http://192.168.10.10:9200"]  #el服务器地址
37   kibana.index: ".kibana"         #打开索引
96   logging.dest: /var/log/k.log      #指定日志文件, 需要手动建立文件
114  i18n.locale: "zh-CN"              #中文设置
​
[root@localhost kibana]# chown kibana:kibana /var/log/k.log

启动 kibana

[root@localhost kibana]# systemctl enable --now kibana.service
[root@localhost kibana]# ss -nap |grep 5601
tcp    LISTEN     0      128       *:5601                  *:*                   users:(("node",pid=42235,fd=19))
​

安装 Filebeat

#上传软件包 filebeat-6.7.2-linux-x86_64.tar.gz 到/opt目录
tar zxvf filebeat-6.7.2-linux-x86_64.tar.gz
mv filebeat-6.7.2-linux-x86_64/ /usr/local/filebeat

配置kafka zoopaper

下载安装包

#下载安装包
官方下载地址:https://archive.apache.org/dist/zookeeper/

cd /opt
wget https://archive.apache.org/dist/zookeeper/zookeeper-3.5.7/apache-zookeeper-3.5.7-bin.tar.gz

安装zookeeper

cd /opt
tar -zxvf apache-zookeeper-3.5.7-bin.tar.gz
mv apache-zookeeper-3.5.7-bin /usr/local/zookeeper

修改配置文件

#备份配置文件
cd /usr/local/zookeeper/conf/
cp zoo_sample.cfg zoo.cfg

#修改配置文件
vim zoo.cfg
tickTime=2000   #通信心跳时间,Zookeeper服务器与客户端心跳时间,单位毫秒
initLimit=10    #Leader和Follower初始连接时能容忍的最多心跳数(tickTime的数量),这里表示为10*2s
syncLimit=5     #Leader和Follower之间同步通信的超时时间,这里表示如果超过5*2s,Leader认为Follwer死掉,并从服务器列表中删除Follwer
dataDir=/usr/local/zookeeper-3.5.7/data      ●修改,指定保存Zookeeper中的数据的目录,目录需要单独创建
dataLogDir=/usr/local/zookeeper-3.5.7/logs   ●添加,指定存放日志的目录,目录需要单独创建
clientPort=2181   #客户端连:接端口
#添加集群信息
server.1=192.168.10.30:3188:3288
server.2=192.168.10.40:3188:3288
server.3=192.168.10.60:3188:3288

将写好的配置文件 scp 到另外两台服务器

scp -r /usr/local/zookeeper   192.168.10.60:/usr/local/
scp -r /usr/local/zookeeper   192.168.10.40:/usr/local/

根据配置文件 添加日志目录 数据目录(所有节点)

mkdir /usr/local/zookeeper/data
mkdir /usr/local/zookeeper/logs

在每个节点生成 serverid

选举时使用

echo 1 > /usr/local/zookeeper/data/myid  #30
echo 2 > /usr/local/zookeeper/data/myid  #40
echo 3 > /usr/local/zookeeper/data/myid  #60

启动zookeeper

/usr/local/zookeeper/bin/zkServer.sh   start 

/usr/local/zookeeper/bin/zkServer.sh   status
#查看状态

kafka

安装kafka

[root@localhost opt]#tar xf kafka_2.13-2.7.1.tgz   -C /usr/local/
[root@localhost opt]#cd  /usr/local/
[root@localhost opt]#ln -s kafka_2.13-2.7.1/  kafka

修改配置文件

[root@localhost config]#vim server.properties broker.id=0
#21行,broker的全局唯一编号,每个broker不能重复,因此要在其他机器上配置 broker.id=1、broker.id=2
​
​
listeners=PLAINTEXT://192.168.10.30:9092
#31行,指定监听的IP和端口,如果修改每个broker的IP需区分开来,也可保持默认配置不用修改
​
​
num.network.threads=3    #42行,broker 处理网络请求的线程数量,一般情况下不需要去修改   不用修改
num.io.threads=8         #45行,用来处理磁盘IO的线程数量,数值应该大于硬盘数           不用修改
socket.send.buffer.bytes=102400       #48行,发送套接字的缓冲区大小
socket.receive.buffer.bytes=102400    #51行,接收套接字的缓冲区大小
socket.request.max.bytes=104857600    #54行,请求套接字的缓冲区大小
​
​
​
log.dirs=/usr/local/kafka/logs        
#60行,kafka运行日志存放的路径,也是数据存放的路径
​
​
​
zookeeper.connect=192.168.91.103:2181,192.168.91.105:2181,192.168.91.106:2181
# 设置连接zookeeper

复制配置文件 及 kafka 文件夹到其他节点

[root@localhost local]#scp -r kafka  192.168.10.40:/usr/local/ 
[root@localhost local]#scp -r kafka  192.168.10.60:/usr/local/ 
​
​
[root@localhost local]# ln -s /usr/local/kafka_2.13-2.7.1/  /usr/local/kafka
​
配置文件修改
broker.id=2
broker.id=3
#21行,broker的全局唯一编号,每个broker不能重复,因此要在其他机器上配置 broker.id=1、broker.id=2listeners=PLAINTEXT://192.168.10.40:9092
listeners=PLAINTEXT://192.168.10.60:9092
#修改监听地址

启动kafka

[root@localhost local]#cd  /usr/local/kafka/bin/
​
​
[root@localhost bin]#./kafka-server-start.sh  -daemon /usr/local/kafka/config/server.properties 
# 指定配置文件后台启动
​
​
[root@localhost bin]# ss -natp |grep 9092

验证kafka 创建topic

./kafka-topics.sh --create --zookeeper 192.168.10.30:2181,192.168.10.40:2181,192.168.10.60:2181 --replication-factor 2 --partitions 3 --topic test1
Created topic test1.

--zookeeper:定义 zookeeper 集群服务器地址,如果有多个 IP 地址使用逗号分割,一般使用一个 IP 即可
--replication-factor:定义分区副本数,1 代表单副本,建议为 2 
--partitions:定义分区数 
--topic:定义 topic 名称

发布消息

image.png

消费消息

image.png

kafka对接elfk

filebeat配置

修改配置文件

vim filebeat.yml

filebeat.inputs:
- type: log  #指定 log 类型,从日志文件中读取消息
  enabled: true
  paths:
    - /var/log/messages   #指定监控的日志文件
  tags: ["system"] #设置索引标签   这两行注意对齐否则启动不了
filebeat.config.modules:
  path: ${path.config}/modules.d/*.yml
  reload.enabled: false
setup.template.settings:
  index.number_of_shards: 3
setup.kibana:

output.kafka:
  enabled: true    ## 传给 kafka
  hosts: ["192.168.10.30:9092","192.168.10.40:9092","192.168.10.60:9092"]
  topic: "kunkun"

processors:
  - add_host_metadata: ~
  - add_cloud_metadata: ~

image.png

启动 filebeat


nohup ./filebeat -e -c filebeat.yml > filebeat.out &
#-e:输出到标准输出,禁用syslog/文件输出
#-c:指定配置文件
#nohup:在系统后台不挂断地运行命令,退出终端不会影响程序的运行

logstash 配置

input {
   kafka {
   bootstrap_servers => "192.168.10.30:9092,192.168.10.40:9092,192.168.10.60:9092" 
   #Kafka服务器的地址
   #消费的主题为"kunkun"
   topics => "kunkun" 
   type => "kafka"
   #从开头开始
   auto_offset_reset => "latest"
   #添加一些Logstash特定的字段到事件中,如`@version`和`@timestamp`
   decorate_events => true
  }
}




output {
#输出到elasticsearch
  elasticsearch {
     hosts => ["192.168.10.1:9200", "192.168.10.10:9200"]
     index => "system-kunkun-%{+YYYY.MM.dd}"
 }
 #在控制台输出
stdout {
  codec => rubydebug
 }
}

搭建完成 image.png