match => {
"message" => "%{NGINXACCESS}"
}
}
date {
match => ["time\_local", "dd/MMM/YYYY:HH:mm:ss Z"]
}
}
output {
elasticsearch {
hosts => ["10.16.59.99:9200"]
index => "logstash-nginx-%{+YYYY.MM.dd}"
workers => 1
flush_size => 1
idle_flush_time => 1
template_overwrite => true
}
stdout{codec => rubydebug}
}
配置文件分为三个部分:input,filter,output。三部分文件写,也可写一块
* input
定义输入,file为输入的文件,可以有多个。出file外,还有stdin、TCP、syslog、collectd等。
* filter
过滤配置,可以将日志整理成自己想要的格式。logstash有丰富的过滤插件,date处理、grop正则捕获、GeoIP、JSON编码、key-value切分等等。
grok是logstash最重要的插件,在grok中定义好正在表达式,可以在其他地方引用它。语法这里不过多介绍,需要可以自己从网上学习。
这里我们要抓取Nginx日志,需要根据Nginx的日志格式写一个过滤的正则表达式,将其保存在”.logstash/patterns/nginx”文件中,内容如下:
NGINXACCESS %{IP:remote_addr} - - [%{HTTPDATE:time_local}] "%{WORD:http_method} %{URIPATHPARAM:request} HTTP/%{NUMBER:httpversion}" %{NUMBER:status:int} %{NUMBER:body_bytes_sent:int} (?:"(?:%{URI:http_referer}|-)"|%{QS:http_referer}) "%{GREEDYDATA:agent}" %{HOSTNAME:http_host} %{NUMBER:request_length:int} %{NUMBER:request_time:float} %{NUMBER:upstream_response_time:float}
---
**注意:** 此处的正则表达式要和nginx的日志格式相对应,否则会匹配失败,无法将nginx日志离散取值。
nginx 日志格式例子:
log_format combinedio 'remote_user [time\_local] ' '"request" body_bytes_sent ' '"http_user_agent" request_length upstream_response_time';
---
* output
logstash的输出也有多种,标准输出,输出到elasticsearch,redis等等, 可以同时指定多个输出,stdout方便调试,查看实时的日志。
输出到es说明:hosts 为es的ip和端口;index为索引名称,按日期分方便管理;
运行logstsh:`./bin/logstash -f conf/logstash-nginx.conf`
选项”-f”是logstahsh的配置文件,如果有多个配置文件,也可以是一个目录。
%{NUMBER:status:int} 将status字段设为整型,
%{NUMBER:request\_time:float} 将Request\_time设为float类型,[**重要**],方便kibana计算可视化
---
##### logstash 2.2.2 分角色部署
将logstash按功能分成三个角色:shipper、broker和indexer。每个角色使用不同的logstash配置。
* shipper角色(日志收集)
input部分配置要收集的日志文件或原始日志来源
filter部分可以用grok过滤日志
output部分将格式化的日志输出到broker角色中(此处以redis为例,作为缓冲消息队列)

* broker角色(消息队列)
需要为此角色启动一个redis服务,可以去[redis官网]( )进行下载,然后编译安装,这里不再做详细介绍。
启动服务时,先修改或新建一个redis配置文件(如,redis.conf), 安全起见,配置下端口和密码,其他的可使用默认配置。
>
> ./redis-server /path/to/redis.conf
>
>
>
* indexer角色
功能:从redis中取出日志,然后存储到elasticsearch集群中。

**提示:为提高数据的写入效率,可以根据机器硬件因素适当提高threads和works的数量,也可以多设置几个indexer角色,同时运行。**
#### 2.3 elasticsearch部署
##### 2.3.1 下载
首先下载es文件,和logstash类似,这里直接下载zip文件
wget download.elastic.co/elasticsear…
unzip elasticsearch-2.4.1.zip
##### 2.3.2 配置es
主要是配置elasticsearch.yml文件,主要有network,node,path,memory等几个方面,单机模式下主要配置network,其他采用默认即可。
# ---------------------------------- Network -----------------------------------
# Set the bind address to a specific IP (IPv4 or IPv6):
network.host: 10.16.59.99
# Set a custom port for HTTP:
http.port: 9200
##### 2.3.3 运行elasticsearch
>
> ./bin/./bin/elasticsearch
>
>
>
##### 2.3.4 elasticsearch 集群部署
在日志量比较大时候,单机模式满足我们的需求,这时候可以选择将elasticsearch集群化部署。
通过配置elasticsearch.yml文件,配置各个节点。es2.4的版本是可以自动发现节点的,可以将节点的ip(多个或其中一个)放在discovery.zen.ping.unicast.hosts中即可。 下面是一个节点配置的例子:
# ======================== Elasticsearch Configuration =========================
# Use a descriptive name for your cluster:
cluster.name: es_log_monitor
# ------------------------------------ Node ------------------------------------
# Use a descriptive name for the node:
node.name: node-es1
bootstrap.memory_lock: true
network.host: 10.16.59.99
http.port: 9200
discovery.zen.ping.unicast.hosts: ["10.16.59.112"]
#node.master: true #node.data: false
---
“node.master”和”node.data”可以选择性配置
* master为true,data为false:节点不存储数据,作为协调者
* master为false,data为true:节点作为数据存储节点,不会被选为master节点
* master为false,data为false:均衡负载
* 默认都为true
使用以下命令查看节点的状态:
>
> curl 10.16.59.99:9200/\_cat/nodes?v
>
>
>

##### 2.3.5 使用head插件管理和查看集群状态
安装head插件,进入elasticsearch目录下,运行如下命令:
>
> ./bin/plugin install mobz/elasticsearch-head
>
>
>
安装之后可以便可通过流量器进行访问了,注意是否需要设置防火墙,也可以配置nginx 反向代理通过80端口访问。

---
#### 2.4 kibana部署
##### 2.4.1 下载解压kibana文件
>
> wget <https://download.elastic.co/kibana/kibana/kibana-4.6.1-linux-x86_64.tar.gz>
>
>
> tar -zxvf kibana-4.6.1-linux-x86\_64.tar.gz -C ./
>
>
>
##### 2.4.2 配置kibana.yml文件
打开kibana.yml文件,主要修改以下三个点(找到对应的地方修改):
server.port: 5601 #kibana 服务端口 server.host: "127.0.0.1" #服务绑定的地址 elasticsearch.url: "http://10.16.59.99:9200" #es服务地址
##### 2.4.3 运行kibana
>
> ./bin/kibana
>
>
>
运行以后可通过浏览器用地址加端口打开kibana的可视化页面。(网络开放情况下)
##### 2.4.4 为kibana服务配置反向代理(非必须)
有些情况下,很多服务器只开发80,443等少量常用端口,这时候如果还想通过80端口访问,需要配置反向代理,这里以nginx为例。
在nginx的配置目录中(include),添加”kibana\_proxy.conf”文件,内容如下:
server { listen 80; server_name kibana.xxx.xxx.cn;
location / {
proxy_set_header Host $http\_host;
proxy_pass http://127.0.0.1:5601$request\_uri;
allow all;
}
}
将此文件包含到nginx.conf中
“`
http {
include mime.types;
default\_type application/octet-stream;
... ... ... ...
include include/*.conf;
}
“`
如果已包含include目录,则直接重新加载nginx