Logging Operator——用 CRD 来控制 Kubernetes 日志流

1,061 阅读2分钟
原文链接: mp.weixin.qq.com

概述

Banzai logging operator 已经出到了 v3 版本。这个项目以 Fluentd 为基础,使用 Operator 的实现模式,在 Kubernetes 上用 CRD 的形式,对日志的采集行为进行定制,并进行过滤、路由等操作,最终可以将日志输出到 Elasticsearch、Loki、S3、Kafka 等多种后端。

图中可见,Logging 把日志分为了采集、路由和输出三个阶段。这三个阶段对应三种不同的 CRD:

  • 采集:

    使用 fluentbit 对日志进行采集

  • 路由:

    在 fluentd 中使用多种条件对日志条目进行过滤,并将结果发往目标

  • 输出:

    可以定义各种后端用于接收存储日志。

安装

可以使用 Helm 进行安装:

$ kubectl create ns loggingnamespace/logging created$ helm repo add banzaicloud-stable \    https://kubernetes-charts.banzaicloud.com"banzaicloud-stable" has been added to your repositories$ helm install --namespace logging \    logging banzaicloud-stable/logging-operator \    --set createCustomResource=false...

安装之后,会看到 logging 命名空间中的 Pod:

$ kubectl get po -n loggingNAME                                         READY   STATUS      RESTARTS   AGE...logging-logging-operator-7b4f9987f9-86clp    1/1     Running     0          120m

Logging

首先可以定义一个新的 Logging 对象:

apiVersion: logging.banzaicloud.io/v1beta1kind: Loggingmetadata:  name: default-logging-simplespec:  fluentd: {}  fluentbit: {}  controlNamespace: logging

提交到集群:

$ kubectl apply -f empty-logging.yamllogging.logging.banzaicloud.io/empty-logging created$ kubectl get podsNAME                                         READY   STATUS              RESTARTS   AGEempty-logging-fluentbit-2pghs                0/1     ContainerCreating   0          0sempty-logging-fluentbit-cc4r4                0/1     ContainerCreating   0          0sempty-logging-fluentbit-jzkpr                0/1     ContainerCreating   0          0sempty-logging-fluentd-0                      0/2     Pending...

Describe 新生成的 Pod,会发现它们加载了几个 Secret 作为配置文件。例如 fluentbit 的内容:

$ kubectl view-secret empty-logging-fluentbitChoosing key: fluent-bit.conf...[OUTPUT]    Name          forward    Match         *    Host          empty-logging-fluentd.logging.svc    Port          24240    Retry_Limit   False

这里的配置表明,采集器收集到的日志会输出到 empty-logging-fluentd 的服务之中。

追查一下 fluentd 的配置内容,发现其输出配置为空,也就是说,没有提供输出能力。

查看 operator 的日志:

$ kubectl logs -f -l app.kubernetes.io/name=logging-operator...{"level":"info","ts":1583835777.4591844,"logger":"controllers.Logging","msg":"resource created","name":"empty-logging-fluentbit","namespace":"logging","apiVersion":"apps/v1","kind":"DaemonSet"}...{"level":"info","ts":1583835834.1114376,"logger":"controllers.Logging","msg":"no flows found, generating empty model"}

输出日志中表示,缺乏 flow 定义。

Output

先使用 Helm 安装 Loki,然后定义一个 output:

apiVersion: logging.banzaicloud.io/v1beta1kind: Outputmetadata: name: loki-outputspec: loki:   url: http://loki-1583844504.loki:3100   configure_kubernetes_labels: true   buffer:     timekey: 1m     timekey_wait: 30s     timekey_use_utc: true

创建这个资源之后,Secret 和 Pod 都没发生什么变化,甚至 Operator Pod 的日志都没有输出内容,看来还是需要创建 Flow 将日志输出过去。

Flow

创建如下的 Flow 对象:

apiVersion: logging.banzaicloud.io/v1beta1kind: Flowmetadata:  name: loki-flowspec:  filters:    - tag_normaliser: {}    - parser:        remove_key_name_field: true        reserve_data: true        parse:          type: nginx  match:    - select:        labels:          app.kubernetes.io/name: log-generator  outputRefs:    - loki-output

其中 filters 成员中标识了我们要对应用进行的处理,使用 tag_normaliser 加入 Kubernetes 标签。

match 中使用标签加入过滤功能,这里选择了 app.kubernetes.io/name: log-generator 的标签对

outputRefs 指定输出到前面创建的 loki-output

CRD 创建之后

进入 fluentd Pod 的 Shell,会发现配置发生变化:

$ cat fluentd/app-config/fluentd.conf<match **>...    <match>      labels app.kubernetes.io/name:log-generator      namespaces logging...  <match kubernetes.**>    @type tag_normaliser    @id loki-flow_0_tag_normaliser    format ${namespace_name}.${pod_name}.${container_name}  </match>  <filter **>    @type parser    @id loki-flow_1_parser...    <parse>      @type nginx...  <match **>    @type loki

部署一个应用:

apiVersion: apps/v1kind: Deploymentmetadata: name: log-generatorspec: selector:   matchLabels:     app.kubernetes.io/name: log-generator replicas: 1 template:   metadata:     labels:       app.kubernetes.io/name: log-generator   spec:     containers:     - name: nginx       image: banzaicloud/log-generator:0.3.2

此时打开 Loki 的 Grafana,就能对日志进行查询了:

结语

这个产品很好的展示了 Operator 固化运维技能的特征。化繁为简,将日志集采过程中所需的复杂知识,精选为一系列的配置组合,以 CRD 的形式呈现给非专家型客户,开箱即用。

kubectl 的 view-secret 插件,Bug 比较严重,不要问我是怎么知道的。