前言
模板是可以方便地应用于多个主机的一组实体。而这些实体包括:
items(监控项)
triggers(触发器)
graphs(图形)
applications(应用)
screens (聚合图形(自Zabbix 2.0起))
low-level discovery rules (自动发现规则 (自Zabbix 2.0起))
web scenarios (web场景 (自Zabbix 2.0起))。
由于现实生活中的许多主机是相同或类似的,所以,为一个主机创建的一组实体(项目,触发器,图形,…)可能对许多人有用。当然,可以将它们复制到每个新的主机上,但需要费很大功夫。相反,使用模板,可以将它们复制到一个模板,然后根据需要将模板应用于尽可能多的主机。
当模板链接到主机时,模板的所有实体(项目,触发器,图形,…)都将添加到主机。模板直接分配给每个单独的主机(而不是主机组)。
模板通常用于为特定服务或应用程序(如Apache,MySQL,PostgreSQL,Postfix …)分组实体,然后应用于运行这些服务的主机。
使用模板的另一个好处是当所有主机都需要更改时。只需要在模板上更改某些内容将会将更改应用到所有链接的主机。
因此,使用模板是减少工作量并简化Zabbix配置的好方法。
方法一:去官网下载监控模板
zabbix监控模板大全:
方法二:自定义监控模板
案例:自定义监控客户端服务器登录的人数
需求:监控客户端的登录人数,超过 3 个就发出报警信息
1)在客户端创建自定义 key
#在客户端创建自定义 key
1.明确需要执行的 linux 命令
who | wc -l
2.客户端,创建 zabbix 的监控项配置文件,用于自定义 key
vim /etc/zabbix/zabbix_agent2.conf #查看agent2 配置文件
##268行,可以将自定义的监控项配置文件创建在 zabbix_agent2.d 目录中
Include=/etc/zabbix/zabbix_agent2.d/*.conf #268行指定配置文件
##291行,自定义监控项的格式如下,即按照此格式来进行配置文件的编写
# Format: UserParameter=<key>,<shell command>
cd /etc/zabbix/zabbix_agent2.d/
vim User_login_num.conf #编写自定义的监控项配置文件
UserParameter=login.user,who|wc -l
#login.user是键名称,"who|wc -l"表示键通过什么命令或脚本获取值
systemctl restart zabbix-agent2 #重启服务
3.在服务端验证新建的监控项,获取客户端当前的登录人数。
zabbix_get -s '192.168.142.20' -p 10050 -k 'login.user'
1、客户端,创建 zabbix 的监控项配置文件:
2、在服务端验证新建的监控项,获取客户端当前的登录人数:
2)在 Web 页面创建自定义监控项模板
1.创建模板
点击左边菜单栏【配置】中的【模板】,点击【创建模板】
【模板名称】设置成 Template Login User
【可见的名称】设置成 Template Login User
【群组】选择 Templates
【描述】可自定义
点击 【添加】,此时就可在【链接的模板】中搜索到 Template Login User 了
2.创建应用集(用于管理监控项的)
点击上方菜单栏【应用集】,点击【创建应用集】
【名称】设置成 Login User
点击 【添加】
3.创建监控项
点击上方菜单栏【监控项】,点击【创建监控项】
【名称】设置成 Number of login users
【键值】设置成 login.user #键值必须要与自定义的监控项配置文件中设置的保持一致
【更新间隔】设置成 10s #监控的间隔时间,多久采集一次数据
【历史数据保留时长】Storage period 30d #保留时间可自定义设置
【趋势存储时间】Storage period 30d
点击 【添加】
4.创建触发器(当监控项获取到监控的值后和触发器预设的值进行对比,判断是否报警)
点击上方菜单栏【触发器】,点击【创建触发器】
【名称】设置成 Number of login users is greater than 3
【严重性】设置成 一般严重
【表达式】点击添加,【监控项】点击选择 Number of login users,【功能】选择 last(),【结果】选择>3,点击 【插入】
点击 【添加】
5.创建图形
点击上方菜单栏【图形】,点击【创建图形】
【名称】设置成 Number of login users
【宽】、【高】可直接采用默认值
【监控项】点击添加勾选相关监控项 Number of login users,【功能】选择 最大,其它可保持默认值
点击 【添加】
6.将主机与模板关联起来(一个主机可以关联多个模板)
点击左边菜单栏【配置】中的【主机】,点击你要关联的主机
点击上方菜单栏【模板】,【Link new tamplates】搜索 login,选择 Template Login User,点击【更新】
此时就点击【监测】中的【主机】,点击你关联主机的【图形】,即可查看到相关的监控项指标。
1、创建模板
- 点击左边菜单栏【配置】中的【模板】,点击【创建模板】
- 【模板名称】设置成 Template Login User
- 【可见的名称】设置成 Template Login User
- 【群组】选择 Templates
- 【描述】可自定义
- 点击 【添加】,此时就可在【链接的模板】中搜索到 Template Login User 了
2、创建应用集(用于管理监控项的)
- 点击上方菜单栏【应用集】,点击【创建应用集】
- 【名称】设置成 Login User
- 点击 【添加】
3、创建监控项
- 点击上方菜单栏【监控项】,点击【创建监控项】
- 【名称】设置成 Number of login users
- 【键值】设置成 login.user #键值必须要与自定义的监控项配置文件中设置的保持一致
- 【更新间隔】设置成 10s
- 【历史数据保留时长】Storage period 30d #保留时间可自定义设置
- 点击 【添加】
4、创建触发器(当监控项获取到监控的值后和触发器预设的值进行对比,判断是否报警)
- 点击上方菜单栏【触发器】,点击【创建触发器】
- 【名称】设置成 Number of login users is greater than 3
- 【严重性】设置成 一般严重
- 【表达式】点击添加,【监控项】点击选择 Number of login users,【功能】选择 last(),【结果】选择>3,点击 【插入】
- 点击 【添加】
5、创建图形
-
点击上方菜单栏【图形】,点击【创建图形】
-
【名称】设置成 Number of login users
-
【宽】、【高】可直接采用默认值
-
【监控项】点击添加勾选相关监控项 Number of login users,【功能】选择 最大,其它可保持默认值
-
点击 【添加】
6、将主机与模板关联起来(一个主机可以关联多个模板)
- 点击左边菜单栏【配置】中的【主机】,点击你要关联的主机
- 点击上方菜单栏【模板】,【Link new templates】搜索 login,选择 Template Login User,点击【更新】
- 此时就点击【监测】中的【主机】,点击你关联主机的【图形】,即可查看到相关的监控项指标。
此时客户端再多开两个终端,让登录人数大于3。
可以看到zabbix监测到了登录人数问题。
3)设置邮件报警
设置邮件报警
点击左边菜单栏【管理】中的【报警媒介类型】,点击【创建媒体类型】
【名称】设置成 qq_Email
【SMTP服务器】设置成 smtp.qq.com
【SMTP服务器端口】设置成 25 #25端口不进行加密,465端口,通过ssl进行加密
【SMTP HELO】设置成 qq.com
【SMTP电邮】设置成 自己的邮箱地址,例如 1282808314@qq.com
【认证】选择 用户名和密码
【用户名称】设置成 自己的邮箱地址,例如 1282808314@qq.com
【密码】可登录QQ邮箱页面,点击【设置】-->【账户】中的【生成授权码】,通过短信获取授权码
【描述】可自定义
点击上方菜单栏【Message templates】,点击【添加】,【Message type】选择 问题,点击【更新】
点击 【添加】,并测试功能
点击左边菜单栏【User settings】-->【报警媒介】,点击【添加】
【类型】选择 qq_Email
【收件人】设置成 1282808314@qq.com
【当启用时】设置成 1-7,00:00-24:00
点击 【添加】
再点击 【更新】
点击左边菜单栏【配置】中的【动作】
选择相对应的动作名称点击进入,点击 【添加】
【类型】选择 触发器,【触发器】点击选择 Nunber of login users is greater than 3
点击【启用】
#测试邮件报警
增加测试客户端的用户登录数超过触发器预设的值,查看【监测】-->【仪表盘】,确认报警
1、首先确认邮箱的SMTP服务已开启:
zabbix 自动发现与自动注册
zabbix 自动发现(对于 agent2 是被动模式)
zabbix server 主动的去发现所有的客户端,然后将客户端的信息登记在服务端上。
缺点是如果定义的网段中的主机数量多,zabbix server 登记耗时较久,且压力会较大。
1.确保客户端上的 zabbix-agent2 服务状态正常
systemctl is-active zabbix-agent2.service
active
2.在 Web 页面删除原有的客户端主机
点击左边菜单栏【配置】中的【主机】,勾选原有的客户端主机,点击 删除
3.在服务端和客户端上配置 hosts 解析
vim /etc/hosts
192.168.142.10 zbx-server
192.168.142.20 zbx-agent01
4.在 Web 页面配置自动发现
点击左边菜单栏【配置】中的【自动发现】,点击【创建发现规则】
【名称】设置成 mynetwork
【IP范围】设置成 192.168.142.1-254
【更新间隔】设置成 30s
【检查】点击【添加】,【检查类型】选择 Zabbix 客户端,【端口范围】设置成 10050,【键值】设置成 system.uname
【设备唯一性准则】选择 IP地址
【主机名称】选择 DNS名称
【可见的名称】选择 主机名称
勾选 【已启用】,点击 【更新】
点击左边菜单栏【配置】中的【动作】,上方菜单选择 【Discovery actions】
勾选 【Auto discovery. Linux servers.】,点击 【启用】
点击左边菜单栏【配置】中的【主机】刷新,等待一段时间后即可刷新出自动发现的客户端主机
可在服务端查看 zabbix 日志
tail -f /var/log/zabbix/zabbix_server.log
......
6601:20210922:225044.115 enabling Zabbix agent checks on host "zbx-agent01": host became available
zabbix 自动注册(对于 agent2 是主动模式)
zabbix agent2 会主动上报自己的信息,发给 zabbix server。
缺点是可能因为配置文件配置错误或者网络不通等原因导致 zabbix agent2 可能找不到 zabbix server。
1.环境准备
点击左边菜单栏【配置】中的【自动发现】,勾选发现规则,点击 禁用
点击左边菜单栏【配置】中的【主机】,勾选原有的客户端主机,点击 删除
vim /etc/hosts
192.168.142.10 zbx-server
192.168.142.20 zbx-agent01
2.修改 zabbix-agent2 配置文件
vim /etc/zabbix/zabbix_agent2.conf
......
HostnameItem=system.hostname #139行,取消注释
egrep -v "^#|^$" /etc/zabbix/zabbix_agent2.conf
PidFile=/var/run/zabbix/zabbix_agent2.pid
LogFile=/var/log/zabbix/zabbix_agent2.log
LogFileSize=0
Server=192.168.142.10
ServerActive=192.168.142.20
Hostname=zbx-agent01
HostnameItem=system.hostname
Include=/etc/zabbix/zabbix_agent2.d/*.conf
ControlSocket=/tmp/agent.sock
3.在 Web 页面配置自动注册
点击左边菜单栏【配置】中的【动作】,上方菜单选择 【Autoregistration actions】,点击【创建动作】
【名称】设置成 Auto registration
点击 【添加】,【类型】选择 主机名称,【操作者】选择 包含,【值】设置成 zbx-agent01
点击上方菜单栏【操作】,点击【添加】,【操作类型】选择 添加主机,点击 【add】
再点击【添加】,【操作类型】选择 添加到主机群组,【主机群组】选择 Linux servers,点击 【add】
再点击【添加】,【操作类型】选择 与模板关联,【模板】搜索 Linux,选择 Template OS Linux by Zabbix agent,点击 【add】
点击下方的【添加】
点击左边菜单栏【配置】中的【主机】刷新,等待一段时间后即可刷新出自动发现的客户端主机
在服务端查看 zabbix 日志
tail -f /var/log/zabbix/zabbix_server.log
部署 zabbix 代理服务器
分布式监控的作用:
●分担 server 的集中式压力
●解决多机房之间的网络延时问题
agent --> proxy --> server
systemctl disable --now firewalld
setenforce 0
hostnamectl set-hostname zbx-proxy
//设置 zabbix 的下载源,安装 zabbix-proxy
rpm -ivh https://mirrors.aliyun.com/zabbix/zabbix/5.0/rhel/7/x86_64/zabbix-release-5.0-1.el7.noarch.rpm
cd /etc/yum.repos.d
sed -i 's#http://repo.zabbix.com#https://mirrors.aliyun.com/zabbix#' /etc/yum.repos.d/zabbix.repo
yum install -y zabbix-proxy-mysql zabbix-get
//安装 zabbix 所需的数据库
yum install -y mariadb-server mariadb
systemctl enable --now mariadb
mysql_secure_installation #初始化数据库,并设置密码,如 abc123
//添加数据库用户,以及 zabbix 所需的数据库信息
mysql -u root -pabc123
CREATE DATABASE zabbix_proxy character set utf8 collate utf8_bin;
GRANT all ON zabbix_proxy.* TO 'zabbix'@'%' IDENTIFIED BY 'zabbix';
flush privileges;
//导入数据库信息
rpm -ql zabbix-proxy-mysql #查询 sql 文件的位置
zcat /usr/share/doc/zabbix-proxy-mysql-5.0.15/schema.sql.gz | mysql -uroot -pabc123 zabbix_proxy
//修改 zabbix-proxy 配置文件
vim /etc/zabbix/zabbix_proxy.conf
Server=192.168.142.10 #30行,指定 zabbix 服务端的 IP 地址
Hostname=zbx-proxy #49行,指定当前 zabbix 代理服务器的主机名
DBPassword=zabbix #196行,指定当前数据库 zabbix 用户的密码
//启动 zabbix-proxy
systemctl start zabbix-proxy
systemctl enable zabbix-proxy
//在所有主机上配置 hosts 解析
vim /etc/hosts
192.168.142.10 zbx-server
192.168.142.20 zbx-agent01
192.168.142.30 zbx-proxy
//在 Web 页面配置 agent 代理
点击左边菜单栏【配置】中的【动作】,勾选自动注册规则,点击 禁用
点击左边菜单栏【配置】中的【主机】,勾选原有的客户端主机,点击 删除
点击左边菜单栏【管理】中的【agent代理程序】,点击【创建代理】
【agent代理程序名称】设置为 zbx-proxy
【系统代理程序模式】选择 主动式
【代理地址】设置为 192.168.142.20
点击 【添加】
//配置 agent 使用 proxy
1.在客户端修改 agent2 配置文件
vim /etc/zabbix/zabbix_agent2.conf
......
Server=192.168.142.30 #80行,指定 zabbix 代理服务器的 IP 地址
ServerActive=192.168.142.30 #120行,指定 zabbix 代理服务器的 IP 地址
2.在 Web 页面配置
点击左边菜单栏【配置】中的【主机】,点击【创建主机】
【主机名称】设置成 zbx-agent01
【可见的名称】设置成 zbx-agent01
【群组】选择 Linux server
【Interfaces】的【IP地址】设置成 192.168.142.20
【由agent代理程序监测】选择 zbx-proxy
再点击上方菜单栏【模板】
【Link new tamplates】搜索 Linux ,选择 Template OS Linux by Zabbix agent
点击 【添加】
3.分别在客户端和代理服务器上重启服务
systemctl restart zabbix-agent2
systemctl restart zabbix-proxy
点击左边菜单栏【配置】中的【主机】刷新,查看客户端主机监控状态正常
在服务端查看日志
tail -f /var/log/zabbix/zabbix_proxy.log
设置 zabbix-snmp 监控
SNMP,简单网络管理协议
1.服务端安装 snmp 监控程序
yum install -y net-snmp net-snmp-utils
2.修改 snmp 的配置文件,并启动服务
vim /etc/snmp/snmpd.conf
......
view systemview included .1 #57行,添加此配置
systemctl start snmpd
3.使用 snmp 命令测试
snmpwalk -v 2c -c public 127.0.0.1 sysname
SNMPv2-MIB::sysName.0 = STRING: zbx-server
-------------------------------------------------------
–v 1|2c|3:指定SNMP协议版本
–c:指定共同体字符串
sysname:为 snmp 的 key
-------------------------------------------------------
4.在 Web 页面配置 snmp 方式监控
点击左边菜单栏【配置】中的【主机】,点击 Zabbix server
【Interfaces】点击【添加】选择 SNMP ,端口设置成 161
点击上方菜单栏【模板】,【链接的模板】中的所有 agent 模板选择取消链接并清理
再在【Link new templates】中搜索 Linux SNMP,选择 Template OS Linux SNMP
点击 【更新】,等待一段时间后 Zabbix server 的可用性就变成了 SNMP 监控方式。
zabbix常见问题
Zabbix怎么开启自定义监控?
写一个脚本用于获取待监控服务的一些状态信息。
在zabbix客户端的配置文件zabbix_agentd.conf中添加上自定义的“UserParameter”,目的是方便zabbix调用我们上面写的那个脚本去获取待监控服务的信息。
在zabbix服务端使用zabbix_get测试是否能够通过第二步定义的参数去获取zabbix客户端收集的数据。 在zabbix服务端的web界面中新建模板,同时第一步的脚本能够获取什么信息就添加上什么监控项,“键值”设置成前面配置的“UserParameter”的值。
数据显示图表,直接新建图形并选择上一步的监控项来生成动态图表即可。
自定义监控模板
1、先明确获取监控数据的方式,比如通过命令或者shell/python脚本来获取。
2、创建zabbix 的监控项配置文件( /etc/zabbix/ zabbix-agent2.d/*.conf) ,自定义监控数据的键名 Userparameter=<KEY>, <CMD>
3、在zabbix-server 的WEB页面上设置自定义监控模板:
- 配置->模板->应用集->监控项->触发器->图形
- 将自定义监控模板和主机关联起来
4、设置邮件报警:
- 管理 -> 报警媒介类型,设置发件人邮箱配置并测试
- user settings->报警媒介 ,设置收件人的邮箱和运行时间
- 配置 -> 动作,将触发器和报警媒介关联起来
- 测试
Zabbix是怎么开启微信报警的?
首先,需要有一个微信企业号。(一个实名认证的[微信号]一个可以使用的[手机号]一个可以登录的[邮箱号]
下载并配置微信公众平台私有接口。
配置Zabbix告警,(增加示警媒介类型,添加用户报警媒介,添加报警动作)。
Zabbix监控了多少客户端,客户端是怎么进行批量安装的?根据实际公司台数回答。
- 使用命令生成密钥。
- 将公钥发送到所有安装zabbix客户端的主机。
- 安装 ansible 软件,(修改配置文件,将zabbix 客户机添加进组)。
- 创建一个安装zabbix客户端的脚本。
- 执行该脚本。
- 验证。
我们可以用Zabbix监控哪些?
- 硬件监控:通过 SNMP 来进行路由器交换机的监控。
- 系统监控:如 CPU 的负载,上下文切换、内存使用率、磁盘读写、磁盘使用率、磁盘 inode 节点。
- 服务监控:比如公司用 LNMP nginx 自带 Status 模块、 PHP 也有相关的 Status 、 MySQL 的话可以通过 ODBC协议 来进行监控。
- 网络监控:如果是云主机又不是跨机房,那么可以选择不监控网络。
- 安全监控:如果是云主机可以考虑使用自带的安全防护。当然也可以Zabbix监控 iptables 。如果是硬件,那么推荐以Zabbix监控硬件防火墙。
- Web 监控:web 监控的话题其实还是很多。比如可以使用自带的 web 监控来监控页面相关的延迟、 js 响应时间、下载时间、等等。
- 日志监控:如果是 web 的话可以使用监控 Nginx 的 500x 日志。PHP 的 ERROR 日志。
- 流量分析:平时我们分析日志都是拿 awk sed xxx 一堆工具来实现。这样对我们统计 ip 、 pv 、 uv 不是很方便。那么可以使用百度统计、 google 统计、商业,让开发嵌入代码即可 (不想关建议去掉)。
- 可视化:通过 screen 以及引入一 些第三方的库来美化界面,同时我们也需要知道、订单量突然增加、 突然减少。或者说突然来了一大波流量,这流量从哪儿来,是不是推广了,还是被攻击了。可以结合监控平台来梳理各个系统之间的业务关系。
- 自动化监控:如上我们做了那么多的工作,当然不能是一台一台的来加 key 实现。可以通过Zabbix 的主动模式以及被动模式来实现。当然最好还是通过 API 来实现。
Zabbix监控做过哪些?
zabbix监控mysql集群:
- 创建并编辑监控mysql的脚本(通常有脚本模板),添加执行权限;
- 修改zabbix-agent配置文件,默认有一个MySQL的子配置文件,直接编辑该文件即可,数据库添加授权用户;
- 重启zabbix-agent;
- Web界面配置、点击需要监控的主机,进去添加监控模板,自带的Template DB MySQL;
- 配置完成后等一会儿就可以查看到监控主机的MySQL监控信息。
如果发现监控没有数据,请排查如下问题:
- zabbix客户端是否重启
- 脚本是否有执行权限
- 数据库是否有用户授权
- 环境变量是否有问题
zabbix监控mysql的四大性能指标?
- 查询吞吐量
- 查询执行性能
- 连接情况
- 缓冲池使用情况
zabbix如何修改其中监控的一台服务器中内存阈值信息,比如正常内存使用到了 80%报警,我想修改为 60%报警?
正常来说 , 一般会把监控的服务器统一加入到一个模板中 , 修改模板的其中某一项的监控项参数和告警阈值后 , 加入模板中的所有主机都会同步。如果单独想修改其中某一台服务器内存告警阈值 ,需要模板中设定阈值使用用户自定义宏代替,这样可以在单独修改某一台主机的宏,达到单个主机内存报警,阈值修改为60%。
Zabbix有哪些优势?
Zabbix是一个企业级的高度集成开源监控软件,提供分布式监控解决方案。可以用来监控设备、服务等可用性和性能。其主要优势有:
- 自由开放源代码产品,可以对其进行任意修改和二次开发,采用GPL协议;
- 安装和配置简单;
- 搭建环境简单,基于开源软件构建平台;
- 完全支持Linux、Unix、Windows、AIX、BSD等平台,采用C语言编码,系统占用小,数据采集性能和速度非常快;
- 数据采集持久存储到数据库,便于对监控数据的二次分析;
- 非常丰富的扩展能力,轻松实现自定义监控项和实现数据采集。
讲解一下告警屏蔽?
- 处于维护中的主机,告警信息还是会报出来,但是不会触发动作;
- 对于可预知的临时维护或紧急维护,可以提前设置告警屏蔽;
- 可针对组、单台或多台主机,进行一次性、每日定时、每月定时、每周定时屏蔽;
- 前端可以将维护中的主机不进行显示,Dashboard右上角有个图标可以进行筛选是否显示维护中的主机;
- 告警屏蔽时,可以设置采集数据或不采集数据两种方式。
报警类型和故障处理:
报警类型:
1.E-mail 邮件
2.微信报警等
故障处理:
如监控服务器down机不报警
1.先定位问题:zabbix服务器采用轮询的方式从监控目标机的agent获取数据。但如果目标机down了,目标机的agent通常也无法工作,所以检查被监控的主机服务
2.增加一个目标主机进行是否存活的检测。
告警收敛:
1)所有产生告警均由zabbix调用脚本推入缓存redis当中。
2)分析系统将在规定时间(1分钟)内去redis中拉取数据,根据定义好的一系列规则进行,合并、分析或直接丢弃,并存入分析平台数据库,以便供历史查询。
3)根据预先定义好的规则将报警通过定义好的方式发送给相关人员。