inotify + rsync 实现数据同步

163 阅读15分钟

inotify 实时监控

内核支持

内核是否支持inotify

Linux支持inotify的内核最小版本为 2.6.13,参看man 7 inotify

#列出下面的文件,说明服务器内核支持inotify
[root@centos7 ~]#ls -l /proc/sys/fs/inotify   
-rw-r--r-- 1 root root 0 Dec  7 10:10 max_queued_events
-rw-r--r-- 1 root root 0 Dec  7 10:10 max_user_instances
-rw-r--r-- 1 root root 0 Dec  6 05:54 max_user_watches
[root@centos7 ~]#cat /proc/sys/fs/inotify/max_queued_events
16384
[root@centos7 ~]#cat /proc/sys/fs/inotify/max_user_instances
128
[root@centos7 ~]#cat /proc/sys/fs/inotify/max_user_watches
8192

inotify 内核参数说明:

  • max_queued_events:inotify 事件队列最大长度,如值太小会出现 Event Queue Overflow 错误,默认值:16384, 生产环境建议调大,比如:327679
  • max_user_instances:每个用户创建inotify实例最大值,默认值:128
  • max_user_watches:可以监视的文件的总数量(inotifywait 单进程),默认值:8192,建议调大

例子:

[root@data-centos7 ~]#vim /etc/sysctl.conf 
fs.inotify.max_queued_events=66666
fs.inotify.max_user_watches=100000    
​
​
[root@centos7 ~]#sysctl -p
fs.inotify.max_queued_events = 66666
fs.inotify.max_user_watches = 100000
[root@centos7 ~]#cat /proc/sys/fs/inotify/*
66666
128
100000

inotify-tools工具

inotify-tools参考文档:github.com/rvoicilas/i…

安装inotify-tools:基于epel源

[root@data-centos7 ~]# yum -y install inotify-tools

inotify-tools包主要工具:

  • inotifywait: 在被监控的文件或目录上等待特定文件系统事件(open ,close,delete等)发生,常用于实时同步的目录监控
  • inotifywatch:收集被监控的文件系统使用的统计数据,指文件系统事件发生的次数统计

inotifywait命令

格式:

inotifywait [ options ] file1 [ file2 ] [ file3 ] [ ... ]

常用选项:

选项解释
-m, --monitor始终保持事件监听
-d, --daemon以守护进程方式执行,和-m相似,配合-o使用
-r, --recursive递归监控目录数据信息变化
-q, --quiet输出少量事件信息
--exclude 指定排除文件或目录,使用扩展的正则表达式匹配的模式实现
--excludei 和exclude相似,不区分大小写
-o, --outfile 打印事件到文件中,相当于标准正确输出,注意:使用绝对路径
-s, --syslogOutput发送错误到syslog相当于标准错误输出
--timefmt 指定时间输出格式
--format 指定的输出格式;即实际监控输出内容
-e指定监听指定的事件,如果省略,表示所有事件都进行监听

inotifywait的 --timefmt 时间格式

参考 man 3 strftime

%Y#年份信息,包含世纪信息
%y#年份信息,不包括世纪信息
%m#显示月份,范围 01-12
%d#每月的第几天,范围是 01-31
%H#小时信息,使用 24小时制,范围 00-23
%M#分钟,范围 00-59
%S#秒,范例 0-60
%Y #年份信息,包含世纪信息
%y #年份信息,不包括世纪信息
%m #显示月份,范围 01-12
%d #每月的第几天,范围是 01-31
%H #小时信息,使用 24小时制,范围 00-23 
%M #分钟,范围 00-59 
%S      #秒,范例 0-60

例子:

--timefmt "%Y-%m-%d %H:%M:%S"

inotifywait的--format格式定义

%T #输出时间格式中定义的时间格式信息,通过 --timefmt option 语法格式指定时间信息
%w #事件出现时,监控文件或目录的名称信息,相当于dirname
%f #事件出现时,将显示监控目录下触发事件的文件或目录信息,否则为空,相当于basename
%e #显示发生的事件信息,不同的事件默认用逗号分隔
%Xe #显示发生的事件信息,不同的事件指定用X进行分隔  x表示分隔符

例子:

--format "%T %w%f event: %;e"
--format '%T %w %f'

inotifywait -e 选项指定的事件类型

create              #文件或目录创建
delete              #文件或目录被删除
modify              #文件或目录内容被写入
attrib              #文件或目录属性改变
close_write         #文件或目录关闭,在写入模式打开之后关闭的
close_nowrite       #文件或目录关闭,在只读模式打开之后关闭的
close               #文件或目录关闭,不管读或是写模式
open                #文件或目录被打开
lsdir               #浏览目录内容
moved_to            #文件或目录被移动到监控的目录中
moved_from          #文件或目录从监控的目录中被移动
move                #文件或目录不管移动到或是移出监控目录都触发事件
access              #文件或目录内容被读取
delete_self         #文件或目录被删除,目录本身被删除
unmount             #取消挂载

范例:

-e create,delete,moved_to,close_write,attrib

###实际演示

基本用法

[root@localhost ~]#inotifywait /data/
#使用  inotifywait  命令监控 
Setting up watches.
Watches established.
​

开启另一个终端,新建删除文件可以看到变化 ,有操作就会退出

[root@localhost ~]#inotifywait /data/
Setting up watches.
Watches established.
/data/ OPEN,ISDIR 
[root@localhost ~]#

持续监听 -m

[root@localhost ~]#inotifywait  -m  /data/
#使用  inotifywait  命令监控 
Setting up watches.
Watches established.

开启另一个终端,新建删除文件可以看到变化 ,不会主动退出

[root@localhost ~]#inotifywait /data/ -m
Setting up watches.
Watches established.
/data/ CREATE aa
/data/ OPEN aa
/data/ ATTRIB aa
/data/ CLOSE_WRITE,CLOSE aa
​

1.2.3.3 递归监听 -r

不加入 -r 选项无法监听 子目录

[root@localhost ~]#inotifywait  -m /data/
# 不加入 -r  无法监控子目录的操作
Setting up watches.
Watches established.
/data/ OPEN,ISDIR 
/data/ CLOSE_NOWRITE,CLOSE,ISDIR 
/data/ OPEN,ISDIR 
​

加入 -r 选项后可以看到子目录中的操作

[root@localhost ~]#inotifywait  -mr /data/
Setting up watches.  Beware: since -r was given, this may take a while!
Watches established.
/data/test1/ OPEN aaaaa
/data/test1/ ATTRIB aaaaa
/data/test1/ CLOSE_WRITE,CLOSE aaaaa
​

1.2.3.4 持续后台监控,并记录日志

#持续后台监控,并记录日志
[root@localhost ~]#inotifywait -mr /data/ --timefmt "%Y-%m-%d %H:%M:%S" --format "%T %w%f event: %;e"
Setting up watches.  Beware: since -r was given, this may take a while!
Watches established.
2024-07-11 16:00:11 /data/test1 event: OPEN;ISDIR
2024-07-11 16:00:11 /data/test1/ event: OPEN;ISDIR
2024-07-11 16:00:11 /data/test1 event: CLOSE_NOWRITE;CLOSE;ISDIR
2024-07-11 16:00:11 /data/test1/ event: CLOSE_NOWRITE;CLOSE;ISDIR
​
#与上面对比格式发生了变化  
 --timefmt   指定时间格式   "%Y-%m-%d %H:%M:%S"    年:月:日 时:分:秒
 --format    日志输出格式    "%T %w%f event: %;e"  时间格式   %w监控的文件夹   %f监控的文件   event: 添加输出信息    %;e 多个事件用;号隔开

1.2.3.5 持续后台监控,并挑选事件 记录日志

[root@localhost ~]#inotifywait -mr /data/ --timefmt "%Y-%m-%d %H:%M:%S" --format "%T %w%f event: %;e" -e create,delete,moved_to,close_write,attrib

rsync

rsync 常用于做为 linux系统下的数据镜像备份工具,实现远程同步,支持本地复制,或者与其他SSH、rsync主机同步数据,支持增量备份,配合任务计划,rsync能实现定时或间隔同步,配合inotify或sersync,可以实现触发式的实时数据同步

官方网站: rsync.samba.org/

软件包:rsync,rsync-daemon(CentOS 8)

服务文件:/usr/lib/systemd/system/rsyncd.service

配置文件:/etc/rsyncd.conf

端口:873/tcp

rsync命令

本地使用
 rsync [OPTION...] SRC... [DEST]

例子: 将/etc 文件夹

[root@centos7 ~]#rsync  -av /etc    192.168.10.20:/opt    #复制目录和目录下文件
# -a  约等于cp命令中的a  v 显示过程

[root@centos7 ~]#rsync  -av /etc/        192.168.10.20:/opt    #只复制目录下文件
#-v 显示 过程

[root@localhost test1]# rsync -av /data/   --delete 192.168.10.20:/opt
#  --delete  接收端会同步发送端的目录中的文件, 多则删除少则添加
root@192.168.91.101's password: 
sending incremental file list
deleting 123

sent 82 bytes  received 13 bytes  38.00 bytes/sec
total size is 0  speedup is 0.00
远程使用基于 ssh协议
Pull: 
rsync [OPTION...] [USER@]HOST:SRC... [DEST]
Push: 
rsync [OPTION...] SRC... [USER@]HOST:DEST
远程使用基于 后台 daemon 双冒号或者 双 //
Pull: 
rsync [OPTION...] [USER@]HOST::SRC... [DEST]
rsync [OPTION...] rsync://[USER@]HOST[:PORT]/SRC... [DEST]
Push:
rsync [OPTION...] SRC... [USER@]HOST::DEST
rsync [OPTION...] SRC... rsync://[USER@]HOST[:PORT]/DEST
#
The ':' usages connect via remote shell, while '::' & 'rsync://' usages connectto an rsync daemon, and require SRC or DEST to start with a module name.

rsync有三种工作方式:

  1. 本地文件系统上实现同步。命令行语法格式为上述"Local"段的格式。
  2. 本地主机使用远程shell和远程主机通信。命令行语法格式为上述"Access via remote shell"段的格式。
  3. 本地主机通过网络套接字连接远程主机上的rsync daemon。命令行语法格式为上述"Access via rsync daemon"段的格式。

前两者的本质是通过本地或远程shell,而第3种方式则是让远程主机上运行rsyncd服务,使其监听在一个端口上,等待客户端的连接。

常见选项:

-v:显示rsync过程中详细信息。可以使用"-vvvv"获取更详细信息。
-P:显示文件传输的进度信息。(实际上"-P"="--partial --progress",其中的"--progress"才是显示进度信息的)。
-n --dry-run :仅测试传输,而不实际传输。常和"-vvvv"配合使用来查看rsync是如何工作的。
-a --archive :归档模式,表示递归传输并保持文件属性。等同于"-rtopgDl"。
-r --recursive:递归到目录中去。
-t --times:保持mtime属性。强烈建议任何时候都加上"-t",否则目标文件mtime会设置为系统时间,导致下次更新
         :检查出mtime不同从而导致增量传输无效。
-o --owner:保持owner属性(属主)。
-g --group:保持group属性(属组)。
-p --perms:保持perms属性(权限,不包括特殊权限)。
-D       :是"--device --specials"选项的组合,即也拷贝设备文件和特殊文件。
-l --links:如果文件是软链接文件,则拷贝软链接本身而非软链接所指向的对象
-z       :传输时进行压缩提高效率
-R --relative:使用相对路径。意味着将命令行中指定的全路径而非路径最尾部的文件名发送给服务端,包括它们的属性。用法见下文示例。
--size-only :默认算法是检查文件大小和mtime不同的文件,使用此选项将只检查文件大小。
-u --update :仅在源mtime比目标已存在文件的mtime新时才拷贝。注意,该选项是接收端判断的,不会影响删除行为。
-d --dirs   :以不递归的方式拷贝目录本身。默认递归时,如果源为"dir1/file1",则不会拷贝dir1目录,使用该选项将拷贝dir1但不拷贝file1。
--max-size :限制rsync传输的最大文件大小。可以使用单位后缀,还可以是一个小数值(例如:"--max-size=1.5m")
--min-size :限制rsync传输的最小文件大小。这可以用于禁止传输小文件或那些垃圾文件。
--exclude   :指定排除规则来排除不需要传输的文件。
--delete   :以SRC为主,对DEST进行同步。多则删之,少则补之。注意"--delete"是在接收端执行的,所以它是在
           :exclude/include规则生效之后才执行的。
-b --backup :对目标上已存在的文件做一个备份,备份的文件名后默认使用"~"做后缀。
--backup-dir:指定备份文件的保存路径。不指定时默认和待备份文件保存在同一目录下。
-e         :指定所要使用的远程shell程序,默认为ssh。
--port     :连接daemon时使用的端口号,默认为873端口。
--password-file:daemon模式时的密码文件,可以从中读取密码实现非交互式。注意,这不是远程
shell认证的密码,而是rsync模块认证的密码。
-W --whole-file:rsync将不再使用增量传输,而是全量传输。在网络带宽高于磁盘带宽时,该选项比增量传输更高效。
--existing :要求只更新目标端已存在的文件,目标端还不存在的文件不传输。注意,使用相对路径时如果上层目录不存在也不会传输。
--ignore-existing:要求只更新目标端不存在的文件。和"--existing"结合使用有特殊功能,见下文
示例。
--remove-source-files:要求删除源端已经成功传输的文件

范例:两种格式访问 rsync daemon 服务

1.3.2 实际演示

1.3.2.1开启 rsync 同步服务

[root@node2 opt]#rsync --daemon
#  开启rsync 服务  监听在   873 口上[root@node2 ~]#touch /etc/rsyncd.conf
#要想开启必需要有配置文件, 默认已存在[root@node2 opt]#ss -natp |grep rsync
LISTEN     0      5            *:873                      *:*                   users:(("rsync",pid=5954,fd=4))
LISTEN     0      5           :::873                     :::*                   users:(("rsync",pid=5954,fd=5))

开启之后去客户端使用 rsync 软件同步文件

[root@localhost ~]#rsync   rsync://192.168.10.20
#使用  命令无法看到共享目录

1.3.2.2 设置 配置文件

[root@node2 ~]#cat /etc/rsyncd.conf
# 我们需要在 服务端 设置一个 共享模块  , 并且设置真实路径 /data/backup/
[backup]
path = /data/backup/

设置好文件后 可以看到共享目录

[root@localhost ~]#rsync   rsync://192.168.10.20
backup  

设置可写(可以上传)

看到目录后尝试上传文件 提示 read only

[root@localhost ~]#rsync  /etc/passwd  rsync://192.168.10.20/backup
ERROR: module is read only
rsync error: syntax or usage error (code 1) at main.c(879) [Receiver=3.0.9]
rsync: read error: Connection reset by peer (104)
rsync error: error in rsync protocol data stream (code 12) at io.c(764) [sender=3.0.9]

设置可写

[root@node2 ~]#cat /etc/rsyncd.conf
[backup]
path = /data/
read only = no
#指定可读写,默认只读

给文件夹权限

[root@localhost ~]#rsync  /etc/passwd  rsync://192.168.10.20/backup
rsync: mkstemp "/.passwd.v1oOME" (in backup) failed: Permission denied (13)
rsync error: some files/attrs were not transferred (see previous errors) (code 23) at main.c(1052) [sender=3.0.9]


# 文件夹的权限没开

#指定目录给nobody权限,默认用户以nobody访问此目录
[root@node2]#setfacl -m u:nobody:rwx /data/
# 给nobody  用户加权限
[root@node2]#setfacl -b   /data/
#清空

重新测试

客户端
[root@localhost ~]#rsync  /etc/passwd  rsync://192.168.10.20/backup
[root@localhost ~]#rsync  /etc/passwd  192.168.10.20::backup
#第二种方式


# 在服务器端查看 可以看到文件
[root@node2 opt]#ls /data/
passwd

实现验证功能

上述实验没有验证功能不安全

修改配置文件添加验证功能等

配置解释
uid = root提定以哪个用户来访问共享目录,将之指定为生成的文件所有者,默认为nobody
gid = root默认为nobody
port = 874可指定非标准端口,默认873/tcp
use chroot = no限制在指定的模块路径来增强安全性,限制目录
max connections = 0最大连接数
ignore errors忽略错误
exclude = lost+found/不同步的文件
log file = /var/log/rsyncd.log日志文件位置
pid file = /var/run/rsyncd.pidpid 文件位置
lock file = /var/run/rsyncd.lock锁文件如果 max connections 设置为 4,则 rsync 将使用锁文件来确保同时只有 4 个连接。
reverse lookup = no不使用反向解析
hosts allow = 10.0.0.0/24允许同步的网段
[backup]每个模块名对应一个不同的path目录,如果同名后面模块生效
path = /data/backup/指明文件的真实存放路径
comment = backup dir备注描述
read only = no默认是yes,即只读 no表示可写
auth users = rsyncuser验证默认anonymous可以访问rsync服务器 ,修改成rsyncuser 用户 只有 rsyncuser 可以访问
secrets file = /etc/rsync.pas密码文件位置
修改配置文件
[root@node2 ~]#vi /etc/rsyncd.conf
uid=root
gid=root
max connections = 0
ignore errors
exclude = lost+found/
log file = /var/log/rsyncd.log
pid file = /var/run/rsyncd.pid
lock file = /var/run/rsyncd.lock
reverse lookup = no[backup]
path = /data/
read only = no
auth users = rsyncuser
secrets file = /etc/pass
​
​
[root@node2 data]#echo "rsyncuser:123456" > /etc/pass
[root@node2 data]#chmod  600 /etc/pass      #必须修改
[root@node2 data]#systemctl restart   rsyncd
[root@node2 data]#systemctl status   rsyncd

客户端测试

[root@localhost ~]#rsync   /etc/issue   rsyncuser@192.168.91.101::backup
Password: 
​
客户端设置密码文件
#客户端配置密码文件
#也可将密码赋值给环境变量RSYNC_PASSWORD变量,但不安全
​
[root@localhost data]#vim  /etc/pass
123456
[root@localhost data]#chmod  600 /etc/pass  ## 必须
​
​
​
​
#非交互式查看共享目录
[root@data-server ~]#rsync --password-file=/etc/pass  rsync://rsyncuser@192.168.91.101/backup
​
​
#rsync -avz --delete --password-file=/etc/rsync.pas /data/www/ rsyncuser@rsync服务器IP::backup
#rsync -avz --delete   --password-file=/etc/rsync.pas rsyncuser@rsync服务器IP::backup   /data/www/
​

inotify+rsync+shell脚本实现实时数据同步

搭建好 rsyncd的备份服务器,在数据服务器上创建inotify_rsync.sh脚本

注意: 此脚本执行前先确保两主机初始数据处于同步状态,此脚本实现后续的数据同步

[root@localhost ~]#vim inotify_rsync.sh#!/bin/bash
SRC='/data/'
DEST='rsyncuser@192.168.91.101::backup'
inotifywait -mrq --timefmt '%Y-%m-%d %H:%M' --format '%T %w %f' -e attrib,create,delete,moved_to,close_write ${SRC} |while read DATE TIME DIR FILE;do
FILEPATH=${DIR}${FILE}
rsync -az --delete --password-file=/etc/pass $SRC $DEST && echo "At ${TIME} on ${DATE}, file $FILEPATH was backuped up via rsync" >> /var/log/changelist.log
done
​
​
​
#查看文件传输日志
[root@data-centos8 ~]#tail -f /var/log/changelist.log
    #在备份服务器启动 rsync 进程
[root@backup-centos7 ~]#rsync --daemon
Failed to parse config file: /etc/rsyncd.conf
[root@backup-centos7 ~]#touch /etc/rsyncd.conf
[root@backup-centos7 ~]#rsync --daemon
[root@backup-centos7 ~]#ss -ntlp|grep rsync
LISTEN   0         5                   0.0.0.0:873              0.0.0.0:*       users:(("rsync",pid=2921,fd=4))  
LISTEN   0         5                     [::]:873                 [::]:*       users:(("rsync",pid=2921,fd=5))

[root@backup-centos7 ~]#cat /etc/rsyncd.conf
[backup]
path = /data/backup/
read only = no  #指定可读写,默认只读
#指定目录给nobody权限,默认用户以nobody访问此目录
[root@backup-centos7 ~]#setfacl -m u:nobody:rwx /data/backup/
   


#查看rsync服务器的模块名称
[root@data-centos7 ~]#rsync rsync://backup-server
backup
[root@data-centos7 ~]#rsync backup-server::
backup



#访问rsync服务器的共享目录
#推
[root@data-centos7 ~]#rsync /etc/networks   root@192.168.91.101::backup
[root@data-centos7 ~]#rsync /etc/issue     wang@192.168.91.101::backup
[root@data-centos7 ~]#rsync /etc/passwd    192.168.10.20::backup
[root@data-centos7 ~]#rsync /etc/shells   rsync://192.168.10.20/backup
#拉
[root@data-server ~]#rsync   backup-server::backup/* /opt
[root@data-server ~]#rsync   rsync://backup-server/backup/* /mnt