Day44-sersync企业实时复制实战
- 1. sersync实时复制工具介绍
- 1.1 sersync工具简介
- 1.2 sersync特点
- 1.3 sersync图解原理
- 1.4 sersync+rsync实时复制方案项目实践
- 1.4.1 图解项目方案架构及实现原理
- 1.4.2 确保远程数据传输服务部署完成
- 1.4.3 检查当前系统nfs01是否支持inotify实时监控
- 1.4.4 在nfs01安装配置sersync
- 1.4.5 解压配置
- 1.4.6 配置文件讲解及修改配置
- 1.4.7 启动sersync
- 1.4.8 配置:systemctl start sersync启动方案
- 2. 企业案例
- 2.1 问题一
- 2.2 大型企业级高并发文件实时复制方案
- 2.3 企业级解决 NFS 存储实时复制案例
- 2.4 更多网站后端存储解决方案
- 3. rsync多实例
1. sersync实时复制工具介绍
1.1 sersync工具简介
Sersync项目利用inotify与rsync技术实现对服务器数据实时复制的解决方案,其中inotify用于监控sersync所在服务器上文件系统的事件变化,当事件发生变化时就调用rsync命令将变化的数据复制到远端服务器上。
1.2 sersync特点
sersync项目特点是:
- 使用c++编写,支持对监控的事件过滤功能。
- sersync采用xml配置文件,然后由守护进程启动,配置起来比inotify-tools更简单。
- 使用多线程进行复制,即可以并发复制多个不同文件。
- sersync自带出错处理机制,通过失败队列对出错的文件重新复制。
- sersync自带crontab功能,可实现对失败队列中的文件定时整体复制。
- sersync自带socket与http的协议扩展,可以满足有特殊需求的公司二次开发。
1.3 sersync图解原理
如上图所示:
1、inotify监控指定目录对应事件的变化,当有事件变化时进入事件过滤队列。
2、过滤队列负责过滤不需要复制的数据,也可以过滤短时间内产生的重复inotify事件信息,过滤过的事件触发rsync对变化数据执行复制。
3、图中线程组线程是等待线程队列的守护线程,当事件队列中有事件产生的时候,线程组守护线程就会逐个唤醒复制线程,当队列中inotify事件较多的时候,复制线程就会被全部唤醒一起工作提升复制的效率。
4、除了线程组线程外,还有sersync服务线程,负责处理复制失败的文件,将他们再次复制,对于再次复制失败的文件(命令)记录到rsync_fail_log.sh 脚本,然后定期在执行脚本,同时利用自带的cron功能,实现每隔一定时间,将所有未复制的数据在进行整体复制。
1.4 sersync+rsync实时复制方案项目实践
1.4.1 图解项目方案架构及实现原理
1.4.2 确保远程数据传输服务部署完成
大前提rsyncdaemon服务配置成功,可以在rsync客户端推送拉取数据,然后才能配置inotify服务。
确保已经配置好rsync服务,并且能在客户端推送和拉取数据信息:
rsync -avz /data rsync_backup@172.16.1.41::backup --password-file=/etc/rsync.password
1.4.3 检查当前系统nfs01是否支持inotify实时监控
通过检查/proc/sys/fs/inotify目中是否存在以下三个文件,可以确认系统是否支持实时监控程序。
[root@nfs01 ~]# uname -r
3.10.0-957.1.3.el7.x86_64 #<==内核是3.10,支持inotify机制。
[root@nfs01 ~]# ls -l /proc/sys/fs/inotify/
total 0
-rw-r--r--. 1 root root 0 Apr 14 18:54 max_queued_events
-rw-r--r--. 1 root root 0 Apr 14 18:54 max_user_instances
-rw-r--r--. 1 root root 0 Apr 14 18:54 max_user_watches
1.4.4 在nfs01安装配置sersync
mkdir /server/tools
cd /server/tools
wget https://github.com/wsgzao/sersync/blob/master/sersync2.5.4_64bit_binary_stable_final.tar.gz
1.4.5 解压配置
[root@nfs01 tools]# tar xf sersync_oldboy_64bit_20160928.tar.gz
sersync_oldboy_64bit_20160928.tar.gz
[root@nfs01 tools]# tree application/
application/
└── sersync
├── bin
│ └── sersync
├── conf
│ ├── confxml.xml
│ └── confxml.xml.ori
├── logs
│ └── rsync_fail_log.sh
└── readme.txt
[root@nfs01 tools]# mv application /
[root@nfs01 tools]# tree /application/
/application/
└── sersync
├── bin
│ └── sersync
├── conf
│ ├── confxml.xml
│ └── confxml.xml.ori
├── logs
│ └── rsync_fail_log.sh
└── readme.txt
4 directories, 5 files
1.4.6 配置文件讲解及修改配置
请对比新老配置查看修改的内容
sersync配置文件:干两件事:
1)完成监控配置:
inotifywait -mrq -e createFolder,close_write,delete,moveFrom,moveTo /data
2)完整命令拼接:
rsync -avz /data rsync_backup@172.16.1.41::backup --password-file=/etc/rsync.password
1.4.7 启动sersync
[root@nfs01 /application/sersync/conf]# ../bin/sersync -h
set the system param
execute:echo 50000000 > /proc/sys/fs/inotify/max_user_watches
execute:echo 327679 > /proc/sys/fs/inotify/max_queued_events
parse the command param
_______________________________________________________
参数-d:启用守护进程模式
参数-r:在监控前,将监控目录与远程主机用rsync命令推送一遍
c参数-n: 指定开启守护线程的数量,默认为10个
参数-o:指定配置文件,默认使用confxml.xml文件
参数-m:单独启用其他模块,使用 -m refreshCDN 开启刷新CDN模块
参数-m:单独启用其他模块,使用 -m socket 开启socket模块
参数-m:单独启用其他模块,使用 -m http 开启http模块
不加-m参数,则默认执行同步程序
________________________________________________________________
[root@nfs01 conf]# echo 50000000 > /proc/sys/fs/inotify/max_user_watches
[root@nfs01 conf]# echo 327679 > /proc/sys/fs/inotify/max_queued_events
[root@nfs01 conf]# /application/sersync/bin/sersync -r -o /application/sersync/conf/confxml.xml -d
cd /data && rsync -artuz -R --delete ./ --timeout=100 rsync_backup@172.16.1.41::backup --password-file=/etc/rsync.password >/dev/null 2>&1
[root@nfs01 ~]# pstree -a -p 1918
sersync,1918 -r -o /application/sersync/conf/confxml.xml -d
├─{sersync},1924
├─{sersync},1925
├─{sersync},1926
├─{sersync},1927
├─{sersync},1928
├─{sersync},1929
├─{sersync},1930
├─{sersync},1931
├─{sersync},1932
├─{sersync},1933
└─{sersync},1934
#同步过程
rsync -artuz -R --timeout=100 ./548.txt rsync_backup@172.16.1.41::oldboy --password-file=/etc/sync.password
root 5764 5760 0 11:00 ? 00:00:00 rsync -artuz -R --timeout=100 ./548.txt rsync_backup@172.16.1.41::backup --password-file=/etc/sync.password
root 5765 1918 0 11:00 ? 00:00:00 sh -c cd /data && rsync -artuz -R --timeout=100 "./549.txt" rsync_backup@172.16.1.41::oldboy --password-file=/etc/rsync.password >/dev/null 2>&1
root 5766 1918 0 11:00 ? 00:00:00 sh -c cd /data && rsync -artuz -R --timeout=100 "./549.txt" rsync_backup@172.16.1.41::backup --password-file=/etc/rsync.password >/dev/null 2>&1
root 5767 5765 0 11:00 ? 00:00:00 rsync -artuz -R --timeout=100 ./549.txt rsync_backup@172.16.1.41::oldboy --password-file=/etc/sync.password
root 5768 5766 0 11:00 ? 00:00:00 rsync -artuz -R --timeout=100 ./549.txt rsync_backup@172.16.1.41::backup --password-file=/etc/sync.password
root 5771 1918 0 11:00 ? 00:00:00 sh -c cd /data && rsync -artuz -R --timeout=100 "./550.txt" rsync_backup@172.16.1.41::oldboy --password-file=/etc/rsync.password >/dev/null 2>&1
root 5772 1918 0 11:00 ? 00:00:00 sh -c cd /data && rsync -artuz -R --timeout=100 "./550.txt" rsync_backup@172.16.1.41::backup --password-file=/etc/rsync.password >/dev/null 2>&1
root 5773 5771 0 11:00 ? 00:00:00 rsync -artuz -R --timeout=100 ./550.txt rsync_backup@172.16.1.41::oldboy --password-file=/etc/sync.password
root 5774 5772 0 11:00 ? 00:00:00 rsync -artuz -R --timeout=100 ./550.txt rsync_backup@172.16.1.41::backup --password-file=/etc/sync.password
root 5778 2254 0 11:00 pts/0 00:00:00 grep --color=auto sync
root 5779 1918 0 11:00 ? 00:00:00 sh -c cd /data && rsync -artuz -R --timeout=1
最终
/application/sersync/bin/sersync -d
pkill sersync
二进制程序,不是yum安装的,所以不能systemctl start sersync
1.4.8 配置:systemctl start sersync启动方案
https://blog.51cto.com/oldboy/2155931
[root@nfs01 /data]# tail -1 /etc/rc.local
/application/sersync/bin/sersync -d
配置:systemctl start sersync启动方案
https://blog.51cto.com/oldboy/2155931
[root@nfs01 /data]# cat /etc/rc.d/init.d/sersync
#!/bin/bash
# chkconf
# ig: 2345 21 81
# description: rsync service start and stop scripts
# Author: oldboy
# Organization: www.oldboyedu.com
start(){
/application/sersync/bin/sersync -d -o /application/sersync/conf/confxml.xml &>/dev/null
}
stop(){
killall sersync 2>/dev/null
}
case "$1" in
start)
start
;;
stop)
stop
;;
restart)
stop
sleep 2
start
;;
*)
echo $"Usage:$0 {start|stop|restart}"
exit 1
esac
练习脚本启动:
chmod +x /etc/rc.d/init.d/sersync
/etc/init.d/sersync stop
ps -ef|grep sync
/etc/init.d/sersync start
ps -ef|grep sync
写一个启动脚本:使用service sersyc start/stop启动停止。
解答:
/etc/init.d/sersync start
/etc/init.d/sersync stop
[root@nfs01 /data]# cat /etc/rc.d/init.d/sersync
#!/bin/bash
# chkconfig: 2345 21 81 ###实现开机启动顺序以及在哪些级别上开机启动。
# description: rsync service start and stop scripts
service sersync stop/start
C7:
[root@nfs01 /data]# cat /usr/lib/systemd/system/sersync.service
[Unit]
Description=sersyncd service
After=network.target
[Service]
Type=forking
ExecStart=/etc/rc.d/init.d/sersync start
ExecReload=/etc/rc.d/init.d/sersync restart
ExecStop=/etc/rc.d/init.d/sersync stop
PrivateTmp=true
[Install]
WantedBy=multi-user.target
chmod +x /usr/lib/systemd/system/sersync.service
[root@nfs01 /data]# systemctl enable sersync.service
Created symlink from /etc/systemd/system/multi-user.target.wants/sersync.service to /usr/lib/systemd/system/sersync.service.
[root@nfs01 /data]# systemctl status sersync.service
● sersync.service - sersyncd service
Loaded: loaded (/usr/lib/systemd/system/sersync.service; enabled; vendor preset: disabled)
Active: inactive (dead)
[root@nfs01 /data]# systemctl stop sersync
[root@nfs01 /data]# ps -ef|grep sersync|grep -v grep
[root@nfs01 /data]# systemctl start sersync
2. 企业案例
2.1 问题一
挂载的盘有将近24t,里面有200G数据,都是tomcat用到的数据,nfs服务器磁盘容量是24t,tomcat服务器里面跑着4个tomcat服务,他们昨天通过jenkins部署代码,控制台输出信息是超时,在排查时,发现tomcat服务器虽然现实挂载nfs服务器的24t硬盘,但是往里面无法写数据,ls就是夯住没反应,后来是重新挂载才解决的,但是有时候就是莫名其妙的夯住。
分析:
- 数据是太大。
- 挂载参数有问题。
- 网络连接不稳定,
- 服务器压力大
- 架构错误(站点目录挂载NFS上了),这样不行。
解决办法:
- 还用NFS,但要调整架构,例如动静分离、读写分离。
- 更换分布式文件系统
- 注意CDN的使用,看看命中率,想法提高命中。
- 还可以弃用NFS,读取本地方案,
2.2 大型企业级高并发文件实时复制方案
除了本文讲解的数据实时复制方案外,其实,企业运维工作中还有很多的方案,例如:
- inotify(sersync)+rsync复制方案是文件级别的复制,优点:简单、易用,缺点:速度不快。
- drbd复制方案是文件系统级别复制,基于block块进行复制,优点:速度快,缺点:主节点工作时,备节点数据处于不可使用状态。
- 借用第三方软件的复制功能复制文件:例如:mysql复制(主从复制),oracle,mongodb自身的复制工具。
- 在业务上开发程序双写不同的服务器,即直接写两台服务器。
- 应用服务器写一台,在写日志(消息队列),利用异步方式复制。
对于复制延迟的问题,可以利用产品业务逻辑解决(例如:读写分离,备读不到读主)。
2.3 企业级解决 NFS 存储实时复制案例
- 有些网友觉得NFS性能不高,其实在共享存储时,可以使用读写分离的方案,即用户上传时把文件传到NFS上,这部分写的并发要比读小很多,可能写读比只有 1:20。
- 然后借用 inotify(sersync)+rsync方案把NFS上数据实时复制到Web服务器本地(静态服务器)
- Web 服务直接读本地的目录实时复制过来的文件,如果本地没有,再去NFS共享上读文件,缓解延迟带来的问题。
- 经过实测,inotify(sersync)+rsync方案单进程多线程可以处理并发200个100K左右的文件,而不会延迟,当然还可以开多进程,拆分监控不同的二级目录。
2.4 更多网站后端存储解决方案
- 使用CDN加速以及内网搭建文件缓存服务(squid,nginx,varnish)减轻存储压力。
- 把多个文件目录分配到不同的NFS服务器上,相当于把NFS服务器拆分多台。
- 弃用NFS方案
- 使用分布式文件系统(例如:FastDFS、Mfs)
3. rsync多实例
rsync --config=/etc/rsyncd01.conf --daemon #用于nfs实时复制
rsync --config=/etc/rsyncd02.conf --daemon #用于定时备份
通过指定配置文件参数
--config=FILE specify alternate rsyncd.conf file
建议:不推荐
最佳方法:把www uid和rsync一样。
[root@backup ~]# cat /etc/rsyncd.conf
#rsync_config_______________start
#created by oldboy
#site: http://www.oldboyedu.com
uid = rsync
gid = rsync
use chroot = no
fake super = yes
max connections = 200
timeout = 600
pid file = /var/run/rsyncd.pid
lock file = /var/run/rsync.lock
log file = /var/log/rsyncd.log
ignore errors
read only = false
list = true
hosts allow = 172.16.1.0/24
hosts deny = 0.0.0.0/32
auth users = rsync_backup
secrets file = /etc/rsync.password
[backup]
comment = 所有服务器定时任务备份
path = /backup/
[data]
uid = www
gid = www
comment = 存储NFS实时复制数据
path = /data/