rsync详解之exclude排除文件

 更新时间:2023年03月29日 12:19:15   投稿:mdxy-dxy  
这篇文章详细介绍了rsync之exclude排除文件的实现方法,需要的朋友可以参考下

问题:如何避开同步指定的文件夹? --exclude rsync --exclude files and folders

http://articles.slicehost.com/2007/10/10/rsync-exclude-files-and-folders

很常见的情况:我想同步/下的 /usr /boot/ , 但是不想复制/proc /tmp 这些文件夹
如果想避开某个路径 直接添加--exclude 即可

比如

--exclude “proc”
--exclude ‘sources’

Note: the directory path is relative to the folder you are backing up.

注意:这个路径必须是一个相对路径,不能是绝对路径

例子:源服务器/home/yjwan/bashshell有一个checkout文件夹

[root@CentOS5-4 bashshell]# ls -dl checkout
drwxr-xr-x 2 root root 4096 Aug 21 09:14 checkou

现在想要完全避开复制这个文件夹内容怎么办?

目标服务器执行

rsync -av --exclude “checkout” yjwan@172.16.251.241:/home/yjwan/bashshell /tmp

将不会复制这个文件夹

[root@free /tmp/bashshell]# ls -d /tmp/bashshell/checkout

ls: /tmp/bashshell/checkout: No such file or directory

注意:

1、事实上,系统会把文件和文件夹一视同仁,如果checkout是一个文件,一样不会复制
2 、如果想避开复制checkout里面的内容,可以这么写--exclude “checkout/123”
3 、切记不可写为 --exclude “/checkout”这样绝对路径

这样写 将不会避免checkout被复制

比如

[root@free /tmp/bashshell]# rsync -av --exclude “/checkout” yjwan@172.16.251.241:/home/yjwan/bashshell /tmp
receiving file list … done
bashshell/checkout/

4、可以使用通配符 避开不想复制的内容

比如--exclude “fire*”

那么fire打头的文件或者文件夹全部不会被复制

5、如果想要避开复制的文件过多,可以这么写

--exclude-from=/exclude.list

exclude.list 是一个文件,放置的位置是绝对路径的/exclude.list ,为了避免出问题,最好设置为绝对路径。

里面的内容一定要写为相对路径

比如 我想避开checkout文件夹和fire打头的文件

那么/exclude.list 写为

checkout
fire*

然后执行以下命令,注意写为--exclude-from或者--exclude-from=都可以

但是不能为--exclude

rsync -av --exclude-from=”/exclude.list” yjwan@172.16.251.241:/home/yjwan/bashshell /tmp

检查结果:确实避开了checkout文件夹和fire打头的文件

问题:如何计算对比复制以后的文件数量是否正确呢?

1、查看错误日志,看是否复制时候出问题了
2、在源服务器执行可知道具体文件和文件夹的总个数

ls –AlR|grep “^[-d]”|wc

然后目标服务器在计算一遍个数
看看数字是不是能对的上就ok了
对不上再研究怎么回事

3、现在的问题是:如果我使用了--exclude参数就麻烦了

我怎么知道要复制几个文件?

首先,前面命令时候提到过一种写法,就是只有源地址,没有目标地址的写法,这种写法可以用来列出所有应该被复制的文件
那么用这个命令,可以计算出这个/root/bashshell下面文件和文件夹数量

在服务器端执行

[root@CentOS5-4 bashshell]# rsync -av /root/bashshell/ |grep “^[-d]” | wc
62 310 4249
和ls 得到的结果一致的
[root@CentOS5-4 bashshell]# ls -AlR |grep “^[-d]“|wc
62 558 3731
因此,比如说我不要fire 打头的文件,可以在服务器端先这样计算要复制的文件
[root@CentOS5-4 bashshell]# rsync -av --exclude “fire*” /root/bashshell/ |grep “^[-d]” | wc
44 220 2695
然后复制过去
看目标机器的文件和文件夹数量为
[root@free /tmp]# ls -AlR /tmp/bashshell/ |grep “^[-d]“|wc
44 396 2554
可以知道2者是同步的

问题:Rsync的其他几个常见参数

1、

-z –compress compress file data during the transfer
--compress-level=NUM explicitly set compression level
--skip-compress=LIST skip compressing files with suffix in LIST
压缩传输,如果网络带宽不够,那么应该压缩以后传输,消耗的当然是机器资源,但是如果内网传输的话,文件数量不是很多的话,这个参数不必要的。

2、

--password-file=FILE
前面说过了,只有远端机器是rsync服务器,才能用这个参数
如果你以为个FILE写的是ssh 登陆的密码,那就大错特错了,不少人犯了这个错误。

3、

–stats: Adds a little more output regarding the file transfer status.

4、

–progress: shows the progress of each file transfer. Can be useful to know if you have large files being backup up.

关于这个参数:

I frequently find myself adding the -P option for large transfers. It preserves partial transfers in case of interuption, and gives a progress report on each file as it’s being uploaded.
I move large media files back and forth on my servers, so knowing how long the transfer has remaining is very useful.
•Previous Entry: nginx 每天定时切割Nginx日志的脚本
•Next Entry: 如何开启MySQL的远程帐号

相关文章

  • Visual Studio Code 使用Git进行版本控制(图文教程)

    Visual Studio Code 使用Git进行版本控制(图文教程)

    这篇文章主要介绍了Visual Studio Code 使用Git进行版本控制(图文教程),小编觉得挺不错的,现在分享给大家,也给大家做个参考。一起跟随小编过来看看吧
    2017-11-11
  • 云服务器(Linux)安装部署Kafka的详细过程

    云服务器(Linux)安装部署Kafka的详细过程

    这篇文章主要介绍了云服务器(Linux)安装部署Kafka的详细过程,kafka的安装需要依赖于jdk,需要在服务器上提前安装好该环境,这里使用用jdk1.8,本文给大家详细介绍感兴趣的朋友跟随小编一起看看吧
    2022-11-11
  • http跟https有什么区别

    http跟https有什么区别

    这篇文章主要介绍了http跟https的区别,非常不错,具有参考借鉴价值,需要的朋友参考下吧
    2018-02-02
  • CentOS与Ubuntu哪个更适合做服务器系统

    CentOS与Ubuntu哪个更适合做服务器系统

    对于服务器而言,有两个主流的 Linux 发行版,那就是 CentOS 和 Ubuntu。但如何从这两个之中选择,这是摆在管理员、初学者和专业人士面前的主要问题。在对这两个(和更多)发行版有了一定的经验之后,我们决定对这两个发行版用于服务器时做个比较
    2017-04-04
  • GPU服务器的多用户配置方法

    GPU服务器的多用户配置方法

    这篇文章主要介绍了GPU服务器的多用户配置,主要包括安装ssh,安装 ftp,创建用户组和用户及安装配置 Anaconda的相关知识,需要的朋友可以参考下
    2022-07-07
  • N点主机管理系统重置密码方法(在线修改密码)

    N点主机管理系统重置密码方法(在线修改密码)

    这篇文章主要介绍了N点主机管理系统重置密码方法(在线修改密码),需要的朋友可以参考下
    2015-10-10
  • Apache Hudi结合Flink的亿级数据入湖实践解析

    Apache Hudi结合Flink的亿级数据入湖实践解析

    这篇文章主要为大家介绍了Apache Hudi结合Flink的亿级数据入湖实践解析,有需要的朋友可以借鉴参考下,希望能够有所帮助,祝大家多多进步早日升职加薪
    2022-03-03
  • linux下samba服务器安装配置方法

    linux下samba服务器安装配置方法

    这篇文章主要为大家详细介绍了linux下samba服务器安装配置方法,具有一定的参考价值,感兴趣的小伙伴们可以参考一下
    2018-08-08
  • 解决IntelliJ IDEA maven库下载依赖包速度慢的问题

    解决IntelliJ IDEA maven库下载依赖包速度慢的问题

    下面小编就为大家分享一篇解决IntelliJ IDEA maven库下载依赖包速度慢的问题,具有很好的参考价值。希望对大家有所帮助
    2017-11-11
  • Node启动https服务器的教程

    Node启动https服务器的教程

    这篇文章主要介绍了Node启动https服务器的教程,有node原生版本,express 版本,koa版本,具体各个版本的代码讲解大家参考下本文
    2018-03-03

最新评论