tar是Linux领域的一大利器,尤其是在文件的备份和压缩方面,tar备受青睐。但是,如果要压缩的文件太大,tar的压缩速度就会很慢,同时,被压缩的文件也可能会超过tar的文件大小限制,这时就需要用到tar分卷压缩。
一、 分卷压缩原理
tar分卷压缩是指将一个大文件分成多个小文件,并对这些小文件依次进行压缩,然后打包成一个tar文件。在解压时,再将各个小文件解压缩后合并成原文件。具体的分卷压缩原理如下:
- 分卷:首先将要压缩的文件分成大小相等的若干部分,每个部分大小由用户自定义。分卷压缩时,tar会在文件大小达到指定大小时自动分卷压缩。
- 压缩:对每个分卷进行独立压缩。
- 打包:将压缩后的所有分卷文件打包成一个tar文件。 当解压缩时,tar会自动解压缩每个分卷,最后再将所有的分卷合并成一个完整的文件。
二、 语法格式
tar分卷压缩有两种常用语法格式,它们分别是:
# tar cvpzf backup.tar.gz --exclude=/backup/tmp --exclude=/backup/proc --exclude=/backup/sys /backup/
其中:
c
:表示创建备份文件v
:表示显示备份过程p
:表示保留文件权限和属性z
:表示使用gzip压缩备份文件f
:表示备份文件的路径及名称
# tar -cvf archive.tar file1 file2 ... fileN
其中:
c
:表示创建备份文件v
:表示在压缩时显示进度f
:表示备份文件的路径及名称
三、 实例演示
以下是一个tar分卷压缩的实例演示:
# tar -cvzPf ~/backup.tar.gz ./Documents/ --exclude="./Documents/Cache/" --exclude="./Documents/Trash/"
tar 参数说明:
-c: 建立压缩档案。
-v: 显示压缩的过程。
-f: 指定压缩后的文件名。
-z: 通过gzip命令进行压缩/解压缩,该选项为GNU tar独有。
-P: 保留绝对路径。
--exclude: 排除文件。
上面进行备份的时候,将/home/tom/Documents/
目录备份为~/backup.tar.gz
文件,不过Documents
目录下的Cache
和Trash
目录并没有被备份,通过使用--exclude
参数来达到这个目的。
四、 注意事项
- 分卷大小应先考虑被分卷后能否存放在指定的介质上。
- tar分卷压缩的文件名格式为:
file.tar.gz.001
、file.tar.gz.002
、......、file.tar.gz.NNN
。 - 在解压分卷文件时,只需指定其中一个分卷的文件名,tar会自动找到所有的分卷文件。
- tar分卷压缩不支持增量备份,每次备份都需要重新备份整个文件。
- tar分卷压缩适用于单个文件过大的情况,如果需要处理的是多个小文件,可以考虑使用zip或rar等压缩格式。
五、 总结
通过本文的介绍,相信大家对tar分卷压缩有了更深入的了解。在实际的开发中,根据具体情况选取不同的压缩格式和方法,能够更好的提高开发效率和数据安全性。