Linux tar命令高級用法——備份數據
Linux上有功能強大的tar命令,tar最初是為了制作磁帶備份(tape archive)而設計的,它的作用是把文件和目錄備份到磁帶中,然后從磁帶中提取或恢復文件。現在我們可以使用tar來備份數據到任何存儲介質上。它是文件級備份,不必考慮底層文件系統類別,并且支持增量備份。
?
1.部分常用選項
?
●-z, --gzip:使用gzip工具(解)壓縮,后綴一般為.gz
●-c, --create:tar打包,后綴一般為.tar
●-f, --file=:后面立刻接打包或壓縮后得到的文件名
●-x, --extract:解包命令,與-c對應
●-p:保留備份數據的原本權限和屬性
?
●-g:后接增量備份的快照文件
●-C:指定解壓縮的目錄
●--exclude:排除不打包的目錄或文件,支持正則匹配
?
其他
?
●-X, --exclude-from:在一個文件中列出要排除的目錄或文件(在--exclude=較多時使用)
●-t, --list:列出備份檔案中的文件列表,不與-c、-x同時出現
●-j, --bzip2:使用bzip2工具(解)壓縮,后綴一般為.bz2
●-P:保留絕對路徑,解壓時同樣會自動解壓到絕對路徑下
●-v:(解)壓縮過程顯示文件處理過程,常用但不建議對大型文件使用
?
2.增量備份(網站)數據
?
許多系統(應用或網站)每天都有靜態文件產生,對于一些比較重要的靜態文件如果有進行定期備份的需求,就可以通過tar打包壓縮備份到指定的地方,特別是對一些總文件比較大比較多的情況,還可以利用-g選項來做增量備份。
?
備份的目錄最好使用相對路徑,也就是進入到需要備份的根目錄下
?
具體示例方法如下。
備份當前目錄下的所有文件
# tar -g /tmp/snapshot_data.snap -zcpf /tmp/data01.tar.gz .
在需要恢復的目錄下解壓恢復
# tar -zxpf /tmp/data01.tar.gz -C .
-g選項可以理解備份時給目錄文件做一個快照,記錄權限和屬性等信息,第一次備份時/tmp/snapshot_data.snap不存在,會新建一個并做完全備份。當目錄下的文件有修改后,再次執行第一條備份命令(記得修改后面的檔案文件名),會自動根據-g指定的快照文件,增量備份修改過的文件,包括權限和屬性,沒有動過的文件不會重復備份。
?
另外需要注意上面的恢復,是“保留恢復”,即存在相同文件名的文件會被覆蓋,而原目錄下已存在(但備份檔案里沒有)的,會依然保留。所以如果你想完全恢復到與備份文件一模一樣,需要清空原目錄。如果有增量備份檔案,則還需要使用同樣的方式分別解壓這些檔案,而且要注意順序。
?
下面演示一個比較綜合的例子,要求:
?
●備份/tmp/data目錄,但cache目錄以及臨時文件排除在外
●由于目錄比較大(>4G),所以全備時分割備份的檔案(如每個備份檔案文件最大1G)
●保留所有文件的權限和屬性,如用戶組和讀寫權限
# cd /tmp/data
做一次完全備份
# rm -f /tmp/snapshot_data.snap
# tar -g /tmp/snapshot_data.snap -zcpf - --exclude=./cache ./ | split -b 1024M - /tmp/bak_data$(date -I).tar.gz_
分割后文件名后會依次加上aa,ab,ac,...,上面最終的備份歸檔會保存成
bak_data2014-12-07.tar.gz_aa
bak_data2014-12-07.tar.gz_ab
bak_data2014-12-07.tar.gz_ac
...
增量備份
可以是與完全備份一模一樣的命令,但需要注意的是假如你一天備份多次,可能導致檔案文件名重復,那么就會導致
備份實現,因為split依然會從aa,ab開始命名,如果一天的文件產生(修改)量不是特別大,那么建議增量部分不
分割處理了:( 一定要分割的話,文件名加入更細致的時間如$(date +%Y-%m-%d_%H) )
# tar -g /tmp/snapshot_data.snap -zcpf /tmp/bak_data2014-12-07.tar.gz --exclude=./cache ./
第二天增備
# tar -g /tmp/snapshot_data.snap -zcpf /tmp/bak_data2014-12-08.tar.gz --exclude=./cache ./
恢復過程
恢復完全備份的檔案文件
可以選擇是否先清空/tmp/data/目錄
# cat /tmp/bak_data2014-12-07.tar.gz_* | tar -zxpf - -C /tmp/data/
恢復增量備份的檔案文件
$ tar –zxpf /tmp/bak_data2014-12-07.tar.gz -C /tmp/data/
$ tar –zxpf /tmp/bak_data2014-12-08.tar.gz -C /tmp/data/
...
一定要保證是按時間順序恢復的,像下面文件名規則也可以使用上面通配符的形式
如果需要定期備份,如每周一次全備,每天一次增量備份,則可以結合crontab實現。
?
3.備份文件系統
?
備份文件系統方法有很多,例如cpio, rsync, dump, tar,這里演示一個通過tar備份整個Linux系統的例子,整個備份與恢復過程與上面類似。
?
首先Linux(這里是CentOS)有一部分目錄是沒必要備份的,如/proc、/lost+found、/sys、/mnt、/media、/dev、/proc、/tmp,如果是備份到磁帶/dev/st0則不必關心那么多,因為我這里是備份到本地/backup目錄,所以也需要排除,還有其它一些NFS或者網絡存儲掛載的目錄。
創建排除列表文件
# vi /backup/backup_tar_exclude.list
/backup
/proc
/lost+found
/sys
/mnt
/media
/dev
/tmp
$ tar -zcpf /backup/backup_full.tar.gz -g /backup/tar_snapshot.snap --exclude-from=/backup/tar_exclude.list /
4.注意
?
使用tar無論是備份數據還是文件系統,需要考慮是在原系統上恢復還是另一個新的系統上恢復。
?
●tar備份極度依賴于文件的atime屬性,
●文件所屬用戶是根據用戶ID來確定的,異機恢復需要考慮相同用戶擁有相同USERID
●備份和恢復的過程盡量不要運行其他進程,可能會導致數據不一致
●軟硬連接文件可以正常恢復
?
來自:Sean's Notes 小樣兒の部落閣
鏈接:http://seanlook.com/2014/12/08/tar_backup_filesystem/