Linux tar命令高級用法——備份數據

Linux tar命令高級用法——備份數據

2015-12-31?Linux學習

Linux上有功能強大的tar命令,tar最初是為了制作磁帶備份(tape archive)而設計的,它的作用是把文件和目錄備份到磁帶中,然后從磁帶中提取或恢復文件。現在我們可以使用tar來備份數據到任何存儲介質上。它是文件級備份,不必考慮底層文件系統類別,并且支持增量備份。

?

1.部分常用選項

?

●-z, --gzip:使用gzip工具(解)壓縮,后綴一般為.gz

-c, --create:tar打包,后綴一般為.tar

-f, --file=:后面立刻接打包或壓縮后得到的文件名

-x, --extract:解包命令,與-c對應

●-p:保留備份數據的原本權限和屬性

?

-g:后接增量備份的快照文件

-C:指定解壓縮的目錄

--exclude:排除不打包的目錄或文件,支持正則匹配

?

其他

?

-X, --exclude-from:在一個文件中列出要排除的目錄或文件(在--exclude=較多時使用)

-t, --list:列出備份檔案中的文件列表,不與-c、-x同時出現

-j, --bzip2:使用bzip2工具(解)壓縮,后綴一般為.bz2

-P:保留絕對路徑,解壓時同樣會自動解壓到絕對路徑下

-v:(解)壓縮過程顯示文件處理過程,常用但不建議對大型文件使用

?

2.增量備份(網站)數據

?

許多系統(應用或網站)每天都有靜態文件產生,對于一些比較重要的靜態文件如果有進行定期備份的需求,就可以通過tar打包壓縮備份到指定的地方,特別是對一些總文件比較大比較多的情況,還可以利用-g選項來做增量備份。

?

備份的目錄最好使用相對路徑,也就是進入到需要備份的根目錄下

?

具體示例方法如下。

備份當前目錄下的所有文件

# tar -g /tmp/snapshot_data.snap -zcpf /tmp/data01.tar.gz .

在需要恢復的目錄下解壓恢復

# tar -zxpf /tmp/data01.tar.gz -C .

-g選項可以理解備份時給目錄文件做一個快照,記錄權限和屬性等信息,第一次備份時/tmp/snapshot_data.snap不存在,會新建一個并做完全備份。當目錄下的文件有修改后,再次執行第一條備份命令(記得修改后面的檔案文件名),會自動根據-g指定的快照文件,增量備份修改過的文件,包括權限和屬性,沒有動過的文件不會重復備份。

?

另外需要注意上面的恢復,是“保留恢復”,即存在相同文件名的文件會被覆蓋,而原目錄下已存在(但備份檔案里沒有)的,會依然保留。所以如果你想完全恢復到與備份文件一模一樣,需要清空原目錄。如果有增量備份檔案,則還需要使用同樣的方式分別解壓這些檔案,而且要注意順序。

?

下面演示一個比較綜合的例子,要求:

?

●備份/tmp/data目錄,但cache目錄以及臨時文件排除在外

●由于目錄比較大(>4G),所以全備時分割備份的檔案(如每個備份檔案文件最大1G)

●保留所有文件的權限和屬性,如用戶組和讀寫權限

# cd /tmp/data

做一次完全備份

# rm -f /tmp/snapshot_data.snap

# tar -g /tmp/snapshot_data.snap -zcpf - --exclude=./cache ./ | split -b 1024M - /tmp/bak_data$(date -I).tar.gz_

分割后文件名后會依次加上aa,ab,ac,...,上面最終的備份歸檔會保存成

bak_data2014-12-07.tar.gz_aa

bak_data2014-12-07.tar.gz_ab

bak_data2014-12-07.tar.gz_ac

...

增量備份

可以是與完全備份一模一樣的命令,但需要注意的是假如你一天備份多次,可能導致檔案文件名重復,那么就會導致

備份實現,因為split依然會從aa,ab開始命名,如果一天的文件產生(修改)量不是特別大,那么建議增量部分不

分割處理了:( 一定要分割的話,文件名加入更細致的時間如$(date +%Y-%m-%d_%H) )

# tar -g /tmp/snapshot_data.snap -zcpf /tmp/bak_data2014-12-07.tar.gz --exclude=./cache ./

第二天增備

# tar -g /tmp/snapshot_data.snap -zcpf /tmp/bak_data2014-12-08.tar.gz --exclude=./cache ./

恢復過程

恢復完全備份的檔案文件

可以選擇是否先清空/tmp/data/目錄

# cat /tmp/bak_data2014-12-07.tar.gz_* | tar -zxpf - -C /tmp/data/

恢復增量備份的檔案文件

$ tar –zxpf /tmp/bak_data2014-12-07.tar.gz -C /tmp/data/

$ tar –zxpf /tmp/bak_data2014-12-08.tar.gz -C /tmp/data/

...

一定要保證是按時間順序恢復的,像下面文件名規則也可以使用上面通配符的形式

如果需要定期備份,如每周一次全備,每天一次增量備份,則可以結合crontab實現。

?

3.備份文件系統

?

備份文件系統方法有很多,例如cpio, rsync, dump, tar,這里演示一個通過tar備份整個Linux系統的例子,整個備份與恢復過程與上面類似。

?

首先Linux(這里是CentOS)有一部分目錄是沒必要備份的,如/proc、/lost+found、/sys、/mnt、/media、/dev、/proc、/tmp,如果是備份到磁帶/dev/st0則不必關心那么多,因為我這里是備份到本地/backup目錄,所以也需要排除,還有其它一些NFS或者網絡存儲掛載的目錄。

創建排除列表文件

# vi /backup/backup_tar_exclude.list

/backup

/proc

/lost+found

/sys

/mnt

/media

/dev

/tmp

$ tar -zcpf /backup/backup_full.tar.gz -g /backup/tar_snapshot.snap --exclude-from=/backup/tar_exclude.list /

4.注意

?

使用tar無論是備份數據還是文件系統,需要考慮是在原系統上恢復還是另一個新的系統上恢復。

?

●tar備份極度依賴于文件的atime屬性,

●文件所屬用戶是根據用戶ID來確定的,異機恢復需要考慮相同用戶擁有相同USERID

●備份和恢復的過程盡量不要運行其他進程,可能會導致數據不一致

●軟硬連接文件可以正常恢復

?

來自:Sean's Notes 小樣兒の部落閣

鏈接:http://seanlook.com/2014/12/08/tar_backup_filesystem/

轉載于:https://www.cnblogs.com/chenjw-note/p/5909034.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/457219.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/457219.shtml
英文地址,請注明出處:http://en.pswp.cn/news/457219.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

iOS uiviewcontroller 添加另外一個controller的View

需要 添加 [self addChildViewController:vc]; [_mainScrollView addSubview:vc.view];轉載于:https://www.cnblogs.com/foolish-guo/p/6385288.html

mysql 即學a又學b_MySQL學習第一天

一、 數據庫:*學習重點:創建數據庫/向表添加記錄/查詢記錄數據庫概念:文件系統(存儲和管理)數據庫軟件介紹:Oracle/MySQL/SQL server…分類:關系型數據庫:關系模型組織數據非關系型數據庫:鍵值對關系存儲二、 mysql數據的存儲方式:一臺數據庫服務器中會創建很多個數據庫(一個項…

Intellij IDEA 快捷鍵(Mac)

編輯 格式化代碼 AltCommandL 大小寫切換 ShiftCommandU 包圍 AltCommandT 選中代碼抽取方法 AltCommandM 調試/運行查看 類關系視圖 CommandAltU 查看所有的 TODO Command6 查詢方法調用處 AltF7 搜索其它 隱藏 Intellij IDEA CommandH 自動提醒 Alt/(這是我自己設置的)…

Spark RDD算子介紹

Spark學習筆記總結 01. Spark基礎 1. 介紹 Spark可以用于批處理、交互式查詢(Spark SQL)、實時流處理(Spark Streaming)、機器學習(Spark MLlib)和圖計算(GraphX)。 Spark是MapReduc…

java 寫tb級文件_三管齊下!TB 級文件的上傳性能瞬間被優化 100 倍!

作者 | 中華石杉責編 | 伍杏玲本文經授權轉載石杉的架構筆記(ID:shishan100)這篇文章我們來看看,世界上最優秀的分布式文件系統HDFS,是如何對超大文件的上傳做性能優化的?首先,我們還是通過一張圖來看一下文件上傳的大…

CentOS7下安裝Redis — 單節點

2019獨角獸企業重金招聘Python工程師標準>>> 1. 環境準備 安裝編譯所需要的包: yum install gcc tcl 2. 下載redis http://download.redis.io/releases/redis-3.2.7.tar.gz 3. 安裝redis ## 創建redis的安裝目錄 mkdir /usr/local/redis## 解壓redis tar…

筆記本中美化代碼的方法

這里向大家推薦一個很好用的記筆記軟件,微軟的OneNote,這個筆記軟件,支持分區和分區組的創建,而且入門簡單,界面簡潔,很適合從word過渡過來的人來記筆記! 不過如果直接記筆記,對于程序員來說,可能希望代碼在筆記本上更好看一些,那么應該怎么辦呢?下面提供了在OneNote中,讓代碼…

工具使用——印象(匯總)

作者:桂。 時間:2017-02-09 23:11:30 鏈接:http://www.cnblogs.com/xingshansi/articles/6384097.html 說明:轉載請注明出處,謝謝。 前言 本文僅僅介紹印象筆記的使用,至于挖掘機哪家強,本文不…

java final修飾屬性_Java final關鍵字用來修飾類、方法、屬性

1.final修飾類:這個類不能被繼承。如:String類、StringBuffer類、System類。2.final修飾方法:不能被重寫。如:Object類的getClass()方法。3.final修飾屬性:此屬性就是一個常量,一旦初始化就不可再被賦值。習…

SQL SERVER 數據導出JSON

執行下面的存儲過程: SET ANSI_NULLS ONGOSET QUOTED_IDENTIFIER ONGOCREATE PROCEDURE[dbo].[SerializeJSON](ParameterSQL AS VARCHAR(MAX))ASBEGINDECLARE SQL NVARCHAR(MAX)DECLARE XMLString VARCHAR(MAX)DECLARE XML XMLDECLARE Paramlist NVARCHAR(1000)SET …

JSP+Javabean+Servlet實現用戶注冊

在entity包下新建javabean 也就是實體類User 注意id用 Integer 而不用 int, 因為 int 自動初始化為0 public class User { private Integer id; private String username; private String password; 后面是set和get方法... 在Servlet包下創建servlet 右擊Servlet…

main的方法是Java_Java中的main()方法

在Java中,main()方法是Java應用程序的入口方法,也就是說,程序在運行的時候,第一個執行的方法就是main()方法,這個方法和其他的方法有很大的不同,比如方法的名字必須是main,方法必須是public sta…

深入理解Python的logging模塊:從基礎到高級

在Python編程中,日志記錄是一種重要的調試和錯誤追蹤工具。Python的logging模塊提供了一種靈活的框架,用于發出日志消息,這些消息可以被發送到各種輸出源,如控制臺、文件、HTTP GET/POST位置等。本文將深入探討Python的logging模塊…

http請求連接

1、在Info.plist中添加NSAppTransportSecurity類型Dictionary。2、在NSAppTransportSecurity下添加NSAllowsArbitraryLoads類型Boolean,值設為YES轉載于:https://www.cnblogs.com/liuting-1204/p/5919233.html

數據庫不完全恢復 以及恢復到測試環境:

sample 1: 1.清空歸檔日志 RMAN> crosscheck archivelog all; RMAN> delete achivelog all; 2.清空數據文件。 select name from v$datafile; rm v$datafile 3.恢復數據 ##check file date: ##把db數據恢復到:2017-02-05 00:00:00 ls -lt /ngenprdblog/ ls…

centos7安裝java6_CentOS7.6安裝jdk1.8

2、登錄Linux服務器,通過rz命令將jdk導入服務器如果沒有rz命令 需要先安裝lrzszyum install lrzsz -y3、將jdk壓縮包解壓到指定路徑 -C 指定路徑4、配置環境變量編輯/etc/profile文件 在末尾加上以下內容 wq保存退出source /etc/profile文件 使配置文件生效export J…

ubuntu安裝wkhtmltopdf

下載安裝wkhtmltox系統環境 http://wkhtmltopdf.org/downloads.html wget https://bitbucket.org/wkhtmltopdf/wkhtmltopdf/downloads/wkhtmltox-0.13.0-alpha-7b36694_linux-precise-amd64.deb dpkg -i 安裝包名字 當我把它生成pdf的時候我想讓每個塊都是一頁,經過…

人生苦短,我用python——當我在玩python的時候我玩些什么 -

程序的基本思路 用一個txt文件記錄電腦的一天內累計使用時間累計使用時間超過若干小時就會自動關機程序開機自動運行 為什么我最后選擇了python 想著怎么寫、搜資料的時候就發現Java并不適合,雖然不是不能實現,但有好幾個問題解決起來都有點麻煩。對我這…

IO流的練習5 —— 讀取文件中的字符串,排序后寫入另一文件中

需求:已知s.txt文件中有這樣的一個字符串:“hcexfgijkamdnoqrzstuvwybpl”     請編寫程序讀取數據內容,把數據排序后寫入ss.txt中。分析:   A:讀取文件中的數據   B:把數據存在一個字符串中   C…

java解析未知key json_Gson解析JSON中動態未知字段key的方法

前面一篇文章我介紹了Gson的解析的基本方法。但我們在享受Gson解析的高度封裝帶來的便利時,有時可能會遇到一些特殊情況,比如json數據中的字段key是動態可變的時候,由于Gson是使用靜態注解的方式來設置實體對象的,因此我們很難直接…