sed教程入門與實例練習(一)

UNIX 世界中有很多文本編輯器可供我們選擇。思考一下 — vi、emacs 和 jed 以及很多其它工具都會浮現在腦海中。我們都有自己已逐漸了解并且喜愛的編輯器(以及我們喜愛的組合鍵)。有了可信賴的編輯器,我們可以輕松處理任何數量與 UNIX 有關的管理或編程任務。

雖然交互式編輯器很棒,但卻有其限制。盡管其交互式特性可以成為強項,但也有其不足之處。考慮一下需要對一組文件執行類似更改的情形。您可能會本能地運行自己所喜愛的編輯器,然后手工執行一組煩瑣、重復和耗時的編輯任務。然而,有一種更好的方法。

進入 sed
如果可以使編輯文件的過程自動化,以便用“批處理”方式編輯文件,甚至編寫可以對現有文件進行復雜更改的腳本,那將太好了。幸運的是,對于這種情況,有一種更好的方法 — 這種更好的方法稱為 “sed”。

sed 是一種幾乎包括在所有 UNIX 平臺(包括 Linux)的輕量級流編輯器。sed 有許多很好的特性。首先,它相當小巧,通常要比您所喜愛的腳本語言小很多倍。其次,因為 sed 是一種流編輯器,所以,它可以對從如管道這樣的標準輸入接收的數據進行編輯。因此,無需將要編輯的數據存儲在磁盤上的文件中。因為可以輕易將數據管道輸出到 sed,所以,將 sed 用作強大的 shell 腳本中長而復雜的管道很容易。試一下用您所喜愛的編輯器去那樣做。

GNU sed
對 Linux 用戶來說幸運的是,最好的 sed 版本之一恰好是 GNU sed,其當前版本是 3.02。每一個 Linux 發行版都有(或至少應該有)GNU sed。GNU sed 之所以流行不僅因為可以自由分發其源代碼,還因為它恰巧有許多對 POSIX sed 標準便利、省時的擴展。另外,GNU 沒有 sed 早期專門版本的很多限制,如行長度限制 — GNU 可以輕松處理任意長度的行。

最新的 GNU sed
在研究這篇文章之時我注意到:幾個在線 sed 愛好者提到 GNU sed 3.02a。奇怪的是,在ftp.gnu.org(有關這些鏈接,請參閱參考資料)上找不到 sed 3.02a,所以,我只得在別處尋找。我在alpha.gnu.org 的 /pub/sed 中找到了它。于是我高興地將其下載、編譯然后安裝,而幾分鐘后我發現最新的 sed 版本卻是 3.02.80 — 可在alpha.gnu.org 上 3.02a 源代碼旁邊找到其源代碼。安裝完 GNU sed 3.02.80 之后,我就完全準備好了。

alpha.gnu.org
alpha.gnu.org(請參閱參考資料)是新的和實驗性 GNU 源代碼的所在地。然而,您還會在那里發現許多優秀、穩定的源代碼。出于某種原因,不是許多 GNU 開發人員忘記將穩定的源代碼移至 ftp.gnu.org,就是它們的 “beta” 期間格外長(2 年!)。例如,sed 3.02a 已有兩年,甚至 3.02.80 也有一年,但它們仍不能(在 2000 年 8 月寫本文章時)在 ftp.gnu.org 上獲得。

正確的 sed
在本系列中,將使用 GNU sed 3.02.80。在即將出現的本系列后續文章中,某些(但非常少)最高級的示例將不能在 GNU sed 3.02 或 3.02a 中使用。如果您使用的不是 GNU sed,那么結果可能會不同。現在為什么不花些時間安裝 GNU sed 3.02.80 呢?那樣,不僅可以為本系列的余下部分作好準備,而且還可以使用可能是目前最好的 sed。

sed 示例
sed 通過對輸入數據執行任意數量用戶指定的編輯操作(“命令”)來工作。sed 是基于行的,因此按順序對每一行執行命令。然后,sed 將其結果寫入標準輸出 (stdout),它不修改任何輸入文件。

讓我們看一些示例。頭幾個會有些奇怪,因為我要用它們演示 sed 如何工作,而不是執行任何有用的任務。然而,如果您是 sed 新手,那么理解它們是十分重要的。下面是第一個示例:

$ sed -e ‘d’ /etc/services

如果輸入該命令,將得不到任何輸出。那么,發生了什么?在該例中,用一個編輯命令 ‘d’ 調用 sed。sed 打開 /etc/services 文件,將一行讀入其模式緩沖區,執行編輯命令(“刪除行”),然后打印模式緩沖區(緩沖區已為空)。然后,它對后面的每一行重復這些步驟。這不會產生輸出,因為 “d” 命令除去了模式緩沖區中的每一行!

在該例中,還有幾件事要注意。首先,根本沒有修改 /etc/services。這還是因為 sed 只讀取在命令行指定的文件,將其用作輸入 — 它不試圖修改該文件。第二件要注意的事是 sed 是面向行的。’d’ 命令不是簡單地告訴 sed 一下子刪除所有輸入數據。相反,sed 逐行將 /etc/services 的每一行讀入其稱為模式緩沖區的內部緩沖區。一旦將一行讀入模式緩沖區,它就執行 ‘d’ 命令,然后打印模式緩沖區的內容(在本例中沒有內容)。我將在后面為您演示如何使用地址范圍來控制將命令應用到哪些行 — 但是,如果不使用地址,命令將應用到所有行。

第三件要注意的事是括起 ‘d’ 命令的單引號的用法。養成使用單引號來括起 sed 命令的習慣是個好注意,這樣可以禁用 shell 擴展。

另一個 sed 示例
下面是使用 sed 從輸出流除去 /etc/services 文件第一行的示例:

$ sed -e ‘1d’ /etc/services | more

如您所見,除了前面有 ‘1′ 之外,該命令與第一個 ‘d’ 命令十分類似。如果您猜到 ‘1′ 指的是第一行,那您就猜對了。與第一個示例中只使用 ‘d’ 不同的是,這一次使用的 ‘d’ 前面有一個可選的數字地址。通過使用地址,可以告訴 sed 只對某一或某些特定行進行編輯。

地址范圍
現在,讓我們看一下如何指定地址范圍。在本例中,sed 將刪除輸出的第 1 到 10 行:

$ sed -e ‘1,10d’ /etc/services | more

當用逗號將兩個地址分開時,sed 將把后面的命令應用到從第一個地址開始、到第二個地址結束的范圍。在本例中,將 ‘d’ 命令應用到第 1 到 10 行(包括這兩行)。所有其它行都被忽略。

帶規則表達式的地址
現在演示一個更有用的示例。假設要查看 /etc/services 文件的內容,但是對查看其中包括的注釋部分不感興趣。如您所知,可以通過以 ‘#’ 字符開頭的行在 /etc/services 文件中放置注釋。為了避免注釋,我們希望 sed 刪除以 ‘#’ 開始的行。以下是具體做法:

$ sed -e ‘/^#/d’ /etc/services | more

試一下該例,看看發生了什么。您將注意到,sed 成功完成了預期任務。現在,讓我們分析發生的情況。

要理解 ‘/^#/d’ 命令,首先需要對其剖析。首先,讓我們除去 ‘d’ — 這是我們前面所使用的同一個刪除行命令。新增加的是 ‘/^#/’ 部分,它是一種新的規則表達式地址。規則表達式地址總是由斜杠括起。它們指定一種 模式,緊跟在規則表達式地址之后的命令將僅適用于正好與該特定模式匹配的行。

因此,’/^#/’ 是一個規則表達式。但是,它做些什么呢?很明顯,現在該復習規則表達式了。

規則表達式復習
可以使用規則表達式來表示可能會在文本中發現的模式。您在 shell 命令行中用過 ‘*’ 字符嗎?這種用法與規則表達式類似,但并不相同。下面是可以在規則表達式中使用的特殊字符:

字符 描述
與行首匹配
與行末尾匹配
與任一個字符匹配
將與前一個字符的零或多個出現匹配
[ ] 與 [ ] 之內的所有字符匹配

感受規則表達式的最好方法可能是看幾個示例。所有這些示例都將被 sed 作為合法地址接受,這些地址出現在命令的左邊。下面是幾個示例:

規則
表達式 描述
/./ 將與包含至少一個字符的任何行匹配
/../ 將與包含至少兩個字符的任何行匹配
/^#/ 將與以 ‘#’ 開始的任何行匹配
/^$/ 將與所有空行匹配
/}^/ 將與以 ‘}’(無空格)結束的任何行匹配
/} *^/ 將與以 ‘}’ 后面跟有零或多個空格結束的任何行匹配
/[abc]/ 將與包含小寫 ‘a’、’b’ 或 ‘c’ 的任何行匹配
/^[abc]/ 將與以 ‘a’、’b’ 或 ‘c’開始的任何行匹配

在這些示例中,鼓勵您嘗試幾個。花一些時間熟悉規則表達式,然后嘗試幾個自己創建的規則表達式。可以如下使用 regexp:

$ sed -e ‘/regexp/d’ /path/to/my/test/file | more

這將導致 sed 刪除任何匹配的行。然而,通過告訴 sed打印 regexp 匹配并刪除不匹配的內容,而不是與之相反的方法,會更有利于熟悉規則表達式。可以用以下命令這樣做:

$ sed -n -e ‘/regexp/p’ /path/to/my/test/file | more

請注意新的 ‘-n’ 選項,該選項告訴 sed 除非明確要求打印模式空間,否則不這樣做。您還會注意到,我們用 ‘p’ 命令替換了 ‘d’ 命令,如您所猜想的那樣,這明確要求 sed 打印模式空間。就這樣,將只打印匹配部分。

有關地址的更多內容
目前為止,我們已經看到了行地址、行范圍地址和 regexp 地址。但是,還有更多的可能。我們可以指定兩個用逗號分開的規則表達式,sed 將與所有從匹配第一個規則表達式的第一行開始,到匹配第二個規則表達式的行結束(包括該行)的所有行匹配。例如,以下命令將打印從包含 “BEGIN” 的行開始,并且以包含 “END” 的行結束的文本塊:

$ sed -n -e ‘/BEGIN/,/END/p’ /my/test/file | more

如果沒發現 “BEGIN”,那么將不打印數據。如果發現了 “BEGIN”,但是在這之后的所有行中都沒發現 “END”,那么將打印所有后續行。發生這種情況是因為 sed 面向流的特性 — 它不知道是否會出現 “END”。

C 源代碼示例
如果只要打印 C 源文件中的 main() 函數,可輸入:

$ sed -n -e ‘/main[[:space:]]*(/,/^}/p’ sourcefile.c | more

該命令有兩個規則表達式 ‘/main[[:space:]]*(/’ 和 ‘/^}/’,以及一個命令 ‘p’。第一個規則表達式將與后面依次跟有任意數量的空格或制表鍵以及開始圓括號的字符串 “main” 匹配。這應該與一般 ANSI C main() 聲明的開始匹配。

在這個特別的規則表達式中,出現了 ‘[[:space:]]’ 字符類。這只是一個特殊的關鍵字,它告訴 sed 與 TAB 或空格匹配。如果愿意的話,可以不輸入 ‘[[:space:]]’,而輸入 ‘[’,然后是空格字母,然后是 -V,然后再輸入制表鍵字母和 ‘]’ — Control-V 告訴 bash 要插入“真正”的制表鍵,而不是執行命令擴展。使用 ‘[[:space:]]’ 命令類(特別是在腳本中)會更清楚。

好,現在看一下第二個 regexp。’/^}’ 將與任何出現在新行行首的 ‘}’ 字符匹配。如果代碼的格式很好,那么這將與 main() 函數的結束花括號匹配。如果格式不好,則不會正確匹配 — 這是執行模式匹配任務的一件棘手之事。

因為是處于 ‘-n’ 安靜方式,所以 ‘p’ 命令還是完成其慣有任務,即明確告訴 sed 打印該行。試著對 C 源文件運行該命令 — 它應該輸出整個 main() { } 塊,包括開始的 “main()” 和結束的 ‘}’。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/535773.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/535773.shtml
英文地址,請注明出處:http://en.pswp.cn/news/535773.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

JDK源碼解析之 Java.lang.Short

Short類是基本類型short 的包裝類&#xff0c;它包含幾種有效處理短值的方法&#xff0c;如將其轉換為字符串表示形式&#xff0c;反之亦然。Short類的對象可以包含單個短值。 一、類定義 public final class Short extends Number implements Comparable<Short> {}類被…

sed教程入門與實例練習(二)

讓我們看一下 sed 最有用的命令之一&#xff0c;替換命令。使用該命令&#xff0c;可以將特定字符串或匹配的規則表達式用另一個字符串替換。下面是該命令最基本用法的示例&#xff1a; $ sed -e ’s/foo/bar/’ myfile.txt上面的命令將 myfile.txt 中每行第一次出現的 ‘foo’…

Oracle GoldenGate簡介

一、什么是Oracle GoldenGate&#xff1f; Oracle GoldenGate是用于實時數據集成和復制的綜合軟件包。它支持高可用性解決方案&#xff0c;實時數據集成&#xff0c;事務性更改數據捕獲&#xff0c;數據復制&#xff0c;轉換以及運營和分析企業系統之間的驗證。 使用Oracle G…

sed教程入門與實例練習(三)

在第二篇 sed 文章中&#xff0c;我提供了一些示例來演示 sed 的工作原理&#xff0c;但是它們當中很少有示例能實際做特別有用的事。在這篇 sed 系列的最后文章中&#xff0c;我要改變那種方式&#xff0c;并使用 sed 來做實際的事。我將為您顯示幾個示例&#xff0c;它們不僅…

Oracle GoldenGate微服務架構

Oracle GoldenGate支持兩種架構&#xff0c;經典架構和微服務架構&#xff08;MA&#xff09;。 可以出于以下目的配置Oracle GoldenGate&#xff1a; 從一個數據庫中靜態提取數據記錄&#xff0c;并將這些記錄加載到另一個數據庫中。連續提取和復制事務性數據處理語言&#…

Oracle GoldenGate經典架構

可以使用Oracle GoldenGate Classic Architecture從命令行配置和管理數據復制。 圖示的說明logicalarch2.png 注意&#xff1a; 這是基本配置。根據業務需求和用例&#xff0c;可以配置此模型的不同變體。 1、Manager Manager是Oracle GoldenGate的控制過程。必須先在Oracl…

WordPress 首頁顯示摘要

這里的方法不需要你另外裝插件。 1、使用more標簽 (缺點&#xff1a;每次都要加一下這個東西&#xff0c;不靈活只能一刀切。優點&#xff1a;方法比較正規不需要改動模版) 在你需要截斷的地方(就是你的編輯框)加 <!–more–> 代碼. 2、使用the_excerpt標簽 (缺點&#x…

Oracle GoldenGate復制過程

這兩種Oracle GoldenGate體系結構共有許多數據復制過程。 1、什么是Extract&#xff1f; Extract是一個過程&#xff0c;該過程被配置為針對源數據庫運行或被配置為在下游挖掘數據庫&#xff08;僅Oracle&#xff09;上運行&#xff0c;以捕獲在其他位置的真實源數據庫中生成…

awk教程入門與實例練習(一)

Awk 是一種非常好的語言&#xff0c;同時有一個非常奇怪的名稱。在本系列&#xff08;共三篇文章&#xff09;的第一篇文章中&#xff0c;Daniel Robbins 將使您迅速掌握 awk 編程技巧。隨著本系列的進展&#xff0c;將討論更高級的主題&#xff0c;最后將演示一個真正的高級 a…

HDFS-簡介

HDFS 是 Hadoop Distribute File System 的簡稱&#xff0c;意為&#xff1a;Hadoop 分布式文件系統&#xff0c;是一種旨在在商品硬件上運行的分布式文件系統。它與現有的分布式文件系統有許多相似之處。但是&#xff0c;與其他分布式文件系統的區別很明顯。HDFS具有高度的容錯…

awk教程入門與實例練習(二)

在這篇 awk 簡介的續集中&#xff0c;Daniel Robbins 繼續探索 awk&#xff08;一種很棒但有怪異名稱的語言&#xff09;。Daniel 將演示如何處理多行記錄、使用循環結構&#xff0c;以及創建并使用 awk 數組。閱讀完本文后&#xff0c;您將精通許多 awk 的功能&#xff0c;而且…

HDFS-配置項

一、core-site.xml與core-default.xml core-default.xml與core-site.xml的功能是一樣的&#xff0c;如果在core-site.xml里沒有配置的屬性&#xff0c;則會自動會獲取core-default.xml里的相同屬性的值 <configuration><property><!-- 這個屬性用來指定namenod…

awk教程入門與實例練習(三)

在 awk 系列的這篇總結中&#xff0c;Daniel 向您介紹 awk 重要的字符串函數&#xff0c;以及演示了如何從頭開始編寫完整的支票簿結算程序。在這個過程中&#xff0c;您將學習如何編寫自己的函數&#xff0c;并使用 awk 的多維數組。學完本文之后&#xff0c;您將掌握更多 awk…

HDFS-常用命令

1. -help&#xff1a;顯示幫助信息 hadoop fs -help rmshel2. -ls&#xff1a;顯示目錄信息 hadoop fs -ls /3. -mkdir&#xff1a;在HDFS上創建目錄 hadoop fs -mkdir -p /user/ha4. -moveFromLocal&#xff1a;從本地剪切粘貼到HDFS hadoop fs -moveFromLocal ~/test.txt…

如何關閉WINDOWS2003 DEP數據保護功能

近來很多朋友和客戶都使用了WINDOWS2003來架設自己的GAME SERVER,但有很多朋友反映說,不如WINDOWS2000好,原因不是穩定,而是成功率高,和簡單.但我個人覺得WINDOWS2003還是不錯的系統,如果朋友們都不用這個系統,而用WINDOWS2000 有點不值得了.我就開始找尋這樣的問題.我對GAME 不…

JDK源碼解析之 java.lang.Thread

位于java.lang包下的Thread類是非常重要的線程類&#xff0c;它實現了Runnable接口&#xff0c;今天我們來學習一下Thread類&#xff0c;在學習Thread類之前&#xff0c;先介紹與線程相關知識&#xff1a;線程的幾種狀態、上下文切換&#xff0c;然后接著介紹Thread類中的方法的…

TASKLIST

TASKLIST [/S system [/U username [/P [password]]]] [/M [module] | /SVC | /V] [/FI filter] [/FO format] [/NH]參數列表:/S system 指定連接到的遠程系統。/U [domain/]user 指定使用哪個用戶執行這個命令。/P [password] 為指定的用戶指定密碼。/SVC 顯示每個進程中的服務…

JDK源碼解析之 java.lang.ThreadLocal

此類提供線程局部變量。這些變量與普通變量不同&#xff0c;每個訪問一個線程&#xff08;通過其get或set方法&#xff09;的線程 都有其自己的&#xff0c;獨立初始化的變量副本。 ThreadLocal實例通常是希望將狀態與線程關聯的類中的私有靜態字段&#xff08;例如&#xff0c…

華爾街頂級大師胡立陽名言

1.不要聽“親朋好友”的話&#xff0c;他們只會讓你成為“平凡人”。 2.不要只會“用功讀書”&#xff0c;重要的是“要讀對書”。  3&#xff0e;不要只是“努力工作”&#xff0c;重要的是“做對工作”。   4.不要指示結交“志趣相投”的朋友&#xff0c;否則你永遠只看到…

JDK源碼解析之 Java.lang.Enum

Enum是一個特殊的類. 我們不能以class Xxx extends Enum的方式手動繼承, 必須寫成enum Xxx的形式; 然而這段枚舉類的定義在編譯之后又變回了class Xxx extends Enum. 一、類定義 public abstract class Enum<E extends Enum<E>>implements Comparable<E>, …