Linux命令三劍客:grep、sed、awk總結

文章目錄

  • 前言
  • 一、grep
    • 命令語法
    • 實例
    • grep結合pattern正則
  • 二、sed
    • 命令語法
    • 案例
  • 三、awk
    • 命令語法
    • 實例

前言

最近看到了幾篇關于linux命令grep、sed、awk的文章,這里總結下,方便后面使用。

一、grep

grep命令(grep的全稱:Global search Regular Expression and Print out the line)主要用于文本內容的查找。它支持正則表達式查找。

命令語法

grep提供兩種方式:

◆ grep [option] [pattern] testfile
#第一種是從文本中直接使用pattern匹配搜索
◆ stdout | grep [option] [pattern]
#第二種是從標準輸出中處理 grep所提供的option(參數選項)

參數解釋:
在這里插入圖片描述
在這里插入圖片描述

實例

做一個最簡單的示例,如下先準備一個測試文件,內容如下:
在這里插入圖片描述
從文本文件中搜索test字符串
在這里插入圖片描述
可以看到包含有"test"的行被打印出來,默認grep是區分大小寫的。所以"Test","TEST"沒有被匹配出來。

如果想要不區分大小寫,我們可以加"-i"的參數。如下:
在這里插入圖片描述當前我們的測試文本內容比較少,我們肉眼可以見到是在第幾行。如果文本行數較多的情況下那就不太方便了,這里就可以用到"-n"的參數
shell三劍客之grep
包含有"test"的并且不區分大小寫的行在開頭會顯示行號,現在的結果中匹配的關鍵字所在行全部內容都會輸出。

如果只想要看到匹配的關鍵字,怎么辦?使用"-o"參數即可
在這里插入圖片描述

有時候我們需要對整個目錄去搜索關鍵字,如果直接使用grep “test” 目錄名,會報錯。加參數’-r’就可以避免這個問題
在這里插入圖片描述
可以看到shellTest目錄下的兩支文件test1.txt以及testfile都包含test被打印出來了

“-q”選項表示使用靜默模式,在此模式下grep命令不會有任何的打印結果,無論是否有匹配到。一般來說我們可以根據echo $?來查看上一條指令(grep)的執行結果,如果返回結果為0,表示grep有匹配到了,如果返回結果為1,表示grep沒有匹配到。
在這里插入圖片描述
一般我們可以shell腳本中去用if條件分支進行判斷,如果echo $?結果為0,就去執行相應的操作。

grep結合pattern正則

前面我們介紹了參數的基本用法,grep的強大之處其實是和正則表達式一起才有作用。

注:本篇文章不會具體介紹正則表達式的使用,如果不了解正則表達式的同學推薦去看下之前相關的文章
我們知道在正則表達式中分為了兩類:

01 基本正則表達式

◆ . 單個字符
◆ * 表示前面的字符連續出現任意次,包括0次
◆ ^ 表示錨定行首
◆ $ 表示錨定行尾
◆ [a-z] [0-9] 區間范圍
......

02 擴展正則表達式

◆ ?表示匹配其前面的字符0或1次
◆ + 表示匹配其前面的字符至少1次,或者連續多次,連續次數上不封頂。
◆ () 分組
◆ {} 連續匹配
◆ | 匹配多個表達式的任何一個
......

如查詢以"lemon"單詞開頭
在這里插入圖片描述
查找文件中空白行的數量
在這里插入圖片描述

正則“^$”表示空白行,參數“-c”表達計算行數

連續字數的正則匹配,如:查找“appium”,p是連續的
在這里插入圖片描述
“{2}”表示p連續出現了兩次,可以發現結果是匹配不到的。因為{}是擴展正則表達式,grep默認是基本正則表達式,如果需要支持擴展正則表達式,我們需要加"-E"選項:
在這里插入圖片描述

二、sed

sed命令主要用于文本內容的編輯。默認只處理模式空間,不處理原數據,而且sed是針對一行行數據來進行處理的。Stream Editor文本流編輯,是一個"非交互式的"面向字符流的編輯器。

常用功能
(1) 、打印功能
能同時處理多個文件多行內容,可以不對原文件改動把整個文件輸入到屏幕。
(2)、文本替換
把匹配到模式的內容輸入到屏幕上。
(3)、修改文本
可以對原文件改動,但是不會在屏幕上返回結果。(謹慎使用!!!)

總結:
Sed就是修改文本、替換文本、打印文本的一個工具。

執行流程:

Sed是從文件或管道中讀取一行,處理一行,輸出一行;再讀取一行,再處理一行,再輸出一行…當處理一行時,把當前處理的行存儲在臨時緩沖區中,稱為模式空間(pattern space),接著用sed命令處理緩沖區中的內容,處理完成后,把緩沖區的內容送往屏幕。接著處理下一行,這樣不斷重復,直到文件末尾。如下,簡單流程圖。
在這里插入圖片描述
補充:
一次處理一行的設計模式使得sed性能很高,sed在讀取大文件時不會出現卡頓的現象。

例如:使用vi命令打開幾十M上百M的文件,明顯會出現有卡頓的現象,這是因為vi命令打開文件是一次性將文件加載到內存,然后再打開。Sed就避免了這種情況,一行一行的處理,打開速度非常快,執行速度也很快。

命令語法

Sed [選項] 編輯命令 文件
Shell 命令 | sed [選項] 編輯命令

常用選項

-n:只顯示匹配處理的行
-e:執行多個編輯命令(一般使用;代替)
-i:直接在文件中進行修改,不輸出到屏幕
-r:支持擴展正則表達式
-f:從腳本文件中讀取內容并執行文件中的編輯命令。
補充:這里比較常用的-n -r -e(用;代替)

常用編輯命令:

p:打印匹配行
d:刪除匹配行
a:在定位行號后附加新文本信息
i:在定位行號后插入新文本信息
c:用新文本替換定位文本
r:從另一個文件中讀文本,類似輸入重定向(<)
w:寫文本到一個文件,類似輸出重定向(>)
s:使用替換模式替換相應模式
補充:這里比較常用的p d s

案例

案例1:
n 一般和 p連用
//打印文件的3-6行,使用行號

odysee:~$sed -n '3,6p' /etc/passwd

在這里插入圖片描述
//打印(^odysee)以odysee開頭的行,使用正則

sed -n '/^odysee/p' /etc/passwd

在這里插入圖片描述

案例2:
參數d(刪除匹配行),不會改變原文件內容
//$表示最后一行,!表示取反,d刪除匹配行,p打印,;多個命令分割符
//連起來就是只打印文件最后一行

sed -n '$!d;p' /etc/passwd

在這里插入圖片描述
查看原文件,并沒有改變
在這里插入圖片描述
案例3:

參數a(在定位行號后附加新文本信息)
//1a表示在第一行后面追加,也可使用正則

sed '1a abc' demo.txt

在這里插入圖片描述
案例4:

參數i(在定位行號后插入新文本信息)
//1i:在第一行前插入,可以使用正則

sed '1i abc' demo.txt

在這里插入圖片描述

三、awk

awk同sed命令類似,只不過sed擅長取行,awk命令擅長取列。(根據了解awk是一種語言,不過我們只關注他處理文本的功能,用的好的話幾乎可以取代excel)
原理:一般是遍歷一個文件中的每一行,然后分別對文件的每一行進行處理。
awk命令主要用于文本內容的分析處理。
如果對處理的數據需要生成報告之類的信息,或者處理的數據是按列進行處理的,最好使用awk。

命令語法

awk [可選的命令行選項] 'BEGIN{命令 } pattern{ 命令 } END{ 命令 }' 文件名

實例

打印某幾列

$ echo 'I love you' | awk '{print $3 $2 $1}'
youloveI

我們將字符串 I love you 通過管道傳遞給awk命令,相當于awk處理一個文件,該文件的內容就是I love you,默認通過空格作為分隔符(不管列之間有多少個空格都將當作一個空格處理)I love you就分割成三列了。

假如分割符號為.,可以這樣用

$ echo '192.168.1.1' | awk -F "." '{print $2}'
168

條件過濾

我們知道awk的用法是這樣的,那么pattern部分怎么用呢?

awk [可選的命令行選項] 'BEGIN{命令 } pattern{ 命令 } END{ 命令 }' 文件名
$ cat score.txt
tom 60 60 60
kitty 90 95 87
jack 72 84 99
$ awk '$2>=90{print $0}' score.txt
kitty 90 95 87

$2>=90 表示如果當前行的第2列的值大于90則處理當前行,否則不處理。說白了pattern部分是用來從文件中篩選出需要處理的行進行處理的,這部分是空的代表全部處理。pattern部分可以是任何條件表達式的判斷結果,例如>,<,==,>=,<=,!=同時還可以使用+,-,*,/運算與條件表達式相結合的復合表達式,邏輯 &&,||,!同樣也可以使用進來。另外pattern部分還可以使用 /正則/ 選擇需要處理的行。

判斷語句

判斷語句是寫在pattern{ 命令 }命令中的,他具備條件過濾一樣的作用,同時他也可以讓輸出更豐富

$ awk '{if($2>=90 )print $0}' score.txt
kitty 90 95 87
$ awk '{if($2>=90 )print $1,"優秀"; else print $1,"良好"}' score.txt
tom 良好
kitty 優秀
jack 良好

BEGIN 定義表頭

awk [可選的命令行選項] 'BEGIN{命令 } pattern{ 命令 } END{ 命令 }' 文件名

使用方法如下:

$ awk 'BEGIN{print "姓名 語文 數學 英語"}{printf "%-8s%-5d%-5d%-5d\n",$1,$2,$3,$4}' score.txt
姓名 語文數學英語
tom 60 60 60
kitty 90 95 87
jack 72 84 99

這里要注意,我為了輸出格式好看,做了左對齊的操作(%-8s左對齊,寬8位),printf用法和c++類似。

不僅可以用來定義表頭,還可以做一些變量初始化的工作,例如

$ awk 'BEGIN{OFMT="%.2f";print 1.2567,12E-2}'
1.26 0.12

這里OFMT是個內置變量,初始化數字輸出格式,保留小數點后兩位。

END 添加結尾符

和BEGIN用法類似

$ echo ok | awk '{print $1}END{print "end"}'
ok
end

數據計算

這個地方我要放大招了!上面的知識點你都記住了嗎?

$ awk 'BEGIN{print "姓名 語文 數學 英語 總成績"; \
sum1=0;sum2=0;sum3=0;sumall=0} \
{printf "%5s%5d%5d%5d%5d\n",$1,$2,$3,$4,$2+$3+$4;\
sum1+=$2;sum2+=$3;sum3+=$4;sumall+=$2+$3+$4}\
END{printf "%5s%5d%5d%5d%5d\n","總成績",sum1,sum2,sum3,sumall}'\score.txt
姓名 語文 數學 英語 總成績tom 60 60 60 180
kitty 90 95 87 272jack 72 84 99 255
總成績 222 239 246 707

因為命令太長,末尾我用\符號換行了。。

  • BEGIN體里我輸出了表頭,并給四個變量初始化0
  • pattern體里我輸出了每一行,并累加運算
  • END體里我輸出了總統計結果
  • 當然了,一個正常人在用linux命令的時候是不會輸入那么多格式化符號來對齊的,所以新命令又來了
  • column -t(鬼知道我為什么會記得這么多亂七八糟的命令。)
    在這里插入圖片描述
    有用的內置變量

NF:表示當前行有多少個字段,因此$NF就代表最后一個字段
NR:表示當前處理的是第幾行
FILENAME:當前文件名
OFMT:數字輸出的格式,默認為%.6g。表示只打印小數點后6 位

$ awk -F ':' '{print NR ") " $1}' demo.txt
1) root
2) daemon
3) bin
4) sys
5) sync

內置函數

awk定義了很多內置函數,用awk來寫shell腳本倒是一個不錯的選擇,但是大多數我們是用不上的,以下是常用函數

$ echo 1 2 | awk '{print $1+sqrt($2)}'
2.41421

隨機數,先設置種子再隨機

rand() 0 <= n < 1,srand([expr]) |將 rand 函數的種子值設置為 Expr 參數的值,或如果省略 Expr 參數則使用某天的時間。

$ echo 1 | awk 'BEGIN{srand()}{print rand()}'
0.929885

字符串
Linux三劍客傳 | 老大:AWK

系統常用
在這里插入圖片描述

不常用算數:
在這里插入圖片描述

參考:
https://www.toutiao.com/i6741262116495294987/
https://www.toutiao.com/a6726544069754880523/
https://www.toutiao.com/a6675158518468706829/
https://www.toutiao.com/a6705966822589465100/

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/456359.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/456359.shtml
英文地址,請注明出處:http://en.pswp.cn/news/456359.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

python 機器學習資料

!(7 Steps to Mastering Machine Learning With Python) [http://www.kdnuggets.com/2015/11/seven-steps-machine-learning-python.html] 轉載于:https://www.cnblogs.com/zk47/p/6448506.html

Flask-SQLAlchemy 中如何不區分大小寫查詢?

例如下面的 User 模型&#xff0c;在數據庫中查詢時并不會區分大小寫 class User(db.Model):__tablename__ usersid db.Column(db.Integer, primary_keyTrue)username db.Column(db.String(64), uniqueTrue, indexTrue)password_hash db.Column(db.String(128)) 這時&…

Git常用指令及功能總結

文章目錄前言&#xff1a;1、常用的git指令2、常用git功能及操作2.1、下載代碼&#xff1a;2.2、當前分支和master保持一致2.3、修改代碼后提交代碼到指定分支2.4、版本回退&#xff08;時空穿梭機&#xff09;2.5、概念工作區和暫存區2.6、添加遠程庫2.7、分支管理2.8、標簽管…

MacOS下MySQL配置

先去官網下載一個 MySQL for mac http://www.cnblogs.com/xiaobo-Linux/ 命令行運行終端&#xff0c;運行下面兩條命令&#xff1a; 12alias mysql/usr/local/mysql/bin/mysqlalias mysqladmin/usr/local/mysql/bin/mysqladmin方便終端直接輸入mysql命令&#xff0c;而不是必須…

HashMap為什么在多線程下會讓cpu100%

首先HashMap并不是sun公司多線程提供的集合&#xff0c;很多時候我們的程序是一個主線程&#xff0c;用了hashmap并沒有什么問題&#xff0c;但是在多線程下會出現問題。 hashmap是一個哈希表&#xff0c;存儲的數據結構也可以是一個線性數組&#xff0c;我們的存儲的數據都在e…

flask中關于endpoint端點、url_map映射、view_func視圖函數,view_functions、及視圖函數名是否何以相同的問題?

視圖函數中關于url_map視圖的映射&#xff1a;應該是[ url->methonds->endpoint ] 而整個請求的過程&#xff0c;是先通過url地址映射到端點endpoint&#xff0c;然后通過endpoint找到試圖函數view_func&#xff08;擴展:在Flask類里邊有一個view_funtions的屬性&…

SparkSQL-從0到1認識Catalyst

文章目錄前言正文預備知識&#xff0d;Tree&RuleCatalyst工作流程ParserAnalyzerOptimizerSparkSQL執行計劃前言 這篇文章是轉載一位大神的文章&#xff0c;為什么要轉載的&#xff0c;實在是因為寫的太經典了&#xff0c;所以忍不住希望能有更多的人可以看到。后續還會轉…

為什么程序員一定要加班?

摘要&#xff1a; 一提到程序員&#xff0c;大多數人的印象大概就是死宅、無趣、沒有私人生活&#xff0c;除了上班寫寫寫代碼&#xff0c;加班寫代碼更是標配。似乎在深夜頂著雞窩頭&#xff0c;目光呆滯&#xff0c;面無表情敲鍵盤的場景才是一個程序員的真實寫照。 當然&…

javascript 反斜杠\

通常&#xff0c;我們在動態給定一個div的innerHTML時&#xff0c;通常是樣做的&#xff1a; <div id"demo1" /> <SCRIPT> var demo document.getElementById("demo1"); var str "<h1>" "<a hrefjavascript:; ο…

SQLAlchemy 中的 Session、sessionmaker、scoped_session

SQLAlchemy 中的 Session、sessionmaker、scoped_session 目錄 一、關于 Session 1. Session是緩存嗎&#xff1f;2. Session作用&#xff1a;3. Session生命周期&#xff1a;4. Session什么時候創建&#xff0c;提交&#xff0c;關閉&#xff1f;4. 獲取一個Session&#xf…

沒有任何權力的“項目經理”該如何當?

2016.11.25 11:40* 字數 1454 閱讀 108評論 0喜歡 1小王幾月前被任命為項目經理&#xff0c;負責9個人的工作安排。工作上要對上負責&#xff0c;完成項目&#xff0c;可對下小王卻沒有對小組成員的工作考核權&#xff0c;也就是說&#xff0c;不能影響他們的收入。 圖片發自簡…

SparkSQL之Join原理

文章目錄前言&#xff1a;Join背景介紹Join常見分類以及基本實現機制Hash JoinBroadcast Hash JoinShuffle Hash JoinSort-Merge Join總結前言&#xff1a; 寫SQL的時候很多時候都有用到join語句&#xff0c;但是我們真的有仔細想過數據在join的過程到底是怎么樣的嗎&#xff…

SQLAlchemy中filter_by()和filter()的用法不同

filter_by() 和 filter() 的最主要的區別&#xff1a; 模塊語法><&#xff08;大于和小于&#xff09;查詢and_和or_查詢filter_by()直接用屬性名&#xff0c;比較用不支持不支持filter()用類名.屬性名&#xff0c;比較用支持支持 談 filter_by() 的語法之前先看下 filt…

python爬蟲從入門到放棄(六)之 BeautifulSoup庫的使用

上一篇文章的正則&#xff0c;其實對很多人來說用起來是不方便的&#xff0c;加上需要記很多規則&#xff0c;所以用起來不是特別熟練&#xff0c;而這節我們提到的beautifulsoup就是一個非常強大的工具&#xff0c;爬蟲利器。 beautifulSoup “美味的湯&#xff0c;綠色的濃湯…

SparkHiveSQL中Join操作的謂詞下推?

前言&#xff1a; SparkSQL和HiveSQL的Join操作中也有謂詞下推&#xff1f;今天就通過大神的文章來了解下。同樣&#xff0c;如有冒犯&#xff0c;請聯系。 正文 上文簡要介紹了Join在大數據領域中的使用背景以及常用的幾種算法&#xff0d;broadcast hash join 、shuffle h…

【轉載】通過金礦模型介紹動態規劃 (動態規劃入門)

先附上原文地址&#xff1a;http://www.cnblogs.com/sdjl/articles/1274312.html 通過金礦模型介紹動態規劃 對于動態規劃&#xff0c;每個剛接觸的人都需要一段時間來理解&#xff0c;特別是第一次接觸的時候總是想不通為什么這種方法可行&#xff0c;這篇文章就是為了…

flask模型中【外鍵】relationship的使用筆記

模型中relationship的使用筆記 模型.PY class User(db.Model):# __tablename__ user1 #定義表名id db.Column(db.Integer, primary_keyTrue, autoincrementTrue)username db.Column(db.String(10), nullableTrue)password db.Column(db.String(64), nullableTrue)phone …

六種方式實現生產者消費者(未完)

2019獨角獸企業重金招聘Python工程師標準>>> 一、利用Object對象是wait和notify\notifyAll package com.jv.parallel.consumerandproducer.objectwait;public class Car {private volatile int flag 0;public void showConsumer(){System.out.println("I am a…

SQL中基于代價的優化

還記得筆者在上篇文章無意中挖的一個坑么&#xff1f;如若不知&#xff0c;強烈建議看官先行閱讀前面兩文&#xff0d;《SparkSQL Join原理》和《Join中竟然也有謂詞下推?》 第一篇文章主要分析了大數據領域Join的三種基礎算法以及各自的適用場景&#xff0c;第二篇文章在第一…

git如何解決沖突(代碼托管在coding)

分支A提交合并請求到分支B&#xff0c;有沖突git fetch code 拉取遠程倉庫的其他分支代碼&#xff08;我拉代碼是remote add code所以這里是code,可以用git remote查看&#xff09;git checkout 分支A 切換到分支Agit pull code 分支A 拉取分支A代碼git checkout 分支B 切換到分…