Linux系統中,AWK 是一個非常強大的文本處理工具,它的內置函數使得對文本數據進行處理更加高效和便捷。
本文將介紹 AWK 內置函數的幾種主要類型:
- 算數函數
- 字符串函數
- 時間函數
- 位操作函數
- 其他常用函數
我們將使用一個示例文本文件來演示這些函數的用法,并提供詳細的注釋說明,繼續分享。
基礎學習,可以回頭查看:Linux文本處理三劍客:awk(結構化命令)
1.算數函數
函數名 | 功能 | 參數 | 示例 | 輸出 |
atan2(y,x) | 返回正切值 y/x 的角度值,角度以弧度為單位 | y, x | atan2(10, -10) * 180 / PI | 135 |
cos(expr) | 返回 expr 的余弦值,輸入參數以弧度為單位 | expr | cos(60 * PI / 180.0) | 0.5 |
exp(expr) | 返回自然數 e 的 expr 次冪 | expr | exp(5) | 148.413159 |
int(expr) | 返回數值 expr 的整數部分 | expr | int(5.12345) | 5 |
log(expr) | 計算 expr 自然對數 | expr | log(5.5) | 1.704748 |
rand | 返回一個大于等于 0 小于 1 的隨機數 | - | rand() | 0.237788 |
sin(expr) | 返回角度 expr 的正弦值,角度以弧度為單位 | expr | sin(30 * PI / 180) | 0.5 |
sqrt(expr) | 計算 expr 的平方根 | expr | sqrt(1024.0) | 32 |
srand([expr]) | 使用種子值生成隨機數 | expr | srand(10) | 1417959587 |
注釋:
- 以上表格僅列出了 AWK 提供的內置算術函數。
- 算術函數的參數必須是數值。
- 算術函數的返回值是數值。
# 反正切函數
awk 'BEGIN {PI = 3.14159265x = -10y = 10result = atan2 (y,x) * 180 / PI;printf "對于 (x=%f, y=%f),反正切值為 %f 度\n", x, y, result
}'# 余弦函數
awk 'BEGIN {PI = 3.14159265param = 60result = cos(param * PI / 180.0);printf "%f 度的余弦值為 %f\n", param, result
}'# 自然指數函數
awk 'BEGIN {param = 5result = exp(param);printf "%f 的自然指數值為 %f\n", param, result
}'# 取整函數
awk 'BEGIN {param = 5.12345result = int(param)print "Truncated value =", result
}'# 自然對數函數
awk 'BEGIN {param = 5.5result = log (param)printf "log(%f) = %f\n", param, result
}'# 隨機數函數
awk 'BEGIN {print "Random num1 =" , rand()print "Random num2 =" , rand()print "Random num3 =" , rand()
}'#正弦函數
awk 'BEGIN {PI = 3.14159265param = 30.0result = sin(param * PI /180)printf "The sine of %f degrees is %f.\n", param, result
}'# 平方根函數
awk 'BEGIN {param = 1024.0result = sqrt(param)printf "sqrt(%f) = %f\n", param, result
}'# 設置隨機數種子
awk 'BEGIN {param = 10printf "srand() = %d\n", srand()printf "srand(%d) = %d\n", param, srand(param)
}'
2.字符串函數
函數名 | 功能 | 參數 | 示例 | 輸出 |
asort(arr, [d [, how]]) | 使用 GAWK 值比較的一般規則排序 arr 中的內容 | arr, d, how | asort(arr) | - |
asorti(arr, [d [, how]]) | 對數組的索引排序 | arr, d, how | asorti(arr) | - |
gsub(regexp, replacement [, target]) | 全局替換子串 | regexp, replacement, target | gsub("World", "Jerry", str) | Hello, Jerry |
index(str, sub) | 檢測子串是否存在 | str, sub | index(str, subs) | 5 |
length(str) | 返回字符串長度 | str | length(str) | 16 |
match(str, regex) | 搜索與正則表達式匹配的子串 | str, regex | match(str, subs) | 5 |
split(str, arr, regex) | 分割字符串 | str, arr, regex | split(str, arr, ",") | One, Two, Three, Four |
sprintf(format, expr-list) | 按指定格式構造字符串 | format, expr-list | sprintf("%s", "Hello, World !!!") | Hello, World !!! |
strtonum(str) | 將字符串轉換為數值 | str | strtonum("123") | 123 |
sub(regex, sub, string) | 執行一次子串替換 | regex, sub, string | sub("World", "Jerry", str) | Hello, Jerry |
substr(str, start, l) | 返回子串 | str, start, l | substr(str, 1, 5) | Hello |
tolower(str) | 將所有大寫字母轉換為小寫字母 | str | tolower(str) | hello, world !!! |
toupper(str) | 將所有小寫字母轉換為大寫字母 | str | toupper(str) | HELLO, WORLD !!! |
注釋:
- 以上表格僅列出了 AWK 提供的內置字符串函數。
- 字符串函數的參數可以是字符串或變量。
- 字符串函數的返回值是字符串。
# 按字母順序排列數組元素
$ awk 'BEGIN {arr[0] = "Three"arr[1] = "One"arr[2] = "Two"print "排序前數組元素:"for (i in arr) {print arr[i]}asort(arr)print "排序后數組元素:"for (i in arr) {print arr[i]}
}'# 按索引順序排列數組元素
awk 'BEGIN {arr["Two"] = 1arr["One"] = 2arr["Three"] = 3asorti(arr)print "排序后數組索引:"for (i in arr) {print arr[i]}
}'# 替換字符串
awk 'BEGIN {str = "Hello, World"print "替換前字符串 = " strgsub("World", "Jerry", str)print "替換后字符串 = " str
}'# 查找子串的位置
awk 'BEGIN {str = "One Two Three"subs = "Two"ret = index(str, subs)printf "子串 \"%s\" 在第 %d 個位置找到.\n", subs, ret
}'# 獲取字符串長度
awk 'BEGIN {str = "Hello, World !!!"print "長度 = ", length(str)
}'# 使用正則表達式匹配子串
awk 'BEGIN {str = "One Two Three"subs = "Two"ret = match(str, subs)printf "子串 \"%s\" 在第 %d 個位置找到.\n", subs, ret
}'# 將字符串分割為數組
awk 'BEGIN {str = "One,Two,Three,Four"split(str, arr, ",")print "數組包含以下元素:"for (i in arr) {print arr[i]}
}'# 使用 sprintf() 格式化字符串
awk 'BEGIN {str = sprintf("%s", "Hello, World !!!")print str
}'# 將字符串轉換為數字
awk 'BEGIN {print "Decimal num = " strtonum("123")print "Octal num = " strtonum("0123")print "Hexadecimal num = " strtonum("0x123")
}'# 使用 sub() 替換字符串
awk 'BEGIN {str = "Hello, World"print "替換前字符串 = " strsub("World", "Jerry", str)print "替換后字符串 = " str
}'# 獲取子字符串
awk 'BEGIN {str = "Hello, World !!!"subs = substr(str, 1, 5)print "Substring = " subs
}'# 小寫轉換
awk 'BEGIN {str = "HELLO, WORLD !!!"print "Lowercase string = " tolower(str)
}'# 大寫轉換
awk 'BEGIN {str = "hello, world !!!"print "Uppercase string = " toupper(str)
}'
3.時間函數
函數名 | 功能 | 參數 | 示例 | 輸出 |
systime | 返回從 Epoch 以來到當前時間的秒數 | - | systime() | 1418574432 |
mktime(datespec) | 將字符串轉換為時間戳 | datespec | mktime("2014 12 14 30 20 10") | 1418604610 |
strftime([format [, timestamp[, utc-flag]]]) | 格式化時間戳 | format, timestamp, utc-flag | strftime("Time = %m/%d/%Y %H:%M:%S", systime()) | Time = 12/14/2014 22:08:42 |
注釋:
- 以上表格僅列出了 AWK 提供的內置時間函數。
- 時間戳是一個數值,表示從 Epoch 以來經過的秒數。
- Epoch 是 Unix 時間的起點,為 1970 年 1 月 1 日 00:00:00 UTC。
# 獲取當前時間戳
awk 'BEGIN {print "Number of seconds since the Epoch = " systime()
}'
# 將字符串轉換為時間戳
awk 'BEGIN {print "Number of seconds since the Epoch = " mktime("2014 12 14 30 20 10")
}'# 格式化時間戳
awk 'BEGIN {print strftime("Time = %m/%d/%Y %H:%M:%S", systime())
}'# 打印當前星期幾
awk 'BEGIN {print strftime("%A")
}'
4.位操作函數
函數名 | 功能 | 參數 | 示例 | 輸出 |
and | 執行位與操作 | num1, num2 | and(10, 6) | 2 |
compl | 按位求補 | num1 | compl(10) | 9.0072E+15 |
lshift | 左移位操作 | num1, shift | lshift(10, 1) | 20 |
rshift | 向右移位操作 | num1, shift | rshift(10, 1) | 5 |
or | 按位或操作 | num1, num2 | or(10, 6) | 14 |
xor | 按位異或操作 | num1, num2 | xor(10, 6) | 12 |
注釋:
- 以上表格僅列出了 AWK 提供的內置位操作函數。
- 位操作函數的參數必須是整數。
- 位操作函數的返回值是整數。
# 位與操作
awk 'BEGIN {num1 = 10num2 = 6printf "(%d AND %d) = %d\n", num1, num2, and(num1, num2)
}'# 按位求補
awk 'BEGIN {num1 = 10printf "compl(%d) = %d\n", num1, compl(num1)
}'# 左移位操作
awk 'BEGIN {num1 = 10printf "lshift(%d) by 1 = %d\n", num1, lshift(num1, 1)
}'# 向右移位操作。
awk 'BEGIN {num1 = 10printf "rshift(%d) by 1 = %d\n", num1, rshift(num1, 1)
}'# 按位或操作。
awk 'BEGIN {num1 = 10num2 = 6printf "(%d OR %d) = %d\n", num1, num2, or(num1, num2)
}'# 按位異或操作
[jerry]$ awk 'BEGIN {num1 = 10num2 = 6printf "(%d XOR %d) = %d\n", num1, num2, xor(num1, num2)
}'
5.其他常用函數
函數名 | 功能 | 參數 | 示例 | 輸出 |
close(expr) | 關閉管道的文件 | expr | close(cmd, "to") | - |
delete | 從數組中刪除元素 | 數組索引 | delete arr[0] | - |
exit([expr]) | 終止腳本執行 | expr | exit 10 | - |
fflush([output-expr]) | 刷新打開文件或管道的緩沖區 | output-expr | fflush() | - |
getline | 讀入下一行 | - | getline < file | - |
next | 停止處理當前記錄,進入下一條記錄的處理過程 | - | if ($0 ~/Shyam/) next | - |
nextfile | 停止處理當前文件,從下一個文件第一個記錄開始處理 | - | if ($0 ~ /file1:str2/) nextfile | - |
return([expr]) | 從用戶自定義的函數中返回值 | expr | return result | - |
system(cmd) | 執行特定的命令 | cmd | system("date") | 0 |
注釋:
- 以上表格僅列出了 AWK 提供的其它內置函數。
- 每個函數的具體使用方法請參考 AWK 官方文檔。
# 關閉管道
awk 'BEGIN {cmd = "tr [a-z] [A-Z]"print "hello, world !!!" |& cmdclose(cmd, "to")cmd |& getline outprint out;close(cmd);
}'# 從數組中刪除元素
awk 'BEGIN {arr[0] = "One"arr[1] = "Two"arr[2] = "Three"arr[3] = "Four"print "刪除前:"for (i in arr) {print arr[i]}delete arr[0]delete arr[1]print "刪除后:"for (i in arr) {print arr[i]}
}'# 終止腳本執行
awk 'BEGIN {print "Hello, World !!!"exit 10print "AWK never executes this statement."
}'# 刷新打開文件或管道的緩沖區
fflush([output-expr])# 讀入下一行
awk '{getline; print $0}' file.txt # 執行特定的命令然后返回其退出狀態。返回值為 0 表示命令執行成功;非 0 表示命令執行失敗。
awk 'BEGIN { ret = system("date"); print "Return value = " ret }'
如果您覺得有些用處,熟練操作這些代碼后,相信你會有一些收獲。
歡迎在評論區留言,關注。謝謝您的閱讀!
敬請關注!
往期學習筆記:
Windows系統開啟Linux子系統(Ubuntu)
Linux常用命令(目錄操作命令)
Linux常用命令:文件的創建、復制、移動、查找和刪除命令
Linux常用命令:文本文件的查看與編輯
Linux常用命令:文本文件的拼接與分割
Linux常用命令:文件的權限管理
Linux常用命令:文件的下載、壓縮與解壓
Linux常用命令:常見的操作符
Linux常用命令:系統操作命令
?
?Linux文本處理三劍客:grep
Linux文本處理三劍客:sed
Linux文本處理三劍客:awk
Linux文本處理三劍客:awk(常用匹配模式)
Linux文本處理三劍客:awk(結構化命令)
Linux文本處理三劍客:awk(對具體文本的示例代碼)