在 Linux 系統中過濾文件中的字符串

在 Linux 系統中過濾文件中的字符串，可以使用多種命令行工具實現。以下是幾種常見方法及詳細說明：

grep 是 Linux 中最強大的文本搜索工具，支持正則表達式。

grep [選項] "要搜索的字符串" 文件名

簡單匹配：
```
grep "error" /var/log/syslog
```
輸出所有包含 error 的行。
忽略大小寫：
```
grep -i "warning" app.log
```
匹配 warning、WARNING、Warning 等。
顯示行號：
```
grep -n "404" access.log
```
輸出格式：行號:匹配內容
反向匹配：
```
grep -v "debug" server.log
```
輸出所有不包含 debug 的行。
統計匹配次數：
```
grep -c "failed" auth.log
```

awk 適合按列處理文本，支持更復雜的邏輯。

awk '/模式/ {動作}' 文件名

按列過濾（假設字段以空格分隔）：

awk '$3 > 1000' data.txt  # 輸出第三列大于1000的行

多條件匹配：
```
awk '/error/ && /network/' app.log
```
同時包含 error 和 network 的行。
自定義輸出：
```
awk '/error/ {print "Line " NR ": " $0}' app.log
```
輸出匹配行時添加自定義前綴。

sed 主要用于文本替換，但也可用于過濾。

grep "error" app.log | awk '{print $1, $2}'

先過濾出包含 error 的行，再提取前兩列。

grep -E "error|warning" app.log  # 匹配 error 或 warning
grep "^[0-9]{4}-" dates.txt      # 匹配以四位數字-開頭的行（如 2025-05-13）

特殊字符轉義：
如果搜索內容包含正則表達式特殊字符（如 ., *, [ ]），需用反斜杠轉義：
```
grep "192\.168\.1\.1" network.log
```
性能優化：
- 對大文件使用 grep -F 禁用正則表達式，加速搜索。
- 使用 --color=auto 高亮匹配內容：
```
grep --color=auto "error" app.log
```

場景：從 Nginx 日志中提取所有 404 錯誤請求。

grep " 404 " /var/log/nginx/access.log | awk '{print $1, $7}'

輸出格式：客戶端IP 請求的URL

根據需求選擇合適的工具，簡單場景用 grep，復雜邏輯用 awk。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/81309.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/81309.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/81309.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！