【linux基礎】Linux 文本處理核心命令指南

Linux 文本處理核心命令指南

文本處理是 Linux 系統管理的核心能力，約 80% 的配置文件操作都依賴于文本處理技術。本指南詳細講解 echo、重定向、cat、grep、wc 和 vim 等關鍵命令，涵蓋從基礎操作到高級技巧的完整知識體系，并配有實用案例演示。

1. echo：高效的文本輸出工具

適用場景

輸出腳本運行狀態信息（如操作結果、錯誤提示）
快速創建文本文件（配合重定向操作）
格式化文本輸出（支持換行、制表符、顏色等樣式）
生成數字或字母序列

echo是Bash內置的常用命令，廣泛應用于Shell腳本中的文本輸出和格式化處理。

核心功能

終端信息顯示
文本格式化（支持換行符、制表符等）
文件內容寫入
顯示環境變量及命令執行結果

常用選項

-e：啟用轉義字符解析（如\n換行、\t制表等）
-n：禁止自動換行（輸出后不添加換行符）

轉義字符對照表（需配合`-e`選項）

轉義符	功能	示例	輸出效果
`\n`	換行	`echo -e "a\nb"`	a b
`\t`	水平制表符	`echo -e "a\tb"`	a b
`\r`	回車（覆蓋當前行）	`echo -e "abc\r12"`	12c
`\v`	垂直制表符	`echo -e "a\vb"`	a ??b
`\a`	系統提示音	`echo -e "alert\a"`	終端發聲
`\\`	輸出反斜杠	`echo -e "a\\b"`	a\b
`\033[顏色碼m`	ANSI顏色控制	`echo -e "\033[31mred\033[0m"`	紅色"red"

實用技巧

格式化輸出

# 彩色提示信息
echo -e "\033[31mError\033[0m: File not found"  # 紅色錯誤提示# 動態進度顯示
for i in {1..10}; doecho -ne "Progress: [${i}0%]\r"  # 使用\r覆蓋當前行sleep 0.5
done
echo  # 換行結束

引號使用區別

# 雙引號會解析變量和命令
name="Linux"
echo "User: $name, PWD: $(pwd)"  # 輸出：User: Linux, PWD: /home/user# 單引號保持原樣輸出
echo 'User: $name, PWD: $(pwd)'  # 輸出：User: $name, PWD: $(pwd)# 命令替換（兩種等效寫法）
echo "Today: `date +%F`"  # 輸出：Today: 2024-05-20

序列生成方法

echo {001..005}        # 帶前導零的數字序列：001 002 003 004 005
echo {a..z..2}         # 步長為2的字母序列：a c e ... y
echo {2020..2023}-01   # 組合序列：2020-01 2021-01 2022-01 2023-01

2. 重定向操作：> 與 >>

適用場景

日志記錄：將命令輸出保存至日志文件
信息過濾：隱藏編譯/安裝過程中的冗余信息
配置生成：配合echo或cat創建配置文件
內容合并：匯集多個命令輸出到單個文件

重定向是Linux I/O管理的核心機制，通過改變數據流向實現高效文本處理。

核心概念

文件描述符：
- 0 (stdin)：標準輸入
- 1 (stdout)：標準輸出
- 2 (stderr)：標準錯誤
操作符區別：
- >：覆蓋寫入（默認操作stdout，等價于1>）
- >>：追加寫入（等價于1>>）
- 2>：重定向錯誤輸出
- &>：合并標準輸出和錯誤輸出

文件描述符關系圖

0 (stdin)  → [進程]↓
1 (stdout) → 終端/文件↓
2 (stderr) → 終端/文件（與stdout獨立）

實用技巧與安全操作

基礎重定向

# 覆蓋寫入
echo "hello" > output.txt# 追加內容
echo "world" >> output.txt# 錯誤重定向
ls non_exist_file 2> error.log  # 將錯誤信息保存至error.log

輸出屏蔽

# 靜默執行（丟棄所有輸出）
make > /dev/null 2>&1  # 合并stdout和stderr到null設備# 僅顯示錯誤
command > /dev/null  # 忽略正常輸出

防覆蓋保護

# 啟用保護
set -o noclobber# 強制寫入（覆蓋模式下）
echo "force write" >| existing.txt# 關閉保護
set +o noclobber

批量輸出收集

# 收集系統信息
{echo "=== System Info ==="dateuname -a
} > system_report.txt

3. cat：文件查看與處理工具

適用場景

快速查看小型文本文件（如配置文件和日志片段）
使用heredoc語法創建多行文本
合并多個文件內容
顯示特殊字符（包括換行符和制表符）

cat是一款高效的文件處理工具，特別適合處理中小型文本文件和腳本模板。

與less/more的功能對比

工具	優勢	局限	最佳使用場景
`cat`	操作簡單，支持內容合并	不支持分頁，處理大文件不便	查看小文件、合并內容、heredoc寫入
`less`	支持分頁、搜索和雙向瀏覽	功能較復雜	瀏覽大文件、交互式查看
`more`	輕量級基礎分頁功能	僅支持單向滾動	簡單分頁查看（替代cat處理大文件）

核心功能

查看文件內容
合并多個文件輸出
通過heredoc寫入多行文本
可視化控制字符

常用選項

-n：顯示行號
-s：壓縮連續空行
-T：可視化制表符（顯示為^I）
-E：標記行尾（顯示$）
-A：顯示所有特殊字符（等同于-vET）

實用操作指南

基礎查看與文件合并

# 帶行號查看文件
cat -n /etc/hosts# 合并文件內容
cat part1.txt part2.txt > combined.txt# 識別換行符差異
cat -A windows.txt  # 顯示^M$（Windows格式）
cat -A linux.txt    # 顯示$（Linux格式）

heredoc多行文本操作

# 基本用法（EOF可替換為其他分隔符）
cat > config.ini << EOF
[server]
port=8080
debug=true
EOF# 禁用變量解析
name="test"
cat > info.txt << 'EOF'
username=$name  # 原樣輸出
EOF# 保留縮進格式（使用<<-忽略前導制表符）
cat > script.sh <<- 'EOF'#!/bin/bashecho "保留格式的腳本"
EOF

管道文本處理

# 過濾注釋和空行
cat /etc/nginx/nginx.conf | grep -Ev "^\s*(#|$)"# 統計有效代碼行數
cat app.py | grep -v "^$" | wc -l

4. grep：高效文本過濾

適用場景

日志分析（篩選錯誤、警告信息）
配置文件過濾（提取有效配置行）
進程/服務查詢（結合ps命令）
文本內容搜索（匹配特定模式）

grep是基于正則表達式的文本過濾工具，能顯著提升日志分析和內容檢索效率。

正則表達式速查表

符號	含義	示例	匹配內容
`^`	行首	`^error`	以error開頭的行
`$`	行尾	`done$`	以done結尾的行
`\s`	空白字符（空格/制表符）	`^\s*$`	空行（含空格的空行）
`\S`	非空白字符	`\S+`	連續非空白字符（單詞）
`.`	任意單個字符	`a.b`	a后接任意字符再接b（如aab、acb）
`*`	前一字符出現0次或多次	`ab*`	a后接0個或多個b（如a、ab、abb）
`+`	前一字符出現1次或多次	`ab+`	a后接1個或多個b（如ab、abb）
`[]`	字符集	`[0-9a-f]`	單個數字或a-f的字母
`()`	分組	`(error	warn)`

常用選項與組合示例

選項	功能	基礎示例	組合示例（-i±n）
`-n`	顯示匹配行的行號	`grep "error" log.txt`	`grep -in "error" log.txt`（忽略大小寫+顯示行號）
`-i`	忽略大小寫	`grep -i "Error" log.txt`	同上
`-v`	排除匹配行	`grep -v "debug" log.txt`	`grep -vin "debug" log.txt`（排除debug+顯示行號）
`-A n`	顯示匹配行及后n行	`grep -A 2 "error" log.txt`	-
`-B n`	顯示匹配行及前n行	`grep -B 2 "error" log.txt`	-
`-r`	遞歸搜索目錄	`grep -r "port" /etc/`	`grep -rin "port" /etc/`（遞歸+忽略大小寫+行號）
`-E`	啟用擴展正則	`grep -E "error	warn" log.txt`

實戰案例

日志分析

# 統計1小時內的500錯誤次數
grep "2024-05-20 14:" access.log | grep " 500 " | wc -l# 提取錯誤IP及出現次數（按次數排序）
grep "error" access.log | awk '{print $1}' | sort | uniq -c | sort -nr

進程過濾（排除grep自身）

# 查找Apache或Nginx進程（排除grep進程）
ps aux | grep -E "[A]pache|[n]ginx"  # 方括號使grep不匹配自身

配置文件清理

# 提取有效配置行（排除注釋、空行）
grep -Ev "^\s*(#|$)" /etc/sysctl.conf  # -E啟用擴展正則，-v排除

復雜模式匹配

# 匹配IP地址（簡單驗證）
grep -Eo "([0-9]{1,3}\.){3}[0-9]{1,3}" log.txt  # -o僅顯示匹配部分# 匹配郵箱地址（基礎驗證）
grep -E "^[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Za-z]{2,}$" emails.txt

5. wc：文本統計工具

適用場景

代碼行數統計（統計項目代碼量）
日志條目計數（監控日志增長）
文本內容分析（單詞數、最長行等）
管道中配合過濾命令統計結果

wc是輕量高效的統計工具，常與find、grep等命令組合使用。

核心功能

-l：統計行數（最常用）
-w：統計單詞數（以空白分隔）
-c：統計字節數
-L：統計最長行的長度（字符數）

實戰案例

代碼統計（結合find和sort）

# 統計當前目錄下所有.go文件的行數，按行數降序取前5
find . -name "*.go" | xargs wc -l | sort -nr | head -5
# 輸出示例：
# 1200 ./main.go
# 850  ./utils/helper.go
# ...

日志監控

# 實時監控Nginx訪問日志行數（每1秒刷新）
watch -n 1 'wc -l /var/log/nginx/access.log'

文本分析

# 統計/etc/passwd的用戶數（行數）、最長行長度
wc -lL /etc/passwd  # 輸出：40  92 /etc/passwd（40行，最長行92字符）# 統計單詞數（適合純文本內容）
wc -w article.txt  # 輸出：1520 article.txt（1520個單詞）

配合管道統計過濾結果

# 統計系統中已登錄的用戶數（排除重復）
who | cut -d " " -f 1 | sort | uniq | wc -l

6. vim：高效文本編輯器

適用場景

配置文件修改（如nginx、mysql等）
腳本開發（支持bash、python等語言）
文本處理（批量替換、格式調整）
編程開發（提供語法高亮、智能縮進等功能）

vim是專業級文本編輯器（基于vi增強），采用多模式操作設計，掌握后能顯著提升編輯效率。

核心模式

普通模式：默認狀態，用于導航和基本編輯（按Esc返回）
插入模式：文本輸入狀態（通過i/a/o等進入）
命令模式：執行保存、搜索等操作（按:激活）

高效操作指南

基礎編輯

# 進入插入模式
i  # 當前光標前插入
a  # 當前光標后插入
o  # 下方新建行插入# 文件操作（命令模式）
:w        # 保存文件
:q        # 安全退出
:wq       # 保存后退出
:q!       # 強制退出

進階技巧

# 權限提升保存
:w !sudo tee %  # 使用sudo權限保存當前文件# 操作歷史
u          # 撤銷操作
Ctrl + r   # 恢復撤銷# 操作歷史可視化
:h undo-tree  # 查看幫助
:UndotreeToggle  # 顯示操作歷史樹

批量處理

# 多行縮進
V          # 進入行選擇模式
j/k        # 選擇行范圍
>          # 增加縮進（<減少縮進）# 列編輯
Ctrl + v   # 進入塊選擇模式
j/k        # 選擇列區域
I          # 插入內容（Esc后生效）# 全局替換
:%s/old/new/g  # 全文替換
:%s/old/new/gc # 交互式替換

配置優化（~/.vimrc）

set number              " 顯示行號
syntax on               " 語法高亮
set tabstop=4           " Tab寬度
set shiftwidth=4        " 縮進寬度
set expandtab           " Tab轉空格
set autoindent          " 自動縮進
set ignorecase          " 搜索不區分大小寫
set hlsearch            " 高亮搜索結果

通過系統化練習這些工具的高級用法，可顯著提升Linux環境下的文本處理效率，從簡單的內容輸出到復雜的配置管理均能應對自如。