Linux 命令 `uniq`：去重利器

在 Linux 系統中，處理文本數據是日常任務中不可或缺的一部分。當我們面對大量重復的數據行時，如何高效地去除這些重復項成為了一個值得探討的話題。這時，uniq 命令就派上了用場。本文將介紹 uniq 命令的基本用法、選項以及一些實用技巧。

uniq 命令用于從排序好的文本文件中去除重復的行，只顯示唯一的行。注意，uniq 命令通常與 sort 命令結合使用，因為 uniq 需要輸入的數據已經預先排序過。

uniq [options] [file ...]

在每行前加上該行在文件中出現的次數。

僅顯示重復的行。

顯示所有重復的行，并在每組重復行之間插入指定的分隔符（默認為空行）。

忽略每行前 n 個字段的比較。字段之間由制表符分隔。

比較時不區分大小寫。

忽略每行前 n 個字符的比較。

僅顯示唯一的行。

以空字符（null）而不是換行符來結束每行。這在處理包含換行符的字段時特別有用。

假設我們有一個名為 numbers.txt 的文件，內容如下：

要去除重復的行，我們可以這樣做：

sort numbers.txt | uniq

輸出：

使用 -c 選項，我們可以在每行前顯示其出現的次數：

sort numbers.txt | uniq -c

輸出：

使用 -d 選項，我們可以僅顯示重復的行：

sort numbers.txt | uniq -d

輸出：

2
4

uniq 命令是一個簡單而強大的工具，用于從排序好的文本文件中去除重復的行。通過結合不同的選項，我們可以實現各種復雜的文本處理任務。希望本文能幫助你更好地理解和使用 uniq 命令。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/23724.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/23724.shtml
英文地址，請注明出處：http://en.pswp.cn/web/23724.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！