文件系統與文件管理：從磁盤到內核的全鏈路解析

一、文件系統：磁盤的 “數據管家”

1.1 硬盤物理結構：數據存儲的硬件基礎

硬盤如同一個多層書架，由以下核心部件構成：

盤片：多層磁性圓盤，正反兩面覆蓋磁性涂層，用于存儲二進制數據（磁疇的極性表示 0/1）。
磁頭：每個盤面對應一個磁頭，負責讀寫磁性涂層的數據，通過脈沖電流改變磁疇極性（寫）或檢測剩磁（讀）。
驅動臂與主軸：驅動臂移動磁頭定位到不同磁道，主軸帶動盤片高速旋轉（如 7200 轉 / 分鐘）。

磁道與扇區：最小存儲單元

磁道（Track）：盤片旋轉時磁頭固定劃出的同心圓，外圈磁道周長更長，可容納更多扇區。
扇區（Sector）：磁道等分的存儲單元，大小通常為 512 字節 / 4KB，是磁盤讀寫的最小單位。
柱面（Cylinder）：不同盤片同一半徑的磁道組成的虛擬圓柱，用于統一尋址（如 “柱面號 + 磁頭號 + 扇區號” 定位數據）。

1.2 文件系統邏輯結構：從物理到邏輯的抽象

文件系統如同一個 “數據圖書館”，將磁盤劃分為多個分區，每個分區獨立管理：

磁盤驅動器
├─ 分區1（文件系統）
│  ├─ 引導塊（Boot Block）：存儲系統啟動代碼（如GRUB）
│  ├─ 超級塊（Super Block）：記錄文件系統元數據（總塊數、i節點數、空閑塊等）
│  └─ 柱面組（Cylinder Group）：
│     ├─ i節點表（Inode Table）：存儲文件元數據（權限、大小、數據塊指針等）
│     ├─ 塊位圖（Block Bitmap）：用二進制位標記數據塊是否空閑（1=已用，0=空閑）
│     └─ 數據塊（Data Blocks）：存儲文件實際內容（普通文件數據或目錄條目）
└─ 分區2（文件系統）...

i 節點（Inode）：文件的 “戶口本”

作用：每個文件 / 目錄對應唯一 i 節點，存儲元數據（類型、權限、硬鏈接數、數據塊索引等），不存儲文件名。
i 節點號：通過ls -i查看，文件名與 i 節點號的映射存儲在目錄文件中（即硬鏈接）。
數據塊索引：
- 直接塊：直接存儲數據塊地址（如前 12 個指針指向實際數據塊）。
- 間接塊：通過一級 / 二級 / 三級間接塊管理大文件（如 EXT4 支持最大 16TB 文件）。

1.3 文件訪問流程：從文件名到數據的旅程

訪問文件/home/user/file.txt的過程如下：

解析路徑：從根目錄開始，按 “/home/user/file.txt” 逐級解析目錄。
獲取 i 節點：
- 根目錄 i 節點固定（通常為 2 號 i 節點），讀取根目錄數據塊，找到 “home” 目錄的 i 節點號。
- 依此類推，直到找到 “file.txt” 的 i 節點號。
讀取數據：根據 i 節點中的數據塊索引，從磁盤讀取數據塊內容。

二、文件類型：操作系統的 “數據分類法”

Linux 通過文件類型區分數據用途，ls -l輸出的首字符表示類型：

類型	符號	說明	示例
普通文件	`-`	存儲用戶數據（文本、二進制、多媒體等）	`main.c`、`a.out`
目錄文件	`d`	存儲文件名與 i 節點號的映射（本質是特殊普通文件）	`~/Documents`
符號鏈接	`l`	存儲目標文件路徑（類似 Windows 快捷方式）	`link.txt -> target.txt`
本地套接字	`s`	用于進程間通信（IPC）的特殊文件，支持本機通信	`socket.sock`
字符設備	`c`	按字節流訪問的設備（如鍵盤、串口）	`/dev/ttyUSB0`
塊設備	`b`	按塊隨機訪問的設備（如硬盤、U 盤）	`/dev/sda1`
有名管道	`p`	基于文件的進程間通信管道（FIFO）	`pipe_fifo`

三、文件操作：從打開到讀寫的核心接口

3.1 打開文件：`open()`

#include <fcntl.h>
int open(const char* pathname, int flags, mode_t mode);

flags 參數：
- 必選：O_RDONLY（只讀）、O_WRONLY（只寫）、O_RDWR（讀寫）。
- 可選：O_CREAT（不存在則創建）、O_APPEND（追加寫）、O_TRUNC（清空文件）。
mode 參數：新建文件權限（如0664表示所有者讀寫，組用戶讀寫，其他用戶讀），需與umask掩碼取反后按位與（實際權限 = mode & ~umask）。

示例：創建并寫入文件

int fd = open("test.txt", O_WRONLY | O_CREAT | O_TRUNC, 0644);
if (fd == -1) {perror("open failed");exit(1);
}
write(fd, "hello world", 11);
close(fd);

3.2 讀寫文件：`read()`/`write()`

#include <unistd.h>
ssize_t read(int fd, void* buf, size_t count);  // 讀數據到buf
ssize_t write(int fd, const void* buf, size_t count); // 寫buf數據到文件

返回值：成功返回實際讀寫字節數，read返回0表示 EOF，失敗返回-1。
注意：
- 普通文件按字節讀寫，設備文件可能阻塞（如從鍵盤讀數據）。
- 多次讀寫同一文件時，文件偏移量（lseek）自動遞增。

3.3 隨機讀寫：`lseek()`

#include <unistd.h>
off_t lseek(int fd, off_t offset, int whence);

whence 參數：
- SEEK_SET：從文件頭開始偏移（如lseek(fd, 5, SEEK_SET)定位到第 5 字節）。
- SEEK_CUR：從當前位置偏移（如lseek(fd, -3, SEEK_CUR)回退 3 字節）。
- SEEK_END：從文件尾偏移（如lseek(fd, 0, SEEK_END)獲取文件大小）。

示例：創建空洞文件

int fd = open("hole.txt", O_WRONLY | O_CREAT, 0644);
lseek(fd, 1024*1024, SEEK_SET); // 偏移1MB
write(fd, "x", 1); // 文件大小變為1MB+1字節，中間空洞不占磁盤空間

四、文件描述符：用戶空間的 “內核訪問憑證”

4.1 內核結構：從文件描述符到物理資源

文件描述符（FD）：進程打開文件的唯一標識（非負整數，默認 0/1/2 為標準輸入 / 輸出 / 錯誤）。
內核數據結構：
- 文件描述符表：每個進程獨立，記錄 FD 對應的文件表項指針和標志（如 close-on-exec）。
- 文件表項：記錄文件狀態（讀寫位置、打開標志）和 v 節點指針（v 節點是內存中的 i 節點副本）。
- v 節點表：存儲文件元數據，多個進程打開同一文件共享同一個 v 節點。

4.2 FD 復制：`dup()`/`dup2()`

#include <unistd.h>
int dup(int oldfd);          // 復制到最小可用FD
int dup2(int oldfd, int newfd); // 復制到指定FD（newfd先關閉）

應用場景：
- 重定向標準輸出：dup2(fd, STDOUT_FILENO)將輸出重定向到文件。
- 多 FD 共享同一文件表項（如日志文件同時寫入和備份）。

示例：輸出重定向到文件

int fd = open("output.log", O_WRONLY | O_CREAT | O_TRUNC, 0644);
dup2(fd, STDOUT_FILENO); // 后續printf輸出到文件
printf("this goes to output.log\n");

五、高級文件操作：性能與安全的平衡

5.1 內存映射文件：`mmap()`

優勢：
- 直接操作內存，減少read/write系統調用開銷（適用于大文件處理）。
- 支持進程間共享內存（通過MAP_SHARED標志）。
示例：讀取大文件內容

int fd = open("large.file", O_RDONLY);
struct stat st;
fstat(fd, &st);
char* buf = mmap(NULL, st.st_size, PROT_READ, MAP_PRIVATE, fd, 0);
printf("%s", buf);
munmap(buf, st.st_size);

5.2 文件鎖：避免并發沖突

#include <fcntl.h>
struct flock {short l_type;   // F_RDLCK（讀鎖）、F_WRLCK（寫鎖）、F_UNLCK（解鎖）off_t l_start;  // 鎖區域起始偏移off_t l_len;    // 鎖區域長度（0表示到文件尾）
};
int fcntl(int fd, F_SETLK/F_SETLKW, struct flock* lock);

類型：
- 讀鎖（共享鎖）：多個進程可同時持有，阻止寫鎖。
- 寫鎖（排他鎖）：僅一個進程持有，阻止其他讀寫鎖。
模式：
- F_SETLK：非阻塞加鎖，失敗立即返回（errno=EAGAIN）。
- F_SETLKW：阻塞加鎖，直到鎖可用。

示例：寫鎖保護配置文件

struct flock lock = {.l_type = F_WRLCK,.l_start = 0,.l_len = 0, // 鎖整個文件
};
fcntl(fd, F_SETLKW, &lock); // 阻塞直到獲取寫鎖
// 寫入配置數據
fcntl(fd, F_SETLK, &(struct flock){.l_type = F_UNLCK}); // 解鎖

六、文件元數據：文件的 “身份信息”

6.1 獲取元數據：`stat()`家族

#include <sys/stat.h>
int stat(const char* path, struct stat* buf);   // 跟隨符號鏈接
int lstat(const char* path, struct stat* buf);  // 不跟隨符號鏈接
int fstat(int fd, struct stat* buf);            // 通過FD獲取

6.2 解析權限：`st_mode`的秘密

// 示例：判斷文件是否為目錄
if (S_ISDIR(st.st_mode)) {printf("這是目錄\n");
}// 提取權限位
printf("權限：%c%c%c%c%c%c%c%c%c\n",(st.st_mode & S_IRUSR) ? 'r' : '-',(st.st_mode & S_IWUSR) ? 'w' : '-',(st.st_mode & S_IXUSR) ? 'x' : '-',// 組權限和其他用戶權限類似...
);

七、性能優化：系統 I/O vs 標準 I/O

特性	系統 I/O（`read/write`）	標準 I/O（`fread/fwrite`）
緩沖機制	無（每次調用觸發系統調用）	有（用戶空間緩沖區，減少系統調用）
靈活性	直接操作 FD，適合底層控制	高層抽象（如格式化輸入輸出）
性能	低（頻繁系統調用）	高（批量操作減少上下文切換）
適用場景	設備驅動、網絡協議棧	文件處理、用戶交互

示例：寫入 100 萬次數據的性能對比

// 系統I/O（慢）
for (int i=0; i<1e6; i++) {write(fd, &i, sizeof(int));
}// 標準I/O（快，緩沖區自動合并寫入）
FILE* fp = fopen("data.txt", "w");
for (int i=0; i<1e6; i++) {fwrite(&i, sizeof(int), 1, fp);
}
fflush(fp); // 強制刷新緩沖區