初識Linux · 文件系統

前言：

簡單理解文件系統

細節理解

前言：

前文我們介紹了磁盤，介紹磁盤的原因是因為我們需要在理解文件系統之前，通過磁盤的了解，介紹一些文件相關的內容，比如文件是如何在磁盤里面存儲的，什么是CHS定址法，為什么OS不使用CHS定址法，什么是LBA塊等。

我們今天的介紹順序是，先簡單搭建起來對文件系統的理解，再深挖細節問題。

那么，進入今日的話題吧！

簡單理解文件系統

對于文件系統框架的搭建，我們可以先從這個指令進入：

即stat指令，查看文件的信息，這個信息，是文件的屬性？還是文件的內容呢？

我們知道文件 = 屬性 + 內容，但是我們常常關注的都是文件的內容，對于文件的屬性我們關注的并沒有那么常見。所以要理解文件系統的框架，我們要從文件的屬性進入。

由stat提供的信息來看，我們看到了File:main.c，這個代表的是文件名，Size代表的是文件的大小，Blocks？IO Block? Inode?這些都是什么？

不急，我們再次引入上文的話題：

對于上文，將磁盤從非線性的轉換為了線性的，然后線性的空間我們看成了數組，那么數組，我們可以通過位圖的類似做法，找到數據的存儲地址。但是因為磁盤取數據的特殊點，取數據都是一次性的取4kb數據，所以OS為了方便將數據分為了多個塊，也就是LBA塊，分好之后，找到一整塊空間就十分容易了。

所以我們對于文件的管理從磁盤，到了CHS，到了數組，到了LBA，最后無非就是搞清楚LBA里面究竟有什么就可以了：

形象的圖片就是這樣，那么塊組里面，我們分清楚了有Super Block, Group Deseciptor Table, Block Bitmap, Inode Table, Data Blocks。

那么我們從哪里開始討論呢？

從Data Blocks開始討論：Data Blocks是數據塊的翻譯，也就是文件的內容都是放在這里的，但是因為方便介紹，我們將Data Blocks的大小縮小成了和其他差不多的大小。對于該塊，占據的空間大小應該是整個塊組的95%以上。

那么對于Data Blocks里面都有什么呢？

看起來是非常抽象的，因為Data Blocks里面存儲的都是一個一個的數據塊，大小都是為4kb的，取的時候就直接將該數據塊丟出去就行了。

對于這么多的數據塊，都是只存儲文件的內容的。?

并且，我們知道，文件 = 內容 + 屬性，對于文件內容屬性而言，Linux特定的文件系統是將文件的屬性和內容分開存儲的，這點我們先記住。對于Data Blocks我們就探討到這里。

那么下一個，就是Block?Bitmap，相信在C++學習的時候，同學們都是知道位圖這個概念的。

最開始介紹位圖的時候，都是通過的判斷數據是否在一堆數據的集合里面，這里同理，引入block Bitmap就是為了判斷是否某個數據塊是否存在數據，這里位圖就不多介紹了，但是引入了位圖，確實能在遍歷數據塊上節省極大部分的時間。

下一個就是非常重要的inode Table，inode Table成為i節點表，存放的是文件的屬性，文件的大小，所有者，最近的修改時間等。這是inode Table。

那么文件的屬性一般都有什么呢？

struct inode
{int size;mode_t mode;int creater;int time;...int inode_number;int datablocks[N];
};

我們拿幾個非常常見的出來舉例，文件大小，文件的權限，創建時間等，但是最重要的，我們應該關心inode_number和datablocks[N]。而這個塊的名字是inode_table，所以它所處的空間自然是這么多個結構體所處的集合。

所以！！文件的屬性不過是一個一個完全相同的結構體！！

而在里面，inode的結構體如何分區的呢，都是通過inode_number進行分區的，那么datablocks的作用是什么呢？我們使用文件的時候，通過了inode_number找到了對應的文件屬性結構體，我們需要找到內容，就需要datablocks，這個數據指向的內容就是block Data的空間：

像這樣，比如N等于12的時候，前11個直接指向的數據塊，但是我們沒有辦法找到對應的大文件，所以第12個，指向的Data Blocks里面也存放的指針，指向了其他的數據塊，就有一種指數的感覺。

那么數據還不夠，13 14后面都可以指向，并且就不是一層關系這么簡單了，是一層指向一層，一層又指向一層，套好幾層最后才指向數據，這樣就能找到大文件的數據了。

這種查找數據的方法叫做ext2文件系統，我們目前大多數使用的都是ext2，還有ext3 ext4等。

所以對于inode結構體我們就知道了個所以然，那么inode bitmap？那不就是同理了嗎！！

通過inode bitmap找到表里面的某個位置是否存在文件的屬性，然后進行后續的操作。

那么現在，我們就清楚了inode table, inode bitmap, data blocks, data bitmap。對于剩下的兩個，比如GDT，也就是Group Descriptor table，翻譯過來叫做塊組描述符，描述的是塊組的屬性信息，其實就是這個塊的信息了，這更加體現了一種分治的思想。

對于Super blocks，它的名字可就厲害了，叫做超級塊，存放的是文件系統本身的結構信息，而且不是每個組都有的，可能幾個組才回有一個。比如存放的有inode使用的個數，未使用的個數，datablocks的使用個數，datablocks未使用的個數。這些都是超級塊所要記錄的內容。

那么提問，既然是記錄所有的結構信息，為什么要整這么多個呢？

因為磁盤是可能損壞的，如果損壞的時候，剛好磁頭給一個超級塊的內容消除了，那么這不就完蛋了嗎？？所有多存儲幾個，增加了容錯率！！

說了那么多，inode是十分重要的，查看inode是-i：