目錄
- 背景
- 原因分析
- 解決步驟
- 名詞解釋
- 進入raid管理界面
- 換回舊4號,進行import
- 再次更換4號盤
- 總結
背景
服務器除塵之后文件服務器部分文件不能訪問了,部分文件夾內容為空,起初以為是新配置的權限的問題,排查之后發現不僅僅是權限問題
jumpserver訪問服務器發現部分文件顯示“???”
此時想到可能是服務器硬件故障了,隨即查看
服務器顯示內容:
服務器燈2號黃燈閃爍,5號8號燈不亮,顯然不是好的預兆
原因分析
1、文件夾為空可能是陣列出現了問題
2、沒有權限訪問應該是修改了Samba的配置文件
初步分析
文件夾為空:這通常與存儲介質(如硬盤)上的數據丟失或不可訪問有關。在RAID環境中,這可能是由于某個或多個物理磁盤(PD)故障或RAID配置問題導致的。
無權限訪問:雖然最初懷疑是Samba配置問題,但考慮到是在除塵后出現的,這更可能是由硬件或RAID陣列狀態變化導致的文件系統權限或所有權問題。
解決步驟
名詞解釋
首先對raid界面的幾個名詞了解一下
diskgroup:磁盤組,這里相當于是陣列,例如配置了一個raid5,就是一個磁盤組
vd(virtual disk):虛擬磁盤,虛擬磁盤可以不使用陣列的全部容量,也就是說一個磁盤組可以分為多個vd
pd(physical disk):物理磁盤
hs:hotspare 熱備
mgmt:管理
進入raid管理界面
CTRl+r 進入raid
VD mgmt:2號和4號missing,8號不見了
PD mgmt:2號和4號 Foreign
解釋一下這里的foreign,RAID控制器識別到的一個不屬于其當前配置或管理域的存儲配置。這可能是從另一個系統遷移過來的硬盤,或者是在沒有正確初始化或導入到當前系統的情況下插入的硬盤。
Foreign View界面:多了一個陣列DISk Group 2,顯示4號 Online
這里也可以說明4號不屬于當前配置或管理域的存儲配置,應該是從另一個系統遷移過來的硬盤(前兩天剛剛把4號盤換了,但是僅僅換了,而沒有配置,和顯示的情況一致)
換回舊4號,進行import
上面說4號是之前換掉的(這里稱它為新4號,為了和替換掉的舊4號區分),所以又把之前認為壞掉的舊4號取回來(當時舊4號狀態燈不亮了,所以認為它壞掉了,直接找了一塊不用的盤放了進去,從上面的可以看出來, 新4號之前在其他raid中進行過配置),放了進去
在VD 界面,F2
import之后,沒有foreign view了,也就是沒有外來盤了
2號online,4號offline
- Online(在線):
○ 硬盤或RAID卷是活動的,并且可以被系統訪問。
○ 數據可以從該硬盤或RAID卷中讀取,也可以寫入其中(如果它是可寫的)。
○ 通常,當系統啟動時,所有健康的硬盤和RAID卷都會自動變為在線狀態。 - Offline(離線):
○ 硬盤或RAID卷當前不可用或不可訪問。
○ 這可能是由于多種原因,例如硬盤故障、RAID控制器問題、配置錯誤或管理員手動將其設置為離線。
○ 當硬盤或RAID卷處于離線狀態時,不能從其中讀取或寫入數據。
○ 在某些情況下,管理員可能會選擇將硬盤或RAID卷設置為離線,以便進行維護、更換或重新配置。
這里顯然不是我故意把4號設置成offline的
再看一下PD Mgmt界面,沒有4號,仍舊沒有8號(一會兒再解決8號問題)
舊4號這里就是壞掉了,取下舊4號,這里是熱插拔,4號位置顯示Missing
再次更換4號盤
這里使用了一塊沒有做過raid的盤放到了4號位置,直接rebuild了
到這里,陣列再重建了,8號暫時不解決,等陣列徹底修復之后,再進行一下備份,再解決8號和2號問題.
總結
Foreign View:當RAID控制器識別到不屬于其當前配置或管理域的硬盤時,會顯示為Foreign。這通常意味著硬盤來自另一個RAID配置或系統。
Import:當將舊4號硬盤換回并成功導入后,Foreign View消失,這表明RAID控制器現在能夠識別并管理這塊硬盤。
在RAID陣列中,當一個或多個磁盤發生故障或丟失時,確實需要進行重建以恢復數據的冗余和完整性。
最后再說一下整體分析過程和解決步驟
1、確認RAID級別和配置。
2、替換故障磁盤
3、等待重建完成:
RAID重建是一個耗時的過程,具體取決于RAID級別、磁盤容量、RAID控制器性能以及替換磁盤的寫入速度。要耐心等待重建完成。
4、備份數據:
在陣列重建完成后,強烈建議立即備份所有數據。雖然RAID提供了數據冗余,但備份仍然是最可靠的數據保護方式。
5、解決其他丟失的磁盤:
這里還有8號和2號磁盤存在問題。在解決了4號磁盤的問題后,按照類似的步驟來處理這些磁盤。但是,如果RAID陣列中的多個磁盤同時發生故障,可能會導致數據丟失的風險增加。
6、檢查硬件和連接:
確保所有磁盤都正確連接在RAID控制器上,并且沒有物理損壞或連接問題。有時,磁盤丟失可能是由于電纜松動、連接器臟污或硬件故障引起的。
7、檢查RAID控制器和驅動程序
切記,在進行任何可能影響數據完整性的操作之前,始終確保有可靠的數據備份。這將是在出現問題時恢復數據的最后一道防線。