問題描述
背景:由于raid控制器的不兼容性問題,我被迫將服務器從Ubuntu 8.04 LTS遠程升級到10.04 LTS。
與服務器的Internet連接比較穩定,很少掉線。盡管如此,我還是擔心在升級時會丟失通過SSH的連接,從而使服務器處于無法訪問的狀態。我也擔心服務器在升級后無法啟動,以防萬一我不知道是什么問題。
行動計劃:我正在尋找的建議是最大程度地減少丟失服務器的風險,我知道我正在做的事情非常冒險。這是我目前的行動計劃:
1)在本地和外部備份所有重要的內容。
2)使用fsck暫時禁用boot-time磁盤檢查。 (如果磁盤檢查需要很長時間才能完成,我不知道會發生什么情況)。這可以通過將最后一個參數從1更改為0來通過fstab來完成:
UUID=5b1ff964-7608-44fd-a38d-7e43ad6b4c11 / ext3 relatime,errors=remount-ro 0 0
3)從屏幕開始所有升級過程,以便在我斷開連接后可以恢復。即:
sudo screen apt-get upgrade
問題:
我提出的行動計劃似乎合理嗎?
禁用boot-time磁盤是一個壞主意嗎?
還可以采取其他措施來降低丟失服務器的風險嗎?
更新:幾乎所有答案都建議我設置DRAC /IPMI,而現在已經完成了。這感覺像是一個非常偉大的成就,肯定會使風險大大減小,因為我可以通過KVM /控制臺重定向來跟蹤整個電源周期。供以后參考,這是我所做的:
1)安裝了ipmitool來設置IPMI v2.0的IP地址,網關等:
sudo ipmitool lan set 1 ipaddr 192.168.1.99
sudo ipmitool lan set 1 defgw ipaddr 192.168.1.1
2)安裝了free-ipmi,將NIC選擇模式更改為共享(我只有一個網絡接口連接到網絡):
sudo ipmi-oem dell set-nic-selection shared
3)使用https://192.168.1.99上的DRAC的https界面啟動控制臺重定向查看器。這使我可以遵循整個啟動順序以及配置BIOS,RAID控制器等。
更新2.完成。所有人都充滿了魅力,不到30分鐘就完成了工作。我最終沒有關閉磁盤檢查,因為重定向的控制臺讓我可以隨時隨意中斷它,但是我讓它運行到最后。
謝謝你們,您的智慧無價!
最佳方案
如果硬件沒有損壞,那么串行控制臺是您無法做的任何事情,這就是解決方法:
可以遠程訪問串行控制臺(如果系統具有> = IPMI-2.0,則為LAN上的IPMI串行,或者將空調制解調器串行電纜連接到將在其中運行minicom的另一個系統)
配置grub和linux以使用串行控制臺
如果可能的話,重定向串行系統的BIOS接口(許多服務器系統都可以這樣做)
重新引導系統,并檢查您可以使用(BIOS),grub,查看dmesg,查看初始化腳本以及通過串行控制臺登錄
運行升級
交叉手指
另外,請盡可能將新系統安裝在另一個磁盤或分區上,以便您可以在擦除舊系統之前測試新系統。我通常使用兩塊磁盤系統來執行此操作:我從鏡像中取出一個磁盤,使用可用磁盤創建一個新的(降級的)鏡像,然后安裝在那里,如果一切正常,我將舊鏡像銷毀,并將hot-add ‘old’磁盤銷毀到新磁盤鏡像并重建它。
編輯:我讀到的是應該具有IPMI2的Dell R710,AFAIK。配置它在系統上本地運行ipmitool,并在另一個系統上使用ipmitool sol enable測試LAN串行功能。砰!您有串行控制臺。戴爾還能夠在串行控制臺上重定向BIOS(該IPMI將依次在serial-over-lan上重定向)。如果確實有任何問題,您還是應該這樣做才能訪問系統。我使用空調制解調器電纜,BIOS,grub,系統串行控制臺和一些Dell R300,以相同的方式管理一對舊的Dell PE1425,但使用LAN上IPMI串行代替實際的串行電纜。
參考資料