pve的主機突然CPU滿載,然后遠程斷電后pve就無法啟動了,之前一直上面的虛擬機和容器也沒有備份,折騰了兩天總算找回來了記錄一下處理過程和思路,方便后續查找。
一、隱患分析
1.周四突然手欠,由于之前家里的pve主機老給我發郵件,提示我硬盤有問題,但可以正常使用,我從網上找了半天也沒有好的關閉方案,隨后我就看看smart這個硬盤檢測服務關閉能不能生效
硬盤smart檢查服務關閉
systemctl disable smartmontools
systemctl enable smartmontools
systemctl stop smartmontools
2.看到pve有個ceph從來沒用過(不知道干啥的),于是手欠嘗試了一下,安裝完成后,連接地址配置到了pve本機,但好像沒啥用。
3.我的pve主機i3-2120 16g內存小馬拉大車,硬盤一個ssd+一個hdd,混合存儲,刪除了local-lvm卷都合并到local下
二、問題解決之路
我本人對Linux的了解,只是會用一點兒命令,然后知道Linux萬物皆文件。
主要參考文檔Proxmox VE 中文手冊 v7.3 — Promxox VE 中文文檔 7.1 文檔
1.pve開機直接進入initramfs 模式,比較高級我也不懂,我只知道
參考這篇文章http://www.zztongyun.com/article/pve%E5%90%AF%E5%8A%A8%E5%8D%A1%E5%9C%A8loading
blkid //查看硬盤信息,你只要查出硬盤格式為type=ext4 的分區fsck -t ext4 /dev/sdb2 -y
用這個命令修復了幾次還是報錯
但至少硬盤沒壞,后來我也把硬盤拆下來,放連到另一臺Linux電腦上試了一下(本以為都是Linux可能可以直接打開),結果提示讓格式化,應該是pve的文件系統在deepin上不識別。
然后也嘗試了用pve的安裝鏡像進debug模式折騰半天也沒啥用。
2.重裝系統打算用pve來識別自己原來的系統盤
重裝完成后用,插上原來的兩個硬盤數據盤,了解了pve有vg,lv,lvm等概念
vgdisplay查看 默認