阿里云99計劃總是宕機,經過反復排查,最終確認還是磁盤性能差。
阿里云99機器使用的磁盤類型是Entry云盤40GiB (2120 IOPS)
按照官方的一些數據,這個磁盤最小iops是1800最大是6000,實際使用中發現,這個6000值很虛,這個還不是突發實例。凌晨跑定期對msyql大量讀寫時iops上限強制卡在1800,均值卡死1700,這個直接導致mysql oom ,這個狀態通過網頁自帶的vnc過去看到的都是這個結果。
上面的卡死還不是每天出現,說明這個磁盤的iops穩定性很差,有時能達到最大,有時能達到最小值就不錯了。之前測1c1g的機器也是這樣的。
類似的情況:低內存阿里云服務器搭建網站CPU、磁盤讀取BPS異常問題解決方案-成培培的博客
不過我的服務都是docker形式的,官方是需要禁用swap的,所以加swap的方案不適用,懷疑還是內存超售。
檢測內存超售:一鍵檢測VPS內存是否超售 - 怕刺
檢測內存超售2:Memtester一鍵測試腳本,檢測VPS真實可分配內存及超售情況-國外主機測評
先優化內存超售,禁用內存氣泡Virtio-Balloon,參考:禁用Virtio-Balloon | Sakura Homura 的垃圾桶
禁用氣泡操作
vi /etc/modprobe.d/blacklist.conf#添加
blacklist virtio_balloon#保存后更新initramfs
dracut -f#重啟
reboot
最近加入了友商99計劃的輕量機器對比,最開始我以為也會報oom,結果跑同樣的數據也沒報oom ,比阿里的還穩定,所以阿里磁盤性能差石錘了。