ORACLE ODA一體機存儲節點電源故障的分析處理

近期,某用戶的ORACLE ODA一體機在例行機房巡檢時出現亮黃燈告警;用戶反饋次問題后我們立刻通過遠程方式,登陸ODA的控制臺進行查看;

對于ODA一體機(2個計算節點+1個存儲節點),計算節點可以通過ilom管理界面登陸進行詳細的硬件信息查看和管理,當然通過命令行也可以。

對于存儲節點,是沒有圖形界面可以看,可以通過ODA管理臺(7093/mgmt/index.html)或者命令查看;

本次問題查看為存儲節點的1個電源故障,由于雙電源配置,系統仍然可以正常工作;并且電源的更好工作是可以在線進行的。

如下為排查分析過程:

1、故障燈及系統中查看故障原因

[root@TEST2 ~]# odaadmcli show enclosure

? ? ? ? NAME ? ? ? ?SUBSYSTEM ? ? ? ? STATUS ? ? ?METRIC ??

? ? ? ? _FAN0 ? ? ? Cooling ? ? ? ? ? OK ? ? ? ? ?4910 rpm?
? ? ? ? _FAN1 ? ? ? Cooling ? ? ? ? ? OK ? ? ? ? ?4540 rpm?
? ? ? ? _FAN2 ? ? ? Cooling ? ? ? ? ? OK ? ? ? ? ?4920 rpm?
? ? ? ? _FAN3 ? ? ? Cooling ? ? ? ? ? OK ? ? ? ? ?4530 rpm?
? ? ? ? _IOM0 ? ? ? Encl_Electronics ?OK ? ? ? ? ?- ? ? ? ?
? ? ? ? _IOM1 ? ? ? Encl_Electronics ?OK ? ? ? ? ?- ? ? ? ?
? ? ? ? _PSU0 ? ? ? Power_Supply ? ? ?Critical ? ?-? ? ? ?===>>>顯示故障? ??
? ? ? ? _PSU1 ? ? ? Power_Supply ? ? ?OK ? ? ? ? ?- ? ? ? ?
? ? ? ? _TEMP0 ? ? ?Amb_Temp ? ? ? ? ?OK ? ? ? ? ?23 C ? ??
? ? ? ? _TEMP1 ? ? ?Midplane_Temp ? ? OK ? ? ? ? ?22 C ? ??
? ? ? ? _TEMP2 ? ? ?PCM0_Inlet_Temp ? OK ? ? ? ? ?30 C ? ??
? ? ? ? _TEMP3 ? ? ?PCM0_Hotspot_Temp OK ? ? ? ? ?24 C ? ??
? ? ? ? _TEMP4 ? ? ?PCM1_Inlet_Temp ? OK ? ? ? ? ?42 C ? ??
? ? ? ? _TEMP5 ? ? ?PCM1_Hotspot_Temp OK ? ? ? ? ?39 C ? ??
? ? ? ? _TEMP6 ? ? ?IOM0_Temp ? ? ? ? OK ? ? ? ? ?22 C ? ??
? ? ? ? _TEMP7 ? ? ?IOM1_Temp ? ? ? ? OK ? ? ? ? ?22 C?

4 、更換電源(可以先嘗試插拔電源線,電源線松動是可能的,插拔后也可能就恢復了)

更換的步驟MOS文檔(How to confirm power supply status about storage shelf on ODA X7-2 (Doc ID 2419846.1),How To Replace an ODA (Oracle Database Appliance) X6-2HA, X7-2HA, X8-2HA, X9-2HA DE3-24C Power Supply/Cooling Unit [VCAP] (Doc ID 2960220.1))有視頻和步驟,沒有特殊的難度,參考如下:

WHAT ACTION DOES THE FIELD ENGINEER/ADMINISTRATOR NEED TO TAKE?:
1. Locate the PSU by amber LED

The following LEDs are lit when a power supply fault is detected:

* Front and rear Service Required LEDs
* Rear PS Failure LED on the bezel of the server
* Failure LED on the faulty power supply

2. Verify the PSU part number in the System Handbook and re-confirm.

3. Removing the PSU as follows.
3.1 Clear access to the PSU of any cables harnesses or assemblies.
3.2 Ensure the PSU? On/Off switch is in the 'Off' Position.
3.3 Disconnect the power cord tie strap from the power cord, and unplug the power cord from the PSU.
3.4 Remove installed PSU by, Grasping the PSU handle, push the release button and slide out PSU.

4. Installing the Power Supply as follows or use the "online" Help Guide.

4.1 On the replacement PSU verify that the Release button is open .
4.2 Align PSU with empty bay in chassis and slide in .
4.3 Push the lever fully closed until you hear or feel a click.
4.4 Connect AC power cord to new PSU. Use the power cord retaining clips.
4.4 If required , place cable harness or assemblies back into normal position.
4.5 Turn the On/OFF switch to the On position .

5. Verify the replacement by checking for Green LED

IMPORTANT NOTE :
PSUs have a 3 minute Service time limit . When you remove a PSU the
fans on the remaining PSU go to 100 % duty cycle . Testing has shown that
HDD temperatures can exceed their operating temperature when a PSU has
been removed for 3 minutes.

5、檢查最終狀態(注意次命令的輸出,ODA 的2個計算節點的的輸出是不一致的,簡單說是檢測到恢復正常是有時間差的,如節點1顯示OK,節點2可能過幾分鐘才顯示OK)

[root@TEST2 ~]# odaadmcli show enclosure

? ? ? ? NAME ? ? ? ?SUBSYSTEM ? ? ? ? STATUS ? ? ?METRIC ??

? ? ? ? _FAN0 ? ? ? Cooling ? ? ? ? ? OK ? ? ? ? ?4910 rpm?
? ? ? ? _FAN1 ? ? ? Cooling ? ? ? ? ? OK ? ? ? ? ?4540 rpm?
? ? ? ? _FAN2 ? ? ? Cooling ? ? ? ? ? OK ? ? ? ? ?4910 rpm?
? ? ? ? _FAN3 ? ? ? Cooling ? ? ? ? ? OK ? ? ? ? ?4540 rpm?
? ? ? ? _IOM0 ? ? ? Encl_Electronics ?OK ? ? ? ? ?- ? ? ? ?
? ? ? ? _IOM1 ? ? ? Encl_Electronics ?OK ? ? ? ? ?- ? ? ? ?
? ? ? ? _PSU0 ? ? ? Power_Supply ? ? ?OK ? ? ? ? ?- ? ? ? ?
? ? ? ? _PSU1 ? ? ? Power_Supply ? ? ?OK ? ? ? ? ?- ? ? ? ?
? ? ? ? _TEMP0 ? ? ?Amb_Temp ? ? ? ? ?OK ? ? ? ? ?23 C ? ??
? ? ? ? _TEMP1 ? ? ?Midplane_Temp ? ? OK ? ? ? ? ?22 C ? ??
? ? ? ? _TEMP2 ? ? ?PCM0_Inlet_Temp ? OK ? ? ? ? ?29 C ? ??
? ? ? ? _TEMP3 ? ? ?PCM0_Hotspot_Temp OK ? ? ? ? ?24 C ? ??
? ? ? ? _TEMP4 ? ? ?PCM1_Inlet_Temp ? OK ? ? ? ? ?41 C ? ??
? ? ? ? _TEMP5 ? ? ?PCM1_Hotspot_Temp OK ? ? ? ? ?39 C ? ??
? ? ? ? _TEMP6 ? ? ?IOM0_Temp ? ? ? ? OK ? ? ? ? ?22 C ? ??
? ? ? ? _TEMP7 ? ? ?IOM1_Temp ? ? ? ? OK ? ? ? ? ?28 C ?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/10029.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/10029.shtml
英文地址,請注明出處:http://en.pswp.cn/web/10029.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Python爬蟲實戰:爬取【某旅游交通出行類網站中國內熱門景點】的評論數據,使用Re、BeautifulSoup與Xpath三種方式解析數據,代碼完整

一、分析爬取網頁: 1、網址 https://travel.qunar.com/2、 打開網站,找到要爬取的網頁 https://travel.qunar.com/p-cs299979-chongqing進來之后,找到評論界面,如下所示:在這里我選擇驢友點評數據爬取點擊【驢友點評…

騰訊共享WiFi項目的加盟方式有哪些?

在這個互聯互通的時代,共享經濟的浪潮正以前所未有的力量席卷全球,而騰訊作為中國互聯網巨頭之一自然不會錯過這場盛宴。其推出的騰訊共享WiFi項目自問世以來就備受矚目,它不僅為用戶提供便捷的上網服務,更為創業者打開了一個全新…

untiy 為預制體動態加載光照貼圖

unity版本為2021.8 預制體不能攜帶光照貼圖信息,只能我們自己準備了 多方查找加自己摸索終于找到了適合新版本的解決方案,直接貼代碼 將這個腳本掛到預制體的最上級 using System.Collections; using System.Collections.Generic; using UnityEditor; …

美顏SDK是什么?深度學習技術在直播美顏SDK中的應用探析

美顏SDK的出現為直播、視頻通話等應用提供了強大的美顏功能。接下來,我們將一同探討美顏SDK的概念,以及深度學習技術在直播美顏SDK中的應用。 一、什么是美顏SDK? 美顏SDK是一種軟件開發工具包,旨在為開發者提供便捷而強大的美顏…

四大誤區:中臺產品時設計你中招了幾個?

01 誤區一:管理系統分析工具數字化中臺 傳統企業在經營管理過程中會根據業務或管理需求,不斷添加和升級諸如OA、CRM等不同類別的管理系統。 為了更好地響應前臺的業務需求,有些企業成立了新的或擴大、加強了原有的技術部門,由…

LeetCode 題目 116:填充每個節點的下一個右側節點指針

作者介紹:10年大廠數據\經營分析經驗,現任字節跳動數據部門負責人。 會一些的技術:數據分析、算法、SQL、大數據相關、python,歡迎探討交流 歡迎加入社區:碼上找工作 作者專欄每日更新: LeetCode解鎖1000題…

C#上位機1ms級高精度定時任務

precisiontimer 安裝擴展包 添加引用 完整代碼 using PrecisionTiming;using System; using System.Collections.Generic; using System.ComponentModel; using System.Data; using System.Drawing; using System.Linq; using System.Text; using System.Threading.Tasks; us…

WinSCP軟件出錯:連接被意外關閉了

問題描述: WinSCP 登錄 M3568 的 linux系統,提示 列出’/home/root’的目錄項時出錯,連接被意外關閉 具體提示如下圖所示,列出’/home/root’的目錄項時出錯。 連接被意外關閉了 服務器發送命令的退出狀態255 原因及解決&#xf…

notepad++安裝 hex-editor插件

打開notepad 點擊插件 搜索 hex-editor,點擊右側 安裝install 安裝成功后,在已安裝插件中就有顯示了

spring boot參數驗證注解@NotNull、@NotBlank和@NotEmpty區別

目錄 前言說明舉例 前言 使用spring boot參數驗證是常常會使用NotNull、NotBlank和NotEmpty三個判斷是否不為空的注解,中文都有不能為空的意思,大部分使用者都傻傻分清它們之間到底有什么區別。今天就讓咱們來一起探索它們之間的不同吧。 說明 注解名…

等保測評安全物理環境測評講解

等保測評中的安全物理環境測評主要關注信息系統的物理安全保護措施,確保機房、設備和數據的物理安全。以下是安全物理環境測評的關鍵點講解: 1. **物理位置選擇**: - 機房應選擇在具有防震、防風和防雨能力的建筑內。 - 應避免設在建筑…

【數據庫】數據庫指令

一。數據庫打開 1.命令行 2.進入mysql mysql -uroot -p密碼 3.退出 exit; 二。針對數據庫的操作 1.創建數據庫(有分號) create database student; 2.使用數據庫 use student 3.刪除數據庫(有分號) drop database…

verilog基礎語法之數據類型

verilog基礎語法之數據類型 1、 wire類型2、 reg類型3、向量 Verilog最常用的數據類型有兩種:線網(wire)和寄存器(reg)。其中,wire 類型表示硬件單元之間的物理連線,reg用來表示存儲單元。 1、…

數據庫調優-數據庫優化

數據庫優化 如何發現復雜的SQL有問題? 一個個去explain嗎?你有沒有這樣的困惑,開發代碼運行順暢絲滑,上生產了卻卡的一逼? 哈哈,相信大家都會遇到這樣的問題! sql 復制代碼 # 舉個栗子&…

4. 從感知機到神經網絡

目錄 1. 從感知機到神經網絡 2. 最簡單的神經網絡 3. 激活函數的引入 1. 從感知機到神經網絡 之前章節我們了解了感知機,感知機可以處理與門、非與門、或門、異或門等邏輯運算;不過在感知機中設定權重的工作是由人工來做的,而設定合適的&a…

【將Maven源改為國內阿里云鏡像源】

目錄 一、如何配置Maven鏡像源? 二、Idea中的Maven配置 ?三、項目與你本地倉庫和中央倉庫的聯系 一、如何配置Maven鏡像源? 1、打開你的Maven用戶設置文件(settings.xml)。默認情況下,該文件存在于你的用戶目錄下的.m2文件夾中。如果你沒…

小程序內使用web-view組件嵌套H5頁面,當H5頁面更換了內容后,小程序里的h5頁面不更新

這個問題是由于小程序緩存了H5的內容造成的&#xff0c;可以在H5鏈接后面拼接個參數&#xff0c;加上時間戳可做用于H5的版本號&#xff0c;這樣每次訪問都可以全新的鏈接展示內容避免緩存&#xff0c;代碼如下wxml&#xff1a; <view> <web-view src"{{urlpath…

Kafka 執行命令超時異常: Timed out waiting for a node assignment

Kafka 執行命令超時異常&#xff1a; Timed out waiting for a node assignment 問題描述&#xff1a; 搭建了一個kafka集群環境&#xff0c;在使用命令行查看已有topic時&#xff0c;報錯如下&#xff1a; [rootlocalhost bin]# kafka-topics.sh --list --bootstrap-server…

《機器學習by周志華》學習筆記-決策樹-01

本書中的「決策樹」有時指學習方法,有時指學得的樹。 1、基本流程 1.1、概念 基本流程,亦稱「判定樹」 決策樹(decision tree),是一種常見的機器學習方法。以二分類任務為例,我們希望從給定訓練數據集學得一個模型,用以對新樣例進行分離。 以二分類任務為例,可看作對…

一圖看懂 | 藍卓煤炭行業解決方案

煤炭是我國能源保障的“壓艙石,也是國民經濟中重要的支柱產業之一無論是發電、建材、造紙、冶金、化工等工業領域都離不開煤炭近年來&#xff0c;在“雙碳”及能源安全雙重背景下推動智能化技術與煤炭產業的融合發展提升煤礦安全生產能力的重要性與日俱增智慧礦山的建設已逐漸成…