? ? ? 華為在進行元數據治理以前,遇到的元數據問題主要表現為數據找不到、讀不懂、不可信,數據分析師們往往會陷入數據沼澤中,例如以下常見的場景。
- 某子公司需要從發貨數據里對設備保修和維保進行區分,用來不對過保設備進行服務場景分析。為此,數據分析師需面對幾十個IT系統,不知道該從哪里拿到合適的數據。
- 因盤點內部要貨的研發領料情況,需要從IT系統中獲取研發內部的要貨數據,面對復雜的數據存儲結構(涉及超過40個物理表和超過1000個字段)、物理層和業務層脫離的情況,業務部門的數據分析師無法讀懂物理層數據,只能提出需求向IT系統求助。
- 某子公司存貨和收入管理需要做繁重的數據收集與獲取工作,運行一次計劃耗時超過20個小時。同時,由于銷售、供應、交付各領域計劃的語言不通,還需要數據分析師進行大量人工轉換與人工校驗。
以上場景頻繁出現在公司日常運營的各個環節,極大地阻礙了公司數字化轉型的進行,其根本原因就在于業務元數據與技術元數據未打通,導致業務讀不懂IT系統中的數據。并且缺乏面向普通業務人員的準確、高效的數據搜索工具,業務人員無法快速獲取可信數據。元數據管理的痛點如圖所示:

為解決以上痛點,華為建立了公司級的元數據管理機制。制定了統一的元數據管理方法、機制和平臺,拉通業務語言和機器語言。 確 保數據“入湖有依據,出湖可檢索”成為華為元數據管理的使命與目 標。基于高質量的元數據,通過數據地圖就能在企業內部實現方便的數據搜索。
元數據是描述數據的數據,用于打破業務和IT之間的語言障礙,幫助業務更好地理解數據。元數據通常分為業務、技術和操作三類。
- 業務元數據:用戶訪問數據時了解業務含義的途徑,包括資產目錄、Owner、數據密級等。
- 技術元數據:實施人員開發系統時使用的數據,包括物理模型的表與字段、ETL規則、集成關系等。
- 操作元數據:數據處理日志及運營情況數據,包括調度頻度、訪問記錄等。
在企業的數字化運營中,元數據作用于整個價值流,在從數據源到數據消費的五個環節中都能充分體現元數據管理的價值。
- 數據消費側:元數據能支持企業指標、報表的動態構建。
- 數據服務側:元數據支持數據服務的統一管理和運營,并實現利用元數據驅動IT敏捷開發。
- 數據主題側:元數據統一管理分析模型,敏捷響應井噴式增長的數據分析需求,支持數據增值、數據變現。
- 數據湖側:元數據能實現暗數據的透明化,增強數據活性,并能解決數據治理與IT落地脫節的問題。
- 數據源側:元數據支撐業務管理規則有效落地,保障數據內容合格、合規。