【華為數據之道學習筆記】3-9元數據治理面臨的挑戰

? ? ? 華為在進行元數據治理以前,遇到的元數據問題主要表現為數據找不到、讀不懂、不可信,數據分析師們往往會陷入數據沼澤中,例如以下常見的場景。
  • 某子公司需要從發貨數據里對設備保修和維保進行區分,用來不對過保設備進行服務場景分析。為此,數據分析師需面對幾十個IT系統,不知道該從哪里拿到合適的數據。
  • 因盤點內部要貨的研發領料情況,需要從IT系統中獲取研發內部的要貨數據,面對復雜的數據存儲結構(涉及超過40個物理表和超過1000個字段)、物理層和業務層脫離的情況,業務部門的數據分析師無法讀懂物理層數據,只能提出需求向IT系統求助。
  • 某子公司存貨和收入管理需要做繁重的數據收集與獲取工作,運行一次計劃耗時超過20個小時。同時,由于銷售、供應、交付各領域計劃的語言不通,還需要數據分析師進行大量人工轉換與人工校驗。
以上場景頻繁出現在公司日常運營的各個環節,極大地阻礙了公司數字化轉型的進行,其根本原因就在于業務元數據與技術元數據未打通,導致業務讀不懂IT系統中的數據。并且缺乏面向普通業務人員的準確、高效的數據搜索工具,業務人員無法快速獲取可信數據。元數據管理的痛點如圖所示:
為解決以上痛點,華為建立了公司級的元數據管理機制。制定了統一的元數據管理方法、機制和平臺,拉通業務語言和機器語言。 保數據“入湖有依據,出湖可檢索”成為華為元數據管理的使命與目 標。基于高質量的元數據,通過數據地圖就能在企業內部實現方便的數據搜索。
元數據是描述數據的數據,用于打破業務和IT之間的語言障礙,幫助業務更好地理解數據。元數據通常分為業務、技術和操作三類。
  • 業務元數據:用戶訪問數據時了解業務含義的途徑,包括資產目錄、Owner、數據密級等。
  • 技術元數據:實施人員開發系統時使用的數據,包括物理模型的表與字段、ETL規則、集成關系等。
  • 操作元數據:數據處理日志及運營情況數據,包括調度頻度、訪問記錄等。
在企業的數字化運營中,元數據作用于整個價值流,在從數據源到數據消費的五個環節中都能充分體現元數據管理的價值。
  • 數據消費側:元數據能支持企業指標、報表的動態構建。
  • 數據服務側:元數據支持數據服務的統一管理和運營,并實現利用元數據驅動IT敏捷開發。
  • 數據主題側:元數據統一管理分析模型,敏捷響應井噴式增長的數據分析需求,支持數據增值、數據變現。
  • 數據湖側:元數據能實現暗數據的透明化,增強數據活性,并能解決數據治理與IT落地脫節的問題。
  • 數據源側:元數據支撐業務管理規則有效落地,保障數據內容合格、合規。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/215420.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/215420.shtml
英文地址,請注明出處:http://en.pswp.cn/news/215420.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Qt 使用百度的離線地圖

使用百度離線地圖,一下載百度離線包(offlinemap);二是準備地圖瓦片(不同級別的瓦片);三 準備html主頁面;四,Q&…

深度學習 Day13——P2彩色圖片分類

🍨 本文為🔗365天深度學習訓練營 中的學習記錄博客🍖 原作者:K同學啊 | 接輔導、項目定制 文章目錄 前言1 我的環境2 代碼實現與執行結果2.1 前期準備2.1.1 引入庫2.1.2 設置GPU(如果設備上支持GPU就使用GPU,否則使用C…

在Go中定義方法

引言 函數允許你將邏輯組織到可重復的過程中,每次運行時可以使用不同的參數。在定義函數的過程中,你會經常發現多個函數可能每次都操作同一段數據。Go可以識別這種模式,并允許您定義特殊的函數,稱為方法,其目的是對某些特定類型的實例進行操作,稱為接收器。為類型添加方…

nodejs微信小程序+python+PHP基于spark的酒店管理系統-計算機畢業設計推薦

目 錄 摘 要 I ABSTRACT II 目 錄 II 第1章 緒論 1 1.1背景及意義 1 1.2 國內外研究概況 1 1.3 研究的內容 1 第2章 相關技術 3 2.1 nodejs簡介 4 2.2 express框架介紹 6 2.4 MySQL數據庫 4 第3章 系統分析 5 3.1 需求分析 5 3.2 系統可行性分析 5 3.2.1技術可行性:…

排序算法——歸并排序

歸并排序(Merge Sort)是計算機科學中非常重要的排序算法之一。它不僅高效、穩定,而且是許多高級排序技術和算法思想的基礎。在本文中,我們將深入探討歸并排序的原理、實現方法,以及它的優缺點。 1. 歸并排序的原理 歸…

Python大模型TensorFlow/PyTorch/Scikit-learn/Keras/OpenCV/Gensim

Python 作為一種高級編程語言,可以用于開發各種大小的模型。以下是一些常見的 Python 大模型,以及它們的優勢、劣勢和使用場景: TensorFlow: 優勢:TensorFlow 是一個非常流行的深度學習庫,具有高度的可擴…

階段五:深度學習和人工智能(掌握使用TensorFlow或PyTorch進行深度學習)

掌握使用TensorFlow或PyTorch進行深度學習需要具備一定的編程基礎和數學基礎,包括編程語言、數據結構、算法、線性代數、概率論和統計學等方面的知識。以下是掌握使用TensorFlow或PyTorch進行深度學習的一些基本要求: 了解深度學習的基本概念和原理&…

目標檢測YOLO系列從入門到精通技術詳解100篇-【目標檢測】計算機視覺(基礎篇)

目錄 前言 幾個高頻面試題目 計算機視覺中常見的錯誤及解決方案 1.翻轉圖像和關鍵點

AnotherRedisDesktopManager安裝使用 (redis可視化客戶端)

下載 下載地址 AnotherRedisDesktopManager 發行版 - Gitee.com 安裝 雙擊安裝 修改安裝路徑 運行

pt36項目短信OAth2.0

5、短信驗證碼 1、注冊容聯云賬號,登錄并查看開發文檔(以下分析來自接口文檔) 2、開發文檔【準備1】:請求URL地址1.示例:https://app.cloopen.com:8883/2013-12-26/Accounts/{}/SMS/TemplateSMS?sig{}ACCOUNT SID# s…

Docker安裝與使用

Docker 1.初識Docker Docker如何解決大型項目依賴關系復雜,不同組件依賴的兼容性問題? Docker允許開發中將應用、依賴、函數庫、配置一起打包,形成可移植鏡像Docker應用運行在容器中,使用沙箱機制,相互隔離 Docker…

phpstorm中使用 phpunit 時的配置和代碼覆蓋率測試注意點

初始化一個composer項目,composer.json配置文件如下 {"name": "zingfront/questions-php","type": "project","require": {"php": "^7.4"},"require-dev": {"phpunit/phpun…

geemap學習筆記024:從Earth Engine中獲取遙感圖像的縮略圖

前言 遙感圖像的縮略圖通常是以較小的數據量對整景影像有一個全面的展示,便于分享和觀察,本節就介紹一下如何獲取遙感圖像的縮略圖。 1 導入庫并顯示地圖 import ee import geemap import osee.Initialize() Map geemap.Map() Map2 加載數據 roi e…

多維時序 | MATLAB實現RIME-CNN-BiLSTM-Multihead-Attention多頭注意力機制多變量時間序列預測

多維時序 | MATLAB實現RIME-CNN-BiLSTM-Multihead-Attention多頭注意力機制多變量時間序列預測 目錄 多維時序 | MATLAB實現RIME-CNN-BiLSTM-Multihead-Attention多頭注意力機制多變量時間序列預測預測效果基本介紹模型描述程序設計參考資料 預測效果 基本介紹 MATLAB實現RIME-…

項目管理工具:選品開發管理的最佳實踐

Zoho Projects是一個功能強大的項目管理工具,可以幫助電商企業實現選品開發過程的有序管理,提升選品開發效率。 以下是使用Zoho Projects進行選品開發管理的步驟: 1.創建項目: 登錄Zoho Projects,在主頁上點擊"新…

NSSCTF Crypto靶場練習,21-30wp

文章目錄 [AFCTF 2018]你能看出這是什么加密么[LitCTF 2023]你是我的關鍵詞(Keyworld)[NSSCTF 2022 Spring Recruit]classic[SWPUCTF 2021 新生賽]crypto4[LitCTF 2023]家人們!誰懂啊,RSA簽到都不會 (初級)[SWPUCTF 2021 新生賽]crypto5[LitCTF 2023]Is …

亞信科技AntDB攜手藍凌軟件,助推企業數字化辦公轉型升級

隨著企業數字化轉型的深入,企業對于協同辦公、移動門戶、數字運營、智能客服等方面的需求越來越高,數智化正成為催生新動能和新優勢的關鍵力量。數字化的辦公平臺可以幫助企業實現各類信息、流程的集中化、數字化和智能化管理,為企業管理者提…

面試 JVM 八股文五問五答第一期

面試 JVM 八股文五問五答第一期 作者:程序員小白條,個人博客 相信看了本文后,對你的面試是有一定幫助的! ?點贊?收藏?不迷路!? 1.JVM內存布局 Heap (堆區) 堆是 OOM 故障最主要的發生區域。它是內存…

大數據畢業設計之前端03:logo、menu的折疊展開實現

關鍵字:BuildAdmin、pinia、logo、aside、menu、菜單折疊、Vue、ElementUI 前言 上一篇文章中,借助aside的實現講了一些開發的小技巧,以及css的解讀。本篇文章主要寫一下如何填充aside的內容。 aside主要是由兩個部分組成的:log…

數據結構與算法-Rust 版讀書筆記-2線性數據結構-棧

數據結構與算法-Rust 版讀書筆記-2線性數據結構-棧 一、線性數據結構概念 數組、棧、隊列、雙端隊列、鏈表這類數據結構都是保存數據的容器,數據項之間的順序由添加或刪除時的順序決定,數據項一旦被添加,其相對于前后元素就會一直保持位置不…