元數據管理與數據治理平臺:Apache Atlas 基本搜索 Basic Search

文中內容僅限技術學習與代碼實踐參考,市場存在不確定性,技術分析需謹慎驗證,不構成任何投資建議。

Apache Atlas
Apache Atlas 框架是一套可擴展的核心基礎治理服務,使企業能夠有效、高效地滿足 Hadoop 中的合規性要求,并支持與整個企業數據生態系統集成。這將通過使用規范和取證模型,以及技術和運營審計以及由業務分類元數據豐富的沿襲,在 Hadoop 中提供真正的可視性。它還使任何元數據使用者能夠互操作,而無需彼此獨立的接口——元數據存儲是通用的。通過利用 Apache Ranger 來維護元數據的準確性,以防止在運行時對數據進行未經授權的訪問。安全性基于角色 (RBAC) 和屬性 (ABAC)。

基本搜索

Basic Search

基本搜索允許你使用實體的 typename、關聯的 classification/tag 進行查詢,并支持對實體屬性以及 classification/tag 屬性進行過濾。

整個查詢結構可以用以下 JSON 結構(稱為 SearchParameters)表示

{"typeName":               "hive_column","excludeDeletedEntities": true,"classification":         "PII","query":                  "","offset":                 0,"limit":                  25,"entityFilters":          {  },"tagFilters":             { },"attributes":             [ "table", "qualifiedName"]
}

字段說明

typeName:               要查找的實體類型
excludeDeletedEntities: 搜索是否應排除已刪除的實體?(默認值:true)
classification:         僅包含具有給定 classification 的實體
query:                  實體應包含的任意自由文本(通用/通配符查詢可能較慢)
offset:                 結果集的起始偏移量(用于分頁)
limit:                  要獲取的最大結果數
entityFilters:          實體屬性過濾條件
tagFilters:             classification 屬性過濾條件
attributes:             要在搜索結果中包含的屬性

圖片

屬性過濾支持對多個屬性進行 AND/OR 條件組合。

過濾示例(針對 hive_table 屬性)

  • 單屬性
   {"typeName":               "hive_table","excludeDeletedEntities": true,"offset":                 0,"limit":                  25,"entityFilters": {"attributeName":  "name","operator":       "contains","attributeValue": "customers"},"attributes": [ "db", "qualifiedName" ]}

圖片

  • 多屬性 OR
   {"typeName":               "hive_table","excludeDeletedEntities": true,"offset":                 0,"limit":                  25,"entityFilters": {"condition": "OR","criterion": [{"attributeName":  "name","operator":       "contains","attributeValue": "customers"},{"attributeName":  "name","operator":       "contains","attributeValue": "provider"}]},"attributes": [ "db", "qualifiedName" ]}

圖片

  • 多屬性 AND
   {"typeName":               "hive_table","excludeDeletedEntities": true,"offset":                 0,"limit":                  25,"entityFilters": {"condition": "AND","criterion": [{"attributeName":  "name","operator":       "contains","attributeValue": "customers"},{"attributeName":  "owner","operator":       "eq","attributeValue": "hive"}]},"attributes": [ "db", "qualifiedName" ]}

圖片

支持的過濾運算符

  • LT(符號:<, lt)適用于數值、日期屬性
  • GT(符號:>, gt)適用于數值、日期屬性
  • LTE(符號:<=, lte)適用于數值、日期屬性
  • GTE(符號:>=, gte)適用于數值、日期屬性
  • EQ(符號:eq, =)適用于數值、日期、字符串屬性
  • NEQ(符號:neq, !=)適用于數值、日期、字符串屬性
  • LIKE(符號:like, LIKE)適用于字符串屬性
  • STARTS_WITH(符號:startsWith, STARTSWITH)適用于字符串屬性
  • ENDS_WITH(符號:endsWith, ENDSWITH)適用于字符串屬性
  • CONTAINS(符號:contains, CONTAINS)適用于字符串屬性

CURL 示例

curl -sivk -g-u <user>:<password>-X POST-d '{"typeName":               "hive_table","excludeDeletedEntities": true,"classification":         "","query":                  "","offset":                 0,"limit":                  50,"entityFilters": {"condition": "AND","criterion": [{"attributeName":  "name","operator":       "contains","attributeValue": "customers"},{"attributeName":  "owner","operator":       "eq","attributeValue": "hive"}]},"attributes": [ "db", "qualifiedName" ]}'<protocol>://<atlas_host>:<atlas_port>/api/atlas/v2/search/basic

Apache Atlas 概覽

Apache Atlas 是一套可擴展且可延伸的核心基礎治理服務——使企業能夠在 Hadoop 中高效且有效地滿足其合規要求,并允許與整個企業數據生態系統進行集成。

Apache Atlas 為組織提供開放的元數據管理和治理能力,用于構建其數據資產目錄,對這些資產進行分類和治理,并為數據科學家、分析師和數據治理團隊提供圍繞這些數據資產的協作能力。

特性

元數據類型與實例

  • 為各種 Hadoop 和非 Hadoop 元數據預定義類型
  • 具備為待管理元數據定義新類型的能力
  • 類型可包含原始屬性、復雜屬性、對象引用;可從其他類型繼承
  • 類型的實例(稱為實體)捕獲元數據對象詳情及其關系
  • 提供 REST API 以便更輕松地與類型和實例進行集成

分類

  • 具備動態創建分類的能力——例如 PII、EXPIRES_ON、DATA_QUALITY、SENSITIVE
  • 分類可包含屬性——例如在 EXPIRES_ON 分類中的 expiry_date 屬性
  • 實體可與多個分類關聯,便于發現和安全策略執行
  • 通過血緣關系傳播分類——自動確保分類隨數據在各種處理過程中流轉

血緣

  • 直觀的 UI 查看數據在各類流程中的血緣
  • 提供 REST API 以訪問和更新血緣信息

搜索/發現

  • 直觀的 UI 按類型、分類、屬性值或自由文本搜索實體
  • 豐富的 REST API 以復雜條件進行搜索
  • SQL 風格的實體查詢語言——領域特定語言(DSL)

安全與數據脫敏

  • 針對元數據訪問的細粒度安全控制,可對實體實例及添加/更新/移除分類等操作進行權限管控
  • 與 Apache Ranger 集成,可根據 Apache Atlas 中實體關聯的分類進行基于授權的訪問控制/數據脫敏。例如:
    • 誰能訪問被分類為 PII、SENSITIVE 的數據
    • 客戶服務用戶僅能看到被分類為 NATIONAL_ID 的列的最后四位

快速開始

  • Apache Atlas 2.4 的新功能
  • 構建與安裝
  • 快速入門

API 文檔

  • REST API 文檔
  • 導出與導入 REST API 文檔
  • 舊版 API 文檔

開發者設置文檔

  • 開發者設置:Eclipse

風險提示與免責聲明
本文內容基于公開信息研究整理,不構成任何形式的投資建議。歷史表現不應作為未來收益保證,市場存在不可預見的波動風險。投資者需結合自身財務狀況及風險承受能力獨立決策,并自行承擔交易結果。作者及發布方不對任何依據本文操作導致的損失承擔法律責任。市場有風險,投資須謹慎。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/95395.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/95395.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/95395.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

LangChain4J-(1)-Hello World

一、LangChain4J是什么&#xff1f; LangChain4J 是一個專為 Java 生態系統設計的開源框架&#xff0c;用于簡化與大語言模型&#xff08;LLM&#xff0c;如 OpenAI 的 GPT 系列、Google 的 Gemini、Anthropic 的 Claude 等&#xff09;的集成和交互。它借鑒了 Python 生態中 L…

HTTPS應用層協議-中間攻擊人

HTTPS應用層協議-中間攻擊人 ? Man-in-the-MiddleAttack&#xff0c;簡稱“MITM 攻擊” 確實&#xff0c;在方案 2/3/4 中&#xff0c;客戶端獲取到公鑰 S 之后&#xff0c;對客戶端形成的對稱秘鑰 X 用服務端給客戶端的公鑰 S 進行加密&#xff0c;中間人即使竊取到了數據&am…

利用 Makefile 高效啟動 VIVADO 軟件:深入解析與實踐

利用 Makefile 高效啟動 VIVADO 軟件&#xff1a;深入解析與實踐 系列文章目錄 1、VMware Workstation Pro安裝指南&#xff1a;詳細步驟與配置選項說明 2、VMware 下 Ubuntu 操作系統下載與安裝指南 3.基于 Ubuntu 的 Linux 系統中 Vivado 2020.1 下載安裝教程 文章目錄利用 …

[前端算法]排序算法

默認情況下&#xff0c;sort() 會將元素轉換為字符串&#xff0c;然后按照 Unicode 編碼的順序進行排序&#xff1a; const fruits [apple, banana, cherry, date]; fruits.sort(); console.log(fruits); // 輸出: ["apple", "banana", "cherry"…

C#標簽批量打印程序開發

C#標簽批量打印程序開發&#xff08;集成Bartender解決方案&#xff09;一、系統架構設計 1. 核心模塊劃分 public class LabelPrintingSystem {private IDataLoader _dataLoader; // 數據加載器private ITemplateEngine _templateEngine; // 模板引擎private IPrintControl…

ECC的原理、背景、工作機制和數學基礎

ECC的原理、背景、工作機制和數學基礎摘要&#xff1a;本文首先詳細介紹ECC&#xff08;Error-Correcting Code&#xff0c;糾錯碼&#xff09;的原理&#xff0c;包括背景、工作機制和數學基礎。然后&#xff0c;解釋ECC在SRAM&#xff08;Static Random-Access Memory&#x…

計算機網絡2-2:物理層下面的傳輸媒體

目錄 導引型傳輸媒體 同軸電纜 雙絞線 光纖 電力線 非導引型傳輸媒體 無線電波 微波 紅外線 可見光 無線電頻譜管理機構 導引型傳輸媒體 同軸電纜 雙絞線 光纖 光在光纖中傳播的基本原理 電力線 非導引型傳輸媒體 無線電波 微波 紅外線 可見光 LiFi(可見光通信) …

Dify 從入門到精通(第 32/100 篇):Dify 的日志分析與監控

Dify 從入門到精通&#xff08;第 32/100 篇&#xff09;&#xff1a;Dify 的日志分析與監控 Dify 入門到精通系列文章目錄 第一篇《Dify 究竟是什么&#xff1f;真能開啟低代碼 AI 應用開發的未來&#xff1f;》介紹了 Dify 的定位與優勢第二篇《Dify 的核心組件&#xff1a…

【IntelliJ IDEA】修改堆內存

idea卡頓&#xff0c;鼠標漂移修改idea文件打開 idea 安裝路徑&#xff0c;【bin】目錄下【idea64.exe.vmoptions】文件修改【-Xms】最小內存【-Xmx】最大內存-Xms2048m -Xmx9216midea更改內存設置工具欄幫助更改內存設置設置堆大小上限為 文件 設置的最大內存保存并重啟Leslie…

Docker與Docker Compose:容器世界的“單兵作戰”與“軍團指揮官”

在容器化技術的浪潮中&#xff0c;Docker和Docker Compose如同“雙子星”&#xff0c;一個專注于單兵作戰&#xff0c;一個擅長軍團指揮。它們看似相似&#xff0c;卻各司其職。對于開發者來說&#xff0c;理解它們的區別不僅能讓代碼部署事半功倍&#xff0c;更能避免踩坑。本…

進階向:Python編寫自動化郵件發送程序

Python編寫自動化郵件發送程序&#xff1a;從零開始詳解在數字化時代&#xff0c;自動化郵件發送功能已成為企業和個人提升工作效率的重要工具。據統計&#xff0c;全球每天發送的商業郵件超過30億封&#xff0c;其中約40%是通過自動化系統發送的。這種功能被廣泛應用于多種場景…

ChatGpt 5系列文章1——編碼與智能體

人工智能技術正在以驚人的速度發展&#xff0c;重新定義著開發人員的工作方式。2025年8月&#xff0c;OpenAI正式發布了面向開發人員的GPT-5 一、GPT-5的編碼能力突破 GPT-5在關鍵編碼基準測試中創造了行業新紀錄(SOTA)&#xff0c;在SWE-bench Verified測試中得分74.9%&…

力扣top100(day02-05)--二叉樹 02

102. 二叉樹的層序遍歷 /*** Definition for a binary tree node.* public class TreeNode {* int val;* TreeNode left;* TreeNode right;* TreeNode() {}* TreeNode(int val) { this.val val; }* TreeNode(int val, TreeNode left, TreeNode right)…

開疆智能Ethernet轉ModbusTCP網關連接發那科機器人與三菱PLC配置案例

本案例是三菱FX5U PLC通過ethernet/IP轉ModbusTCP網關對發那科機器人進行控制的配置案例。PLC端主要配置以太網端口設置在通信測試中&#xff0c;PLC作為主站&#xff0c;在PLC設置中選擇“以太網端口”非常關鍵&#xff0c;以確保通信測試的正常進行。1、首先&#xff0c;在PL…

VUE+SPRINGBOOT從0-1打造前后端-前后臺系統-系統首頁

在現代Web應用開發中&#xff0c;管理后臺是幾乎所有企業級應用不可或缺的部分。一個優秀的后臺首頁不僅需要提供清晰的信息展示&#xff0c;還需要具備良好的用戶體驗和視覺效果。本文將詳細介紹如何使用Vue.js框架配合Element UI組件庫和ECharts圖表庫&#xff0c;構建一個功…

第6節 torch.nn介紹

6.1 torch.nn.Module介紹 torch.nn.Module是 PyTorch 中構建神經網絡的基礎類&#xff0c;所有的神經網絡模塊都應該繼承這個類。它提供了一種便捷的方式來組織和管理網絡中的各個組件&#xff0c;包括層、參數等&#xff0c;同時還內置了許多用于模型訓練和推理的功能。 官網…

python自學筆記7 可視化初步

圖像的組成工具庫 Matplotlib&#xff1a;繪制靜態圖 Plotly: 可以繪制交互式圖片 圖像的繪制&#xff08;Matplotlib&#xff09; 創建圖形&#xff0c;軸對象 創造等差數列 # 包含后端點 arr np.linspace(0, 1, num11) # 不包含后端點 arr_no_endpoint np.linspace(0, 1, n…

GIS 常用的矢量與柵格分析工具

矢量處理工具作用典型應用緩沖區分析Buffer環境影響區域&#xff0c;空間鄰近度分析等&#xff0c;例如道路周圍一公里內的學校&#xff0c;噪音污染影響的范圍裁剪Clip例如使用A市圖層裁剪全國道路數據&#xff0c;獲取A市道路數據交集Intersect識別與LUCC、分區洪水區、基礎設…

http與https協議區別;vue3本地連接https地址接口報500

文章目錄問題解決方案一、問題原因分析二、解決方案詳解1. 保持當前配置&#xff08;推薦臨時方案&#xff09;2. 更安全的方案&#xff08;推薦&#xff09;3. 環境區分配置&#xff08;最佳實踐&#xff09;三、為什么開發環境不用配置&#xff1f;問題 問題&#xff1a;本地…

C語言——深入理解指針(三)

C語言——深入理解指針&#xff08;三&#xff09; 1.回調函數是什么&#xff1f; 首先我們來回顧一下函數的直接調用&#xff1a;而回調函數就是通過函數指針調用的函數。我們將函數的指針&#xff08;地址&#xff09;作為參數傳遞給另一個函數&#xff0c;當這個指針被用來調…