Apache Kylin最簡單的解析、了解

Apache Kylin最簡單的解析、了解

web/2025/9/12 20:52:34/文章來源:https://blog.csdn.net/weixin_66276176/article/details/144489558

官網：Overview | Apache Kylin

一、Apache Kylin是什么？

由中國團隊研發具有濃厚的中國韻味，使用神獸麒麟（kylin）為名

的一個OLAP多維數據分析引擎:（據官方給出的數據）

亞秒級響應（亞秒內查詢巨大的hive表）
支持超大數據集（PB級以上，千億條數據）
標準SQL接口、簡短易用的即席查詢工具
擁有豐富的工具集成支持標準數據庫協議、各種BI分析工具

可伸縮性和高吞吐量：單節點Kylin可實現每秒70個查詢，還可以結合Zookeeper分布式協調服務搭建Kylin集群，速度更快。

二、Kylin架構：

三、環境、依賴、配置

Kylin版本對應最低依賴圖（官方數據）

環境

Hadoop：Kylin 依賴 Hadoop 進行數據存儲和計算。
Hive：用于數據源的管理和訪問。
HBase：作為 Kylin 的默認存儲引擎。
Spark：用于加速 Cube 構建。
Kylin：Apache Kylin 的核心服務。

注意：在MySQL中手動創建kylin數據庫（官方默認連接mysql設置的是kylin這個數據庫）

或更改配置

硬件要求：

Yarn內存設置

Kylin4.0使用Spark作為計算引擎和查詢引擎，因此對spark任務運行的yarn容器內存有所要求，要求yarn容器內存不能低于4G，因此需要將Yarn容器內存調為8G，否則kylin啟動會報錯。注意：yarn容器內存都調為了8G，所以三臺虛擬機內存一定要大于8G，否則Kylin運行會報錯，此處建議學者最低要將三臺虛擬機內存設置為12G，8G，8G。（電腦內存不能低于32G）

增加ApplicationMaster 資源比例

因為Kylin的查詢會生成一個在后臺長期運行的Sparder任務，占用Default隊列，因此一定要調大此參數，否則Kylin無法正常使用。

需要對 Kylin 進行配置。主要配置文件為：

kylin.properties：Kylin 的核心配置文件，包含元數據存儲、查詢引擎和存儲引擎的配置。

hive-site.xml：Hive 配置文件，Kylin 需要訪問 Hive 進行數據抽取。

hbase-site.xml：HBase 配置文件，Kylin 需要訪問 HBase 進行數據存儲。

四、Kylin的核心特點

分布式分析引擎：Kylin是一個基于Hadoop/Spark等分布式計算平臺的分析引擎，能夠充分利用集群的計算資源，實現大規模數據的并行處理。
高效的多維分析能力：Kylin支持多維數據分析，用戶可以輕松地對數據進行切片、切塊、匯總等操作。這種能力在處理復雜的數據分析任務時非常有用，能夠幫助用戶從多個角度審視數據，發現其中的規律和趨勢。
預計算與實時查詢的平衡：Kylin采用了預計算技術，通過在離線階段對數據進行預處理和計算，生成多維數據立方體（Cube）。這使得在實時查詢階段能夠迅速返回結果，實現了預計算與實時查詢之間的平衡。這種平衡既保證了查詢效率，又滿足了用戶對實時性的需求。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/web/63503.shtml
繁體地址，請注明出處：http://hk.pswp.cn/web/63503.shtml
英文地址，請注明出處：http://en.pswp.cn/web/63503.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

01云計算HCIA學習筆記

01云計算HCIA學習筆記

筆者今年7月底考取了華為云計算方向的HCIE認證，回顧從IA到IE的學習和項目實戰，想整合和分享自己的學習歷程，歡迎志同道合的朋友們一起討論！ 第一章云計算概述 ICT：ICT是世界電信協會在2001年的全球會議中提出的一個綜…

閱讀更多...

php生成圖片

php生成圖片

前提開啟dg2庫去掉前面的;注釋，有的可能會帶.dll后綴影響不大 extensiongd2代碼 <?php $file imagecreate(100,50); //先生成圖片資源$color imagecolorallocate($file,255,255,255); //白色$c imagecolorallocate($file,0,100,255);imagefill($file,0…

閱讀更多...

免費GIS工具箱：輕松將glb文件轉換成3DTiles文件

免費GIS工具箱：輕松將glb文件轉換成3DTiles文件

在GIS地理信息系統領域，GLB文件作為GLTF文件的二進制版本，主要用于3D模型數據的存儲和展示。然而，GLB文件的使用頻率相對較低，這是因為GIS系統主要處理的是地理空間數據，如地圖、地形、地貌、植被、水系等，…

閱讀更多...

為何VisualRules更適合技術人員使用

為何VisualRules更適合技術人員使用

什么是規則引擎規則引擎是一種軟件組件，它允許將業務規則從應用程序的核心代碼中分離出來，以一種更加靈活、易于管理和維護的方式來定義、存儲和執行這些規則。簡單來說，它就像是一個專門處理規則的 “大腦”，可以根據預先設定的…

閱讀更多...

prometheus 搭建監控

prometheus 搭建監控

prometheus 下載 prometheus-3.0.0.linux-amd64.tar.gztar -zxvf prometheus-3.0.0.linux-amd64.tar.gzmv prometheus-3.0.0.linux-amd64 prometheus-3vim /etc/systemd/system/prometheus.serviceprometheus.service [Unit] DescriptionPrometheus Wantsnetwork-online.t…

閱讀更多...

游戲何如防抓包

游戲何如防抓包

游戲抓包是指在游戲中，通過抓包工具捕獲和分析游戲客戶端與服務器之間傳輸的封包數據的過程。抓包工具可實現攔截、篡改、重發、丟棄游戲的上下行數據包，市面上常見的抓包工具有WPE、Fiddler和Charles Proxy等。抓包工具有兩種實現方式，一類…

閱讀更多...

RestTemplate實時接收Chunked編碼傳輸的HTTP Response

RestTemplate實時接收Chunked編碼傳輸的HTTP Response

學習調用AI接口的時候，流式響應都是使用的 Transfer-Encoding: chunked，圖方便想用RestTemplate，但是平時用到的都是直接返回響應對象的類型。使用bing搜索到一種方式，使用下面的代碼來讀取，于是掉這個坑里了&#xff…

閱讀更多...

request.setAttribute()和session.setAttribute()的區別

request.setAttribute()和session.setAttribute()的區別

request.setAttribute() 作用：request.setAttribute()是在一次請求內共享數據解釋：例如將一個數據保存request域中，然后請求轉發至前端頁面，則數據轉發至前端頁面后會被自動銷毀。簡單點說就是，數據只能用一次就不能…

閱讀更多...

Java中的Consumer接口應該如何使用（通俗易懂圖解）

Java中的Consumer接口應該如何使用（通俗易懂圖解）

應用場景： 第一次程序員A寫好了個基礎的遍歷方法： public class Demo1 {public static void main(String[] args) {//假設main方法為程序員B寫的,此時需要去調用A寫好的一個遍歷方法//1.如果此時B突然發現想將字符串以小寫的形式打印出來，則…

閱讀更多...

【常微分方程講義1.1】方程的種類發展與完備

【常微分方程講義1.1】方程的種類發展與完備

方程在數學歷史中不斷發展，逐步趨于完備。從最初的簡單代數方程到包含函數、算子甚至泛函的更復雜方程，數學家通過不斷的擴展和深化，逐漸建立起更為豐富和多元的方程類型體系。方程的種類之所以不斷演變，部分是因為解決實際問題的…

閱讀更多...

通過移除 -march=native 解決 Ubuntu 20.04 程序運行“段錯誤 (核心已轉儲)”問題的詳解

通過移除 -march=native 解決 Ubuntu 20.04 程序運行“段錯誤 (核心已轉儲)”問題的詳解

通過移除 -marchnative 解決 Ubuntu 20.04 程序運行“段錯誤 (核心已轉儲)”問題的詳解在Ubuntu 20.04系統中，開發和編譯C/C程序時，常見的編譯選項可能會影響程序的穩定性和兼容性。特別是在使用CMake構建系統時，某些編譯標志可能導致程序在…

閱讀更多...

Linux下學【MySQL】表的必備操作（配實操圖和SQL語句）

Linux下學【MySQL】表的必備操作（配實操圖和SQL語句）

緒論? “Patience is key in life （耐心是生活的關鍵）”。本章是MySQL中非常重要且基礎的知識----對表的操作。再數據庫中表是存儲數據的容器，我們通過將數據填寫在表中，從而再從表中拿取出來使用，本章主要講到表的增…

閱讀更多...

深度學習之目標檢測篇——殘差網絡與FPN結合

深度學習之目標檢測篇——殘差網絡與FPN結合

特征金字塔多尺度融合特征金字塔的網絡原理這里是基于resnet網絡與Fpn做的結合，主要把resnet中的特征層利用FPN的思想一起結合，實現resnet_fpn。增強目標檢測backone的有效性。代碼實現如下： import torch from torch import Tensor from c…

閱讀更多...

游戲AI實現-尋路算法（BFS）

游戲AI實現-尋路算法（BFS）

廣度優先搜索算法（英語：Breadth-first search，縮寫：BFS），又譯作寬度優先搜索，或橫向優先搜索，是一種圖形搜索算法。尋路地圖搭建： 游戲AI實現-尋路地圖搭建-CSDN博客 …

閱讀更多...

CMake的INSTALL FILES和INSTALL DIRECTORY有什么區別

CMake的INSTALL FILES和INSTALL DIRECTORY有什么區別

在 CMake 中，install() 命令用于安裝構建的目標文件、頭文件、庫等到指定的目標路徑。install(FILES ...) 和 install(DIRECTORY ...) 都是 install() 命令的具體用法，它們的功能和適用場景不同。以下是兩者的詳細區別和用法說明： 1. insta…

閱讀更多...

主流網絡安全產品

主流網絡安全產品

目前市場上也出現了品類豐富的安全產品，如“防火墻、抗D、負載均衡、WAF、數據庫審計、漏掃、網頁防篡改、上網行為管理、堡壘機等”這些產品由于功能不同在網絡中部署的位置也有區別。下面來簡單聊一下每類產品的功能和部署位置。 （1）防火墻…

閱讀更多...

利用git上傳項目到GitHub

利用git上傳項目到GitHub

GitHub是基于git實現的代碼托管。git是目前最好用的版本控制系統了，非常受歡迎，比之svn更好。 GitHub可以免費使用，并且快速穩定。利用GitHub，你可以將項目存檔，與其他人分享交流，并讓其他開發者幫助你一…

閱讀更多...

《Vue3實戰教程》13：Vue3偵聽器

《Vue3實戰教程》13：Vue3偵聽器

如果您有疑問，請觀看視頻教程《Vue3實戰教程》偵聽器? 基本示例? 計算屬性允許我們聲明性地計算衍生值。然而在有些情況下，我們需要在狀態變化時執行一些“副作用”：例如更改 DOM，或是根據異步操作的結果去修改另一處的狀態。…

閱讀更多...

uboot 打開log 的方法

uboot 打開log 的方法

uboot 版本 commit f919c3a889f0ec7d63a48b5d0ed064386b0980bd (HEAD -> v2024.10, tag: v2024.10) Author: Tom Rini <trinikonsulko.com> Date: Mon Oct 7 08:54:35 2024 -0600 Prepare v2024.10 Signed-off-by: Tom Rini <trinikonsulko.com> 開啟的選項…

閱讀更多...

VSCode 搭建Python編程環境 2024新版圖文安裝教程（Python環境搭建+VSCode安裝+運行測試+背景圖設置）

VSCode 搭建Python編程環境 2024新版圖文安裝教程（Python環境搭建+VSCode安裝+運行測試+背景圖設置）

名人說：一點浩然氣，千里快哉風。—— 蘇軾《水調歌頭》創作者：Code_流蘇(CSDN) 目錄一、Python環境安裝二、VScode下載及安裝三、VSCode配置Python環境四、運行測試五、背景圖設置很高興你打開了這篇博客，更多詳細的安裝教程&…

閱讀更多...

最新文章