Spark交互式分析平臺Apache Zeppelin的安裝

Zeppelin介紹

Apache Zeppelin提供了web版的類似ipython的notebook,用于做數據分析和可視化。背后可以接入不同的數據處理引擎,包括Spark,?Hive, tajo等,原生支持Scala,?Java, shell, markdown等。它的整體展現和使用形式和Databricks Cloud是一樣的,就是來自于當時的demo。

Zeppelin可實現你所需要的:?
- 數據采集?
- 數據發現?
- 數據分析?
- 數據可視化和協作

支持多種語言,默認是scala(背后是spark shell),SparkSQL, Markdown 和 Shell。?
?
甚至可以添加自己的語言支持。如何寫一個zeppelin解釋器

Zeppelin特性

Apache Spark 集成

Zeppelin 提供了內置的?Apache Spark?集成。你不需要單獨構建一個模塊、插件或者庫。?
Zeppelin的Spark集成提供了:?
- 自動引入SparkContext 和 SQLContext?
- 從本地文件系統或maven庫載入運行時依賴的jar包。更多關于依賴載入器?
- 可取消job 和 展示job進度

數據可視化

一些基本的圖表已經包含在Zeppelin中。可視化并不只限于SparkSQL查詢,后端的任何語言的輸出都可以被識別并可視化。?
Bank?

動態表格?
Zeppelin 可以在你的筆記本中動態地創建一些輸入格式。?

協作?
Notebook 的 URL 可以在協作者間分享。 Zeppelin 然后可以實時廣播任何變化,就像在 Google docs 中一樣。?

發布?
Zeppelin提供了一個URL用來僅僅展示結果,那個頁面不包括Zeppelin的菜單和按鈕。這樣,你可以輕易地將其作為一個iframe集成到你的網站。?

Zeppelin的安裝部署

由于Zeppelin目前不提供binary安裝包,所以這里Zeppelin的安裝需要自己編譯。?
這里可以參考Zeppelin Github和Install Zeppelin

準備工作

需要?
Java?1.7?
Tested on Mac OSX, Ubuntu 14.X, CentOS 6.X?
Maven (if you want to build from the source code)?
Node.js?Package Manager

在Ubuntu環境下可以這樣安裝:

sudo apt-get update
sudo apt-get install openjdk-7-jdk
sudo apt-get install git
sudo apt-get install maven
sudo apt-get install npm
  • 1
  • 2
  • 3
  • 4
  • 5
  • 1
  • 2
  • 3
  • 4
  • 5

注意:這里的maven工具如果不是最新的源的話,可能只是maven2,zeppelin的編譯需要maven3,不然一些工具的下載會受到影響,可以從maven官網下載二進制壓縮包,直接使用。?
這里還需要node命令,apt-get安裝npm時候會自動安裝nodejs命令,這里只需要建立一個鏈接就可以:sudo ln -s /usr/bin/nodejs /usr/bin/node

zeppelin-web項目的安裝配置

我在之前對zeppelin整個項目進行maven部署的時候總是出現zeppelin-web項目的失敗,不得其解,參照網上的方法,對zeppelin-web項目進行單獨的安裝配置。?
這里每一步都很關鍵,我在這里的配置安裝折騰了很多次,最終才能正常的完成安裝,下面一一道來。

刪除zeppelin-web項目的pom.xml下面給出的內容,換做手動安裝:

<plugin><groupId>com.github.eirslett</groupId><artifactId>frontend-maven-plugin</artifactId><version>0.0.23</version><executions><execution><id>install node and npm</id><goals><goal>install-node-and-npm</goal></goals><configuration><nodeVersion>v0.10.18</nodeVersion><npmVersion>1.3.8</npmVersion></configuration></execution><execution><id>npm install</id><goals><goal>npm</goal></goals></execution><execution><id>bower install</id><goals><goal>bower</goal></goals><configuration><arguments>--allow-root install</arguments></configuration></execution><execution><id>grunt build</id><goals><goal>grunt</goal></goals><configuration><arguments>--no-color --force</arguments></configuration></execution></executions></plugin>
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44

手動安裝步驟:?
1. 安裝好npm和node?
2. 進入zeppelin-web目錄下,執行npm install。它會根據package.json的描述安裝一些grunt的組件,安裝bower,然后再目錄下生產一個node_modules目錄。?
3. 執行bower –-allow-root install,會根據bower.json安裝前段庫依賴,有點類似于java的mvn。?
4. 執行grunt --no-color –-force,會根據Gruntfile.js整理web文件。?
第3、4步要注意,本來給定的bower和grunt文件中使用的"node/node"命令,因為使用maven自動安裝時,會在當前目錄下生成node目錄,其中包含node命令。我們之前已經安裝了nodejs命令,并新鏈接了命令node,所以這里需要將其修改為"node"。?
5. 執行mvn install -DskipTests,把web項目打包,在target目錄下會生成war?
pom.xml在生成war包的時候,要參照dist\WEB-INF\web.xml文件,所以在執行該步驟之前,要明確zeppelin-web目錄下由dist目錄,才能最終生成正確的war包。

其他zeppelin項目的編譯

其他項目的編譯依照正常程序進行就可以,安裝文檔:http://zeppelin.incubator.apache.org/docs/install/install.html

根據自己的方式進行編譯:?
Local mode:?
mvn install -DskipTests?
Cluster mode:?
mvn install -DskipTests -Dspark.version=1.1.0 -Dhadoop.version=2.2.0

配置

配置文件為環境變量文件(conf/zeppelin-env.sh)和Java屬性文件(conf/zeppelin-site.xml)。根據自己的要求進行配置。

啟動、關閉

啟動、關閉Zeppelin進程命令為:?
bin/zeppelin-daemon.sh start?
bin/zeppelin-daemon.sh stop

參考資料

Apache Zeppelin安裝及介紹

轉載請注明作者Jason Ding及其出處?
GitCafe博客主頁(http://jasonding1354.gitcafe.io/)?
Github博客主頁(http://jasonding1354.github.io/)?
CSDN博客(http://blog.csdn.net/jasonding1354)?
簡書主頁(http://www.jianshu.com/users/2bd9b48f6ea8/latest_articles)?

Google搜索jasonding1354進入我的博客主頁


-------------

更多的Java,Angular,Android,大數據,J2EE,Python,數據庫,Linux,Java架構師,:

http://www.cnblogs.com/zengmiaogen/p/7083694.html


本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/538908.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/538908.shtml
英文地址,請注明出處:http://en.pswp.cn/news/538908.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

win7 php zend,win7系統打開WZend Studio PHP出錯的解決方法

很多朋友安裝win7系統后&#xff0c;在使用的過程中會遇到win7系統打開WZend Studio PHP出錯的情況&#xff0c;可能有很多用戶還是不能自己處理win7系統打開WZend Studio PHP出錯的問題&#xff0c;其實簡單的來說處理win7系統打開WZend Studio PHP出錯的問題只需要按照 1、在…

9個元素換6次達到排序序列_C語言必學的12個排序算法:希爾排序(第3篇)

基本思想希爾排序&#xff08;Shells Sort&#xff09;&#xff0c;以發明人命名&#xff0c;又稱為縮小增量排序&#xff0c;也是一種插入排序算法。主要思想&#xff1a;直接插入排序算法時間和待排數據有關&#xff0c;其平均復雜度是O(n^2)&#xff0c;但是在待排數據已經有…

java快捷鍵禁用_pycharm 掌握這些快捷鍵,你就是大神!!

最重要的快捷鍵1. ctrlshiftA:萬能命令行 2. shift兩次:查看資源文件新建工程第一步操作1. module設置把空包分層去掉,compact empty middle package 2. 設置當前的工程是utf-8,設置的Editor-->File Encodings-->全部改成utf-8,注釋1. ctrl/:單行注釋光標操作1. ctrlalte…

如何在 5 分鐘內讀懂區塊鏈的架構思維?

作為入門者&#xff0c;如何在最短的時間了解區塊鏈技術&#xff0c;區塊鏈思維&#xff0c;以及比特幣的金融原理呢&#xff1f;本文嘗試從比特幣的架構設計思維出發&#xff0c;讓人從宏觀上搞清楚區塊鏈的技術本質。 本文授權轉載自阿里技術 作者 | 鄭吉 區塊鏈不是一種技術…

魅族Flyme5.x以上系統INSTALL_FAILED_SHARED_USER_INCOMPATIBLE

用android studio 連接魅族flyme5.0安裝app&#xff0c;報 Installation error: INSTALL_FAILED_SHARED_USER_INCOMPATIBLE 解決方法&#xff1a; 1、進入手機管家 2、權限管理 3、usb安裝管理 4、關閉 完美解決問題

php取key的value值,獲取數組中key和value的值

方法1&#xff1a;PHP 4 引入了 foreach 結構&#xff0c;和 Perl 以及其他語言很像。這只是一種遍歷數組簡便方法。foreach 僅能用于數組&#xff0c;當試圖將其用于其它數據類型或者一個未初始化的變量時會產生錯誤。有兩種語法&#xff0c;第二種比較次要但卻是第一種的有用…

arduino 上傳項目出錯_Arduino多核編程:簡單例子

不管你是Arduino領域的新手還是經驗豐富的開發人員&#xff0c;很可能你還只使用過單核在進行編程。 這沒有什么好笑的---- 事實上&#xff0c;直到幾天前我才使用Arduino IDE進行了第一次多核編程。 我和所有其他Arduino粉絲都非常喜歡IDE的易用性以及MicroController 開發所需…

Hadoop-RPC應用demo

Hadoop里的rpc框架可以單獨拿出來使用。jar包全在hadoop-common工程里。 導入hadoop-common工程里&#xff08;hadoop-2.7.3為例&#xff09;&#xff1a; hadoop-common-2.7.3.jar \hadoop-2.7.3\share\hadoop\common\lib下的全部jar包 實例 rpc.client 客戶端 rpc.pr…

php 變量 可用拼音表示,php漢字轉拼音的示例

. 代碼如下:class Helper_Spell{public $spellArray array();static public function getArray() {return unserialize(file_get_contents(pytable_without_tune.txt));}/*** desc 獲取字符串的首字母* param $string 要轉換的字符串* param $isOne 是否取首字母* param $uppe…

Opencv-Python:圖像尺寸、圖像的讀取、顯示、保存與復制

Opencv-Python&#xff1a;圖像尺寸、圖像的讀取、顯示、保存與復制 原創 2017年11月23日 21:30:494440在使用opencv的方法時&#xff0c;首先必須導入opencv包。新的opencv導入cv2&#xff0c;這里也和cv做了一個對比 [python] view plaincopy import cv2 一、圖像尺寸 圖像的…

寶塔面板服務器ip地址修改_「網站」快速搭建服務器環境及網站

目錄&#xff1a;「NAS」我的搭建NAS全過程在文章開頭我想說明的是&#xff0c;此文章中所使用的工具為 BT 面板即寶塔面板&#xff0c;適合小白使用但是對于想要提升個人能力來說&#xff0c; BT 面板并不是一個好選擇&#xff0c;而作為新手來說&#xff0c;可以使用該面板進…

redis啟動報錯-磁盤滿了

imjournal: fopen() failed for path: ‘/var/lib/rsyslog/imjournal.state.tmp’: Structure needs cleaning [v8.24.0-57.el7_9.1 try http://www.rsyslog.com/e/2013 ] 1.查看服務狀態 systemctl status rsyslog 2.嘗試重啟服務 systemctl restart rsyslog 3.查看分區占用情…

楊輝三角python_Python面試150題匯總,都是常問的面試題!

周末&#xff0c;Python面試題每日一題暫停更新&#xff0c;下面把最近整理的1-50篇Python面試文整理一下&#xff0c;平時文章都放在比較末尾&#xff0c;閱讀量都不高&#xff0c;相信很多人都沒看過&#xff0c;如果對于Python感興趣的&#xff0c;建議可以認真閱讀一下&…

java.lang.RuntimeException: Error receiving broadcast Intent { act=android.net.wifi.SCAN_RESULTS flg

E/AndroidRuntime: FATAL EXCEPTION: main Process: com.nokia.wlanapp, PID: 18526java.lang.RuntimeException: Error receiving broadcast Intent { actandroid.net.wifi.SCAN_RESULTS flg0x4000010 (has extras【外部】) } in com.nokia.wlanapp.Receive…

shell 整數條件判斷

兩個整數的比較 整數1 -eq 整數2 判斷整數1是否和整數2相等(相等為真) 整數1 -ne 整數2 判斷整數1是否和整數2不相等(不相等位置) 整數1 -gt 整數2 判斷整數1是否大于整數2(大于為真) 整數1 -lt 整數2 判斷整數1是否小于整數2(小于為真) 整數1 -ge 整數2 判斷整數1是否大于等于…

php處理上傳文件的步驟,php文件上傳步驟

我們在開發網站的時候&#xff0c;經常會遇到需要制作文件上傳功能&#xff0c;下面我們就為大家介紹一下php制作文件上傳功能的詳細步驟。推薦教程&#xff1a;PHP視頻教程第一步&#xff1a;創建一個文件上傳表單允許用戶從表單上傳文件是非常有用的。請看下面這個供上傳文件…

matlab求傅里葉級數展開式_傅里葉級數:從向量的角度看函數

幫助你理解線性代數與機器學習緊密結合的核心內容下文節選自北大出版社《機器學習線性代數基礎》, [遇見]已獲授權許可. 這本書不同于傳統教材, 從新的角度來介紹線性代數的核心知識, 講解也很棒, 又剛好參加參加了當當每滿100-50的活動, 感興趣的朋友可以關注下. 傅里葉級數&a…

c++實現超聲回波包絡檢測_超聲波物位計的選用

超聲波物位計超聲波在氣體、液體和固體介質中以一定速度傳播時因被吸收而衰減&#xff0c;但衰減程度不同&#xff0c;在氣體中衰減最大&#xff0c;而在固體中衰減最小&#xff1b;當超聲波穿越兩種不同介質構成的分界面時會產生反射和折射&#xff0c;且當這兩種介質的聲阻抗…

Android應用開發:CardView的使用及兼容

原文&#xff1a;http://blog.csdn.net/airk000/article/details/39520977 點擊閱讀原文 --------------------------------------------------------------- 引言 在Google I/O 2014上&#xff0c;Google公布了Android L Preview版本&#xff0c;此版本的UI有了非常大的改變…

云海技術u盤怎么恢復成普通盤_BITLOCKER加密中斷數據無法讀取恢復一例

同行求助此問題&#xff0c;密碼客戶是知道的&#xff0c;輸入密碼后提示如圖&#xff1a;如果點擊RESUME則提示如下&#xff1a;無視提示關閉提示框后再次提示分區需要格式化&#xff1a;PC3000 DE中可以添加虛擬驅動器解析BITLOCKER加密的分區&#xff0c;但該例添加虛擬驅動…