二百二十五、海豚調度器——用DolphinScheduler調度執行Flume數據采集任務

二百二十五、海豚調度器——用DolphinScheduler調度執行Flume數據采集任務

news/2025/8/25 21:03:54/文章來源:https://blog.csdn.net/tiantang2renjian/article/details/136399112

一、目的

數倉的數據源是Kafka，因此離線數倉需要用Flume采集Kafka中的數據到HDFS中

在實際項目中，不可能一直在Xshell中啟動Flume任務，一是項目的Flume任務很多，二是一旦Xshell頁面關閉Flume任務就會停止，這樣非常不方便，因此必須在后臺啟動Flume任務。

所以經過測試后，發現海豚調度器也可以啟動Flume任務

二、海豚調度Flume任務配置

（一）Flume在Linux中的路徑

（二）Flume任務文件在Linux中的位置以及任務文件名

（三）在海豚中配置運行腳本

#!/bin/bash
source /etc/profile

/usr/local/hurys/dc_env/flume/flume190/bin/flume-ng agent -n a1 -f /usr/local/hurys/dc_env/flume/flume190/conf/statistics.properties

注意：/usr/local/hurys/dc_env/flume/flume190/為Flume在Linux中的安裝，根據自己安裝路徑進行調整

（四）海豚任務配置好后就可以啟動海豚任務

（五）在HDFS對應文件夾中驗證是否采集到數據

Flume采集Kafka數據成功寫入到HDFS中，成功實現用海豚執行Flume任務的目的！

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/713337.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/713337.shtml
英文地址，請注明出處：http://en.pswp.cn/news/713337.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

案例研究｜DataEase助力眾陶聯應對產業鏈數據可視化挑戰

案例研究｜DataEase助力眾陶聯應對產業鏈數據可視化挑戰

佛山眾陶聯供應鏈服務有限公司（以下簡稱為“眾陶聯”）成立于2016年，是由34家陶瓷企業共同創辦的建陶行業工業互聯網平臺，股東產值占整個行業的22.5%。眾陶聯以數據賦能為核心，積極探索新的交易和服務模式，構…

閱讀更多...

ant-design-vue如何限制圖片上傳的尺寸？

ant-design-vue如何限制圖片上傳的尺寸？

handleBeforeUpload(file, fileList) {// fileList 只包含了當次上傳的文件列表，不包含已上傳的文件列表// 所以長度要加上已上傳的文件列表的長度const isLimit this.fileList.length fileList.length > this.limit;const indexOfFile fileList.findIndex(it…

閱讀更多...

C++ STL 之容器 vector 常見用法

C++ STL 之容器 vector 常見用法

一. 什么是vector vector為“變長數組”，即長度根據需要而自動改變的數組。頭文件： #include <vector>using namespace std;單獨定義一個vector：vector<typename> name，相當于一維數組 name[SIZE] ，其長…

閱讀更多...

mac-docker-php容器連接mac中的pgsql數據庫失敗以及出現table_msg存錯誤時的解決方法

mac-docker-php容器連接mac中的pgsql數據庫失敗以及出現table_msg存錯誤時的解決方法

以php中的thinkphp 5.1為例，php容器連接mac中的pgsql數據庫失敗時，出現如下錯誤 [7] PDOException in Connection.php line 528 SQLSTATE[08006] [7] could not connect to server: Connection refused Is the server running on host "localhost&…

閱讀更多...

Git 配置處理客戶端無法正常訪問到 github 原網站時，npm 下載依賴包失敗的問題

Git 配置處理客戶端無法正常訪問到 github 原網站時，npm 下載依賴包失敗的問題

Git 配置處理客戶端無法正常訪問到 github 原網站時，npm 下載依賴包失敗的問題使用 github 的鏡像網站地址或類似的替代產品地址，代替到 npm 拉取依賴包的 git 地址本地Git配置例如：執行一下命令，則是以https://kgithub.com 替…

閱讀更多...

requests庫/urllib3庫返回WEB響應內容的處理差異

requests庫/urllib3庫返回WEB響應內容的處理差異

requests庫是一個廣泛使用的HTTP庫，用于發送HTTP請求和處理響應。以下是requests庫中一些主要類和方法的詳細介紹：requests庫主要類和方法類:requests.models.Response: status_code: 響應狀態碼。text: 以Unicode形式返回響應內容。content: 以字節形…

閱讀更多...

MySQL的主從同步原理

MySQL的主從同步原理

MySQL的主從同步（也稱為復制）是一種數據同步技術，用于將一個MySQL服務器（主服務器）上的數據和變更實時復制到另一個或多個MySQL服務器（從服務器）。這項技術支持數據備份、讀寫分離、故障恢復等多…

閱讀更多...

帝國cms7.5仿非小號區塊鏈門戶資訊網站源碼帶手機版

帝國cms7.5仿非小號區塊鏈門戶資訊網站源碼帶手機版

帝國cms7.5仿非小號區塊鏈門戶資訊網站源碼帶手機版帶自動采集開發環境：帝國cms 7.5 安裝環境：phpmysql 包含火車頭采集規則和模塊，采集目標站非小號官網。專業的數字貨幣大數據平臺模板，采用帝國cms7.5內核仿制&#xff0…

閱讀更多...

LeetCode_22_中等_括號生成

LeetCode_22_中等_括號生成

文章目錄 1. 題目2. 思路及代碼實現（Python）2.1 暴力法2.2 回溯法 1. 題目數字 n n n 代表生成括號的對數，請你設計一個函數，用于能夠生成所有可能的并且有效的括號組合。示例 1： 輸入： n 3 n 3 …

閱讀更多...

Ai-WB2-32S在window下使用vs 和 msys2編譯以及燒錄

Ai-WB2-32S在window下使用vs 和 msys2編譯以及燒錄

文章目錄前言一、使用前準備第一步安裝vscode第二步安裝msys2 二、使用步驟1.打開MSYS2 MINGW64（1）在開始欄中找到MSYS2 MINGW64并打開（2）安裝git（3）安裝make（4）安裝好之后的文件…

閱讀更多...

前端面試練習24.3.1

前端面試練習24.3.1

一.進程和線程的區別進程：是程序的一次執行過程,擁有獨立的內存空間線程：是進程中的一個執行單元,共享所屬進程的內存空間和系統資源進程（Process）和線程（Thread）是操作系統中的重要概念，它…

閱讀更多...

Redis 之五：Redis 的主從復制

Redis 之五：Redis 的主從復制

概念主從復制，是指將一臺 Redis 服務器的數據，復制到其他的Redis服務器。前者稱為主節點(master)，后者稱為從節點(slave)；數據的復制是單向的，只能由主節點到從節點。默認情況下，每臺Redis服務器都是主節…

閱讀更多...

【0272】postgres內核分配 MyBackendId 實現原理（MyBackendId、MyProc、shmInvalBuffer）（三）

【0272】postgres內核分配 MyBackendId 實現原理（MyBackendId、MyProc、shmInvalBuffer）（三）

相關文章：【0255】揭曉pg內核中MyBackendId的分配機制（后端進程Id，BackendId）（一）【0256】揭曉pg內核中MyBackendId的分配機制（后端進程Id，BackendId）（二）第一個backend process前，shmInvalBuffer的值情況 (gdb) p *shmInvalBuffer $153 = {minMsgNum =

閱讀更多...

webpack-cli

webpack-cli

webpack-cli做了什么 webpack-cli 是 Webpack 提供的命令行工具，用于在命令行中執行 Webpack 相關的操作。webpack-cli 主要完成以下幾項工作： 解析和處理命令行參數：webpack-cli 負責解析用戶在命令行中輸入的參數，包括配置文件…

閱讀更多...

云天勵飛戰略投資神州云海，布局機器人市場

云天勵飛戰略投資神州云海，布局機器人市場

日前,AI上市企業云天勵飛(688343.SH)完成了對深圳市神州云海智能科技有限公司(以下簡稱“神州云海”)的B輪戰略投資。公開資料顯示,自2015年于深圳創立以來,神州云海始終聚焦人工智能與服務機器人廣闊的應用市場,依托自主的核心算法能力,深耕機器人硬件本體研發,整合上下游產…

閱讀更多...

Java學習筆記001——入門基礎知識

Java學習筆記001——入門基礎知識

Java語言是一種高級編程語言，它采用了面向對象編程的思想，具有跨平臺性和安全性等優點。現如今，Java語言成為了世界上最流行的編程語言之一。前一段學習Python語言，本文是學習java的第一篇筆記。 1. java運行環境搭建&#xff…

閱讀更多...

RabbitMQ-TTL/死信隊列/延遲隊列高級特性

RabbitMQ-TTL/死信隊列/延遲隊列高級特性

文章目錄 TTL死信隊列消息成為死信的三種情況隊列如何綁定死信交換機延遲隊列RabbitMQ如何實現延遲隊列總結來源B站黑馬程序員 TTL TTLTTL(Time To Live):存活時間/過期時間當信息到達存活時間后，還沒有被消費，會被自動清除。RabbitMQ可以對消息設置過…

閱讀更多...

Win10系統如何重置系統

Win10系統如何重置系統

Win10系統如何重置大家可以使用Win10內建的重設電腦設定，如以下操作： 首先，可以先到桌面左下角的【開始】選擇【設定】在【設定】裡找到【更新與安全性】在左側欄有一項【復原】在復原的標題下，副標題有一項【重設此電腦】…

閱讀更多...

【algorithm】算法基礎課---排序算法（附筆記 | 建議收藏）

【algorithm】算法基礎課---排序算法（附筆記 | 建議收藏）

🚀write in front🚀 📝個人主頁：認真寫博客的夏目淺石. 🎁歡迎各位→點贊👍 收藏?? 留言📝 📣系列專欄：AcWing算法學習筆記 💬總結：希望你看完…

閱讀更多...

tvm交叉編譯參考資料整理

tvm交叉編譯參考資料整理

環境 ubuntu20.04，ndk交叉編譯部署到adnroid手機參考： TVM部署神經網絡模型到android端_tvm android-CSDN博客使用TVM在android中進行Mobilenet SSD部署 - 知乎

閱讀更多...

最新文章