以下是對話中涉及的題目及其簡要解析:
1. 哪個 Flume Source 可用于監控某個端口,將流經端口的每一個文本行數據作為 Event 輸入?
? ?- A. Avro Source
? ?- B. exec Source
? ?- C. Spooling Directory Source
? ?- D. Netcat Source
2. 哪個不是 Flume Channel 支持的類型?
? ?- A. JDBC Channel
? ?- B. HDFS Channel
? ?- C. Memory Channel
? ?- D. File Channel
3. 以下對 Flume 描述正確的是:
? ?- (1)Flume 運行的核心是 Agent。它是一個完整的數據收集工具,含有三個核心組件,分別是 source、channel、sink;
? ?- (2)Event 從 Source 流向 Channel,再到 Sink,本身為一個 byte 數組,并可攜帶 headers 信息。
4. sqoop 導出時,數據庫的表會自動創建?
? ?- 對
? ?- 錯
5. sqoop 使用更新模式默認的方式,導出數據時?
? ?- A. 可以既更新數據,又插入數據
? ?- B. 只能更新數據
? ?- C. 當數據不存在時,可以更新成功
? ?- D. 必須指定 --update-mode 參數
6. Flume 是什么?
? ?- A. 一種數據傳輸協議
? ?- B. 一個分布式系統
? ?- C. 一個開源的監控系統
? ?- D. 一個數據采集、聚合和移動的工具
7. Flume 的配置文件必須使用 XML 格式編寫?
? ?- 對
? ?- 錯
8. 在 Flume 的配置文件中,source 和 sink 必須分別指定?
? ?- 對
? ?- 錯
9. 在使用 Flume 的配置文件時,可以省略 channel 的部分?
? ?- 對
? ?- 錯
10. 在 Flume 的配置文件中,可以使用參數化屬性來動態修改 source 或 sink 的配置抽取、加載 、查詢?
? ? - 對
? ? - 錯
11. Flume 的配置文件中,可以通過在 source 或 sink 組件中指定自定義參數來實現特定的功能?
? ? - 對
? ? - 錯
12. 關于 Flume 概念描述正確的是:
? ? - (1)Flume 是日志收集系統,支持在日志系統中定制各類數據發送方,用于收集數據;
? ? - (2)Flume 提供對數據進行簡單處理,并寫到各種 storage。
13. 關于 Flume 特性描述正確的是:
? ? - (1)Flume 是一個分布式、可靠和高可用的海量日志采集、聚合和傳輸的系統;
? ? - (2)在 Flume 中,最重要的抽象是 data flow(數據流),data flow 描述了數據從產生、傳輸、處理并最終寫入目標的一條路徑。
14. 關于 Flume 組件 Event 和 Agent 描述正確的是:
? ? - (1)Event:一個數據單元,帶有一個可選的消息頭,可以是日志記錄、avro對象等;
? ? - (2)Agent:一個獨立的 Flume 進程,負責數據收集,包含組件 Source、Channel、Sink。
15. 對 Flume 組件 Source 和 Channel 描述正確的是:
? ? - (1)Source:數據源,用來消費傳遞到該組件的 Event,每個 Agent 都可以有一個數據源;
? ? - (2)Channel:連接 sources 和 sinks,用于中轉 Event 的一個臨時存儲。
16. 以下哪個選項是啟動 Flume Agent 時用于指定配置文件的參數?
? ? - A. --conf 或 -c
? ? - B. --conf-file 或 -f
? ? - C. --conf 或 -c
? ? - D. --name 或 -n
17. 以下哪個選項是啟動 Flume Agent 時用于指定 agent 名稱的參數?
? ? - A. --conf 或 -c
? ? - B. 以上都不是
? ? - C. --name 或 -n
? ? - D. --name 或 -n
18. 以下哪個選項是啟動 Flume Agent 時用于指定配置文件目錄的參數?
? ? - A. --conf-file 或 -f
? ? - B. 以上都不是
? ? - C. --conf 或 -c
? ? - D. --name 或 -n
解析:
1. 哪個 Flume Source 可用于監控端口,將流經端口的每一個文本行數據作為 Event 輸入?
? ?- 正確答案:D. Netcat Source
2. 哪個不是 Flume Channel 支持的類型?
? ?- 正確答案:D. File Channel
3. 關于 Flume 描述正確的是:
? ?- 正確答案:C. (1)對(2)錯
4. sqoop 導出時,數據庫的表會自動創建?
? ?- 正確答案:對
5. sqoop 使用更新模式默認的方式,導出數據時?
? ?- 正確答案:D. 必須指定 --update-mode 參數
6. Flume 是什么?
? ?- 正確答案:D. 一個數據采集、聚合和移動的工具
7. Flume 的配置文件必須使用 XML 格式編寫?
? ?- 正確答案:錯
8. 在 Flume 的配置文件中,source 和 sink 必須分別指定?
? ?- 正確答案:對
9. 在使用 Flume 的配置文件時,可以省略 channel 的部分?
? ?- 正確答案:錯
10. 在 Flume 的配置文件中,可以使用參數化屬性來動態修改 source 或 sink 的配置?
? ? - 正確答案:對
11. Flume 的配置文件中,可以通過在 source 或 sink 組件中指定自定義參數來實現特定的功能?
? ? - 正確答案:對
12. 關于 Flume 概念描述正確的是:
? ? - 正確答案:D. (1)和(2)都對
13. 關于 Flume 特性描述正確的是:
? ? - 正確答案:D. (1)和(2)都對
14. 關于 Flume 組件 Event 和 Agent 描述正確的是:
? ? - 正確答案:D. (1)和(2)都對
15. 對 Flume 組件 Source 和 Channel 描述正確的是:
? ? - 正確答案:A. (1)和(2)都對
16. 以下哪個選項是啟動 Flume Agent 時用于指定配置文件的參數?
? ? - 正確答案:C. --conf 或 -c
17. 以下哪個選項是啟動 Flume Agent 時用于指定 agent 名稱的參數?
? ? - 正確答案:D. --name 或 -n
18. 以下哪個選項是啟動 Flume Agent 時用于指定配置文件目錄的參數?
? ? - 正確答案:D. --conf 或 -c