Flink基礎整理

文章目錄

  • 前言
  • 1.Flink系統架構
  • 2.編程模型(API層次結構)
  • 3.DataSet和DataStream區別
  • 4.Flink的批流統一
  • 5.Flink的狀態后端
  • 6.Flink有哪些狀態類型
  • 7.Flink并行度


前言

提示:下面是根據網絡或AI整理:


1.Flink系統架構

  • 用戶在客戶端提交作業(Job)到服務端。
  • 服務端為分布式的主從架構。
    • Dispatcher 服務負責提供 REST 接口來接收 Client 提交的 Job,運行 Web UI,并負責啟動和派發 Job 給 JobManager。
    • Resource Manager 負責計算資源(TaskManager)的管理,其調度單位是 slots。
    • JobManager 負責整個集群的任務管理、資源管理、協調應用程序的分布執行,將任務調度到 TaskManager 執行、檢查點(checkpoint)的創建等工作。
    • TaskManager(worker)負責 SubTask 的實際執行,提供一定數量的 Slots,Slots 數就是 TM 可以并發執行的task數。當服務端的 JobManager 接收到一個 Job 后,會按照各個算子的并發度將 Job 拆分成多個 SubTask,并分配到 TaskManager 的 Slot 上執行。
      在這里插入圖片描述

2.編程模型(API層次結構)

在這里插入圖片描述

  • 最底層提供了有狀態流:可以自定義狀態信息和處理邏輯,但是也需要你自己管理狀態的生命周期,容錯,一致性等問題。
  • 核心開發層:包括 DataStream API 和 DataSet API,它們提供了常見的數據轉換,分組,聚合,窗口,狀態等操作。這個層級的 api 適合大多數的流式和批式處理的場景。
  • 聲明式 DSL 層:是以表為中心的聲明式 DSL,其中表可能會動態變化(在表達流數據時)。Table API 提供了例如 select、project、join、group-by、aggregate 等操作
  • 結構化層:SQL API,它是最高層的 api,可以直接使用 SQL 語句進行數據處理,無需編寫 Java 或 Scala 代碼。這個層級的 api 適合需要快速響應業務需求,縮短上線周期,代碼可移植性和可閱讀性高,和自動調優的場景,但也最不靈活和最不具有表現力。

3.DataSet和DataStream區別

在這里插入圖片描述

4.Flink的批流統一

概念: 批流統一是指Flink提供了一種統一的API和執行引擎,使得批處理(Batch Processing)和流處理(Stream Processing)可以使用相同的API進行編程,并且共享相同的執行計劃和優化策略。這一特性簡化了開發流程,減少了代碼重復,同時提高了系統的靈活性和性能(一套代碼處理流或批數據)。
體現在以下幾個方面:

  • 統一的API:無論是處理有限的數據集(批處理)還是無限的數據流(流處理),開發者都可以使用同一套API進行編程。
  • 統一的執行引擎:Flink的執行引擎能夠自動識別輸入數據是批數據還是流數據,并選擇合適的執行模式。
  • 統一的狀態

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/81704.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/81704.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/81704.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

mq消息可靠性傳送

mq消息傳送 開啟消息發布確認模式 def publish(self, message):"""發布消息(自動重連)"""for i in range(3):try:message_ json.dumps(message, ensure_asciiFalse)self.ensure_connection()# 開啟 confirm 模式&#x…

【quantity】10 面積單位模塊(area.rs)

一、源碼 我們可以實現面積單位文件,包含k(千)、d(分)、c(厘)、m(毫)前綴的面積量。面積的基本單位是平方米(SquareMeter)。 以下是area.rs的實…

運算放大器的主要技術指標

運放(運算放大器)是一種基礎電子器件,具有輸入阻抗高、開環放大倍數大、輸入端電流小、同相端與反相端電壓幾乎相等等特點。在選型時,需要考慮技術指標如輸入失調電壓、輸入失調電壓漂移、輸入失調電流、共模抑制比、壓擺率、建立…

Docker 服務搭建

💢歡迎來到張翊塵的開源技術站 💥開源如江河,匯聚眾志成。代碼似星辰,照亮行征程。開源精神長,傳承永不忘。攜手共前行,未來更輝煌💥 文章目錄 Docker 服務搭建在 Ubuntu 上安裝 Docker更新軟件…

CRM系統接入DeepSeek大模型應用場景方案

1. 項目背景與目標 在當前數字化轉型的浪潮中,客戶關系管理(CRM)系統已成為企業提升客戶服務效率、優化銷售流程的核心工具。然而,傳統CRM系統普遍面臨數據處理能力有限、客戶洞察深度不足、響應效率低下等問題。例如&#xff0c…

步進電機中斷函數解釋

STM32 motor111.c 中 HAL_TIM_PeriodElapsedCallback 函數逐行解釋 下面我們對 STM32 項目中 motor111.c 文件里的 HAL_TIM_PeriodElapsedCallback(TIM_HandleTypeDef *htim) 函數進行逐行解析,幫助初學者理解每一行代碼的作用。此函數是在定時器產生更新中斷時被調…

什么是Linux中的systemd?

寫在前面 為什么要回過頭來復習linux的system的,最近在研究DELL EMC的PowerStore存儲系統,其底層是基于CoreOS開發的,這套操作系統是基于Systemd來設計的。所以要深入了解PowerStore就必須對systemd做詳細了解。 systemd 是一個用于 Linux …

Linux 環境下 Mysql 5.7 數據定期備份

目錄 一、創建數據備份腳本二、查看備份日志三、數據庫數據恢復 備份策略: 系統環境 openEuler 22.03 (LTS-SP4) 單機備份 每天凌晨2點,指定數據庫表全量備份,只保留近7次備份數據 每次的腳本執行,將會記錄執行結果到日志&#xf…

C 語言字符輸入:掌握 getchar 和 scanf 的用法與陷阱

各類資料學習下載合集 ??https://pan.quark.cn/s/8c91ccb5a474?? C 語言字符輸入:掌握 getchar 和 scanf 的用法與陷阱 你好!在 C 語言編程中,與用戶進行交互最基本的方式就是通過標準輸入和標準輸出。我們之前探討了如何使用 ??printf?? 和 ??putchar?? 進行…

【React】 Hooks useTransition 解析與性能優化實踐

1.背景 useTransition 是 React 18 引入的一個并發模式下的 Hook,用于區分緊急和非緊急的狀態更新,提升應用的響應性和用戶體驗;它可以管理 UI 中的過渡狀態,特別是在處理長時間運行的狀態更新時。它允許你將某些更新標記為“過渡”狀態&…

蘑菇管理——AI與思維模型【94】

一、定義 蘑菇管理思維模型是一種形象地描述組織對待新員工或初入職場者的管理方式及相關現象的思維模型。它將新員工或初入職場者比作蘑菇,這些人在初期往往被置于陰暗的角落(不受重視的部門,或打雜跑腿的工作),澆上…

c++STL——set和map的使用

文章目錄 set和map的使用set系列聲名和定義默認成員函數迭代器set的增刪查lower_bound和upper_boundInsert接口pair類 對于查找的另一種使用 set和multiset的區別 map系列聲名和定義pair類的進一步介紹默認成員函數map的增刪查map的數據修改map和multimap的差異 set和map的使用…

什么是DGI數據治理框架?

DGI數據治理框架是由數據治理研究所(Data Governance Institute, DGI)提出的一套系統性方法論,旨在幫助企業或組織建立有效的數據治理體系,確保數據資產的高質量管理、合規使用和價值釋放。以下是關于DGI數據治理框架的核心內容&a…

chrome 瀏覽器怎么不自動提示是否翻譯網站

每次訪問外國語網頁都會彈出這個對話框,很是麻煩,每次都得手動關閉一下。 不讓他彈出來方法: 設置》語言》首選語言》添加語言,搜索英語添加上 如果需要使用翻譯,就點擊三個點,然后選擇翻譯

LeetCode 熱題 100 54. 螺旋矩陣

LeetCode 熱題 100 | 54. 螺旋矩陣 大家好,今天我們來解決一道經典的算法題——螺旋矩陣。這道題在LeetCode上被標記為中等難度,要求我們按照順時針螺旋順序返回矩陣中的所有元素。下面我將詳細講解解題思路,并附上Python代碼實現。 問題描述…

生成式AI將重塑的未來工作

在人類文明的長河中,技術革命始終是推動社會進步的核心動力。從蒸汽機的轟鳴到互聯網的浪潮,每一次技術躍遷都在重塑著人類的工作方式與生存形態。而今,生成式人工智能(Generative AI)的崛起,正以超越以往任何時代的速度與深度,叩響未來工作范式變革的大門。這場變革并非…

【2025軟考高級架構師】——2024年05月份真題與解析

摘要 本文內容是關于2025年軟考高級架構師考試的相關資料,包含2024年05月份真題與解析。其中涉及體系結構演化的步驟、OSI協議中能提供安全服務的層次、數據庫設計階段中進行關系反規范化的環節等知識點,還提及了軟考高級架構師考試的多個模塊&#xff…

KAG:通過知識增強生成提升專業領域的大型語言模型(三)

目錄 摘要 Abstract 1 Schema 2 Prompt 3 KAG-Builder 3.1 reader 3.2 splitter 3.3 extractor 3.4 vectorizer 3.5 writer 3.6 可選組件 4 示例 總結 摘要 本周深入學習了 KAG 項目中的 Schema、Prompt 以及 KAG-Builder 相關代碼知識,涵蓋了其定義、…

Gitea windows服務注冊,服務啟動、停止、重啟腳本

修改配置文件 查看COMPUTERNAME echo %COMPUTERNAME%進入配置文件D:\gitea\custom\conf\app.ini,將 Gitea 設置為以本地系統用戶運行 如果結果是 USER-PC,那么 RUN_USER USER-PC$ RUN_USER COMPUTERNAME$SQLite3 PATH配置,更改為包含完整…

礦泉水瓶的繪制

1.制作中心矩形,大小為60,注意設置矩形的兩條邊相等 2.點擊拉伸,高度為150mm 3.使用圓角命令,點擊連接到開始面,同時選中4條邊,進行圓角轉化,圓角大小為10mm,點擊多半徑圓角&#xf…