32、Flink 的 DataStream API 物理分區算子詳解

32、Flink 的 DataStream API 物理分區算子詳解

diannao/2025/9/17 2:47:43/文章來源:https://blog.csdn.net/m0_50186249/article/details/138896846

3.物理分區

Flink 提供以下方法讓用戶根據需要在數據轉換完成后對數據分區進行更細粒度的配置。

a）自定義分區

DataStream → DataStream

使用自定義的 Partitioner 為每個元素選擇目標任務。

dataStream.partitionCustom(partitioner, "someKey");
dataStream.partitionCustom(partitioner, 0);

b）隨機分區

DataStream → DataStream

將元素隨機地均勻劃分到分區。

dataStream.shuffle();

c）Rescaling

DataStream → DataStream

將元素以 Round-robin 輪詢的方式分發到下游算子。

如果想將數據源的多個并發實例的數據分發到多個下游 map 來實現負載分配，但又不想像 rebalance() 那樣引起完全重新平衡，該算子將只會到本地數據傳輸而不是網絡數據傳輸，這取決于其它配置值，例如 TaskManager 的 slot 數量。

上游算子將元素發往哪些下游的算子實例集合同時取決于上游和下游算子的并行度；例如，如果上游算子并行度為 2，下游算子的并發度為 6，那么上游算子的其中一個并行實例將數據分發到下游算子的三個并行實例，另外一個上游算子的并行實例則將數據分發到下游算子的另外三個并行實例中。再如，當下游算子的并行度為2，而上游算子的并行度為 6 的時候，那么上游算子中的三個并行實例將會分發數據至下游算子的其中一個并行實例，而另外三個上游算子的并行實例則將數據分發至另下游算子的另外一個并行實例。

當算子的并行度不是彼此的倍數時，一個或多個下游算子將從上游算子獲取到不同數量的輸入。

在這里插入圖片描述

dataStream.rescale();

d）廣播

DataStream → DataStream

將元素廣播到每個分區。

dataStream.broadcast();

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/12646.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/12646.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/12646.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

網絡安全從業者“行話”

網絡安全從業者“行話”

目錄 ?編輯一、攻擊篇 1．攻擊工具 2．攻擊方法 3．攻擊者二、防守篇 1．軟硬件 2．技術與服務網絡安全學習資源分享: 特別聲明一、攻擊篇 1．攻擊工具肉雞所謂“肉雞”是一種很形象的比喻&…

閱讀更多...

【MATLAB】Enigma機加密原理與自實現

【MATLAB】Enigma機加密原理與自實現

文章目錄什么是EnigmaEnigma機加密通信流程Enigma的物理構造Enigma的加密設置Enigma加密通信密碼重新設置Enigma加密消息拼接注意 Enigma的解密分解設置Enigma解密通信密碼重新設置Enigma解密消息 Enigma的弱點MATLAB自實現Enigma加密與解密Enigma_functionRotate_functiontes…

閱讀更多...

JavaScript碎碎念

JavaScript碎碎念

文章目錄 !和!!?? !和!! 邏輯非運算符!接受一個參數，并按如下運作： 將操作數轉化為布爾類型：true/false。返回相反的值。 alert( !true ); // false alert( !0 ); // true兩個非運算!! 用時候用來將某個值轉化為布爾類型 alert( !!&quo…

閱讀更多...

八大設計模式：適配器模式實現棧的泛型編程 | 通用數據結構接口的秘訣（文末送書）

八大設計模式：適配器模式實現棧的泛型編程 | 通用數據結構接口的秘訣（文末送書）

🎬 鴿芷咕：個人主頁 🔥 個人專欄: 《C干貨基地》《粉絲福利》 ??生活的理想，就是為了理想的生活! 引入哈嘍各位鐵汁們好啊，我是博主鴿芷咕《C干貨基地》是由我的襄陽家鄉零食基地有感而發，不知道各位的…

閱讀更多...

Leetcode—3146. 兩個字符串的排列差【簡單】

Leetcode—3146. 兩個字符串的排列差【簡單】

2024每日刷題（135） Leetcode—3146. 兩個字符串的排列差實現代碼 class Solution { public:int findPermutationDifference(string s, string t) {int maps[26];int mapt[26];for(int i 0; i < s.size(); i) {int idxs s[i] - a;int idxt t[i] …

閱讀更多...

上門回收小程序：打破傳統回收模式的局限性

上門回收小程序：打破傳統回收模式的局限性

一、引言在環保意識日益增強的今天，廢品回收已成為我們日常生活中不可或缺的一部分。然而，傳統的回收模式存在著效率低下、回收范圍有限等局限性。為了打破這些局限，我們推出了上門回收小程序，旨在通過數字化、智能化的方式&…

閱讀更多...

Flutter+Getx仿小米商城項目實戰教程又新增了Flutter調用原生地圖

Flutter+Getx仿小米商城項目實戰教程又新增了Flutter調用原生地圖

FlutterGetx仿小米商城項目實戰教程基于Flutter3.x錄制，課程緊貼企業需求，目前已完結176講。教程所講內容支持Android、Ios、華為鴻蒙OS，教程更新于2024年4月09日新增 Flutter 調用百度地圖、新增Flutter充電樁項目地圖實戰。支持2024年3月29…

閱讀更多...

AXI GPIO IP核配置詳解

AXI GPIO IP核配置詳解

AXI GPIO（AXI General-Purpose Input/Output）設計提供了一個通用的輸入/輸出接口，該接口連接到一個AXI4-Lite接口。AXI GPIO可以被配置為單通道或雙通道設備，每個通道的位寬可以獨立配置。端口（即GPIO引腳&#xff0…

閱讀更多...

學習java第七十天

學習java第七十天

Spring 的常用注解？ Required:該注解應用于設值方法 Autowired：該注解應用于有值設值方法、非設值方法、構造方法和變量。 Qualifier：該注解和Autowired 搭配使用，用于消除特定 bean 自動裝配的歧義 Spring的事務傳播行為有哪…

閱讀更多...

02-WPF_基礎（一）

02-WPF_基礎（一）

1、基礎各模塊類型鏈接：如何：向 Viewbox 的內容應用 Stretch 屬性 - WPF .NET Framework | Microsoft Learn WPF基礎以及事件綁定與數據綁定的情況，，在學習XAML，數據結構以及一個項目學習平臺來練手，網絡…

閱讀更多...

兒童社交恐懼：關愛與引導，幫助孩子走出陰霾

兒童社交恐懼：關愛與引導，幫助孩子走出陰霾

引言兒童的社交能力是其心理健康和全面發展的重要組成部分。然而，有些兒童會表現出社交恐懼，這種情況不僅影響他們的日常生活和學習，還可能對其長遠發展產生不利影響。本文將探討兒童社交恐懼的注意事項，并提供實用的建議和方法…

閱讀更多...

jvm故障定位

jvm故障定位

? cpu使用率低負載高，原因分析-----舉例命令排查過程原因：大量線程io阻塞。建議從以下幾個方面排查代碼問題： 1、是否有內存泄露導致頻繁GC 2、是否有死鎖發生 3、是否有大字段的讀寫 4、會不會是數據庫操作導致的，排查SQL語…

閱讀更多...

百面算法工程師 | YOLOv6面試考點原理全解析

百面算法工程師 | YOLOv6面試考點原理全解析

本文給大家帶來的百面算法工程師是深度學習目標檢測YOLOv6面試總結，文章內總結了常見的提問問題，旨在為廣大學子模擬出更貼合實際的面試問答場景。在這篇文章中，我們還將介紹一些常見的深度學習目標檢測面試問題，并提供參考的回答…

閱讀更多...

壓力給到 Google，OpenAI 發布 GPT-4o 來了

壓力給到 Google，OpenAI 發布 GPT-4o 來了

北京時間5月14日凌晨1點，OpenAI 開啟了今年的第一次直播，根據官方消息，這次旨在演示 ChatGPT 和 GPT-4 的升級內容。在早些時候 Sam Altman 在 X 上已經明確，「我們一直在努力開發一些我們認為人們會喜歡的新東西，對我…

閱讀更多...

jar包安裝成Windows服務

jar包安裝成Windows服務

一、前言很多年前寫過一篇《使用java service wrapper把windows flume做成服務》的文章，也是把jar包安裝成windows服務，今天介紹另外一種更簡便的方案。二、正片這次使用的工具是 winsw，一個Windows服務包裝器。下面看詳細介紹首先從g…

閱讀更多...

momentjs

momentjs

Moment.js 是一個用于處理日期和時間的 JavaScript 庫，它提供了許多方便的函數和方法來操作、格式化和解析日期時間。官網常見用法格式化日期時間：可以使用format方法將日期時間格式化為指定的字符串格式，例如YYYY-MM-DD HH:mm:ss。獲取日…

閱讀更多...

中國CEO直播簡史

中國CEO直播簡史

圖片｜電影《教父》截圖 ©自象限原創作者丨羅輯編輯丨程心領導人愛對外發言這事，是中國的一個傳統文化。從乾隆愛往名畫上蓋章上，就可見一斑。 3Q大戰時代，微博成了大佬“吵架”的戰場，飯否變成了部分愛…

閱讀更多...

解釋Java中的動態代理（Dynamic Proxy）及其用例

解釋Java中的動態代理（Dynamic Proxy）及其用例

在Java中，動態代理（Dynamic Proxy）是一種在運行時動態創建代理類和對象的機制。它允許你在不改變原有類代碼的前提下，通過代理類對原有類的方法增加額外的處理邏輯（如安全檢查、事務處理、日志記錄等）&…

閱讀更多...

在為法人主體添加平衡段值時選不到相應的平衡段值

在為法人主體添加平衡段值時選不到相應的平衡段值

1、在為H1038公司添加平衡段值時，值集列表中無法選到需要的平衡段值，進一步對其后臺取值邏輯進行分析 SELECT *FROM (SELECT FLEXVALUES.FLEX_VALUE, FLEXVALUES.DESCRIPTIONFROM FND_FLEX_VALUES_VL FLEXVALUESWHERE FLEXVALUES.FLEX_VALUE_SET_ID :1…

閱讀更多...

Digimat在電池殼體SMC復合材料成型工藝中的應用

Digimat在電池殼體SMC復合材料成型工藝中的應用

SMC工藝介紹及挑戰 SMC（Sheet Molding Compound的縮寫，即片狀模塑料）是一種復合材料制造工藝。該工藝可以有效地代替金屬，實現車輛輕量化目標。該工藝不僅能夠顯著降低車身重量，而且設計靈活，操作簡單、易…

閱讀更多...

最新文章