hudi系列-schema evolution(一)

hudi系列-schema evolution(一)

diannao/2025/9/12 16:29:20/文章來源:https://blog.csdn.net/czmacd/article/details/140021470

hudi+flink在非schema on read模式下也表現出了支持一部分的schema evolution功能，本篇中測試一下在非schema on read模式下，發生各種列變更情況時數據寫入與讀取情況。

flink 1.14.5
hudi 0.13.1
mor表

思路：

選擇mor表是因為它的數據文件有avro和parquet兩種格式，能覆蓋得更全面，相對于cow表，兩者在parquet上的讀取共用了低層實現(RecordIterators.getParquetRecordIterator)，所以兩者表現應該是一致的。
模式變更前后分別寫入一條數據，用變更后的模式讀取所有數據
測試parquet讀：insert模式下使用兩條數據寫入不同的parquet文件，進行eartlist的增量讀。如果采用compaction生成parquet，新舊數據需要分別compact到不同文件(一個parquet對應一個schema)，否則舊數據會自動在compact過程中進行了evolve，可將數據寫到不同分區。
只讀arvo：upsert模式使兩次寫入均生成arvo文件，進行eartlist的增量讀。即使寫到同一個文件，但是兩次寫入對應不同的block，有各自的schema.

追加列

模式變更前：<id int, name string, create_date string>，數據(1,‘1’,‘2023-07-25’)
模式變更后：<id int, name string, create_date string, col1 int>，數據(2,‘2’,‘2

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/diannao/36405.shtml
繁體地址，請注明出處：http://hk.pswp.cn/diannao/36405.shtml
英文地址，請注明出處：http://en.pswp.cn/diannao/36405.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

java中常用集合（邊補充）

java中常用集合（邊補充）

java中開發常用集合（邊補充） 一、單列集合Collection1.1List接口1.1.1 ArrayList1.1.2 LinkedList1.1.3 Vector（線程安全）1.1.4 CopyOnWriteArrayList（線程安全） 1.2 Set接口1.2.1 HashSet1.2.2 LinkedHash…

閱讀更多...

用戶訂單管理API：輕松管理，購物無憂

用戶訂單管理API：輕松管理，購物無憂

在當今數字化時代，電子商務已經成為人們購物的首選方式。與傳統的實體店相比，電商的優勢在于便捷、快速、多樣化等特點，使得更多的消費者選擇了通過網絡購物。而作為電商平臺，如何提供更好的購物體驗，是每個平臺都需要…

閱讀更多...

企業工程項目管理系統源碼：Java版源碼解析

企業工程項目管理系統源碼：Java版源碼解析

一、項目概述鴻鵠工程項目管理系統是基于Spring Cloud、Spring Boot、Mybatis、Vue和ElementUI技術棧，采用前后端分離架構構建的工程管理軟件。它旨在應對企業快速發展中的管理挑戰，提升工程管理效率，減輕工作負擔，加速信息處理…

閱讀更多...

一次關于k8s的node節點NotReady的故障排查

一次關于k8s的node節點NotReady的故障排查

master現象分析 kubectl get nodes -A 看了下pod的狀態，好多CrashLoopBackOff kubectl get nodes -o wide 定位到那個具體node的IP地址，登錄對應的IP去查看為什么會這樣 node節點 journalctl -xe -f -u kubelet 查看此節點的 kubelet 服務&#xff…

閱讀更多...

基于SpringBoot的藏區特產銷售平臺

基于SpringBoot的藏區特產銷售平臺

你好呀，我是計算機學姐碼農小野！如果有相關需求，可以私信聯系我。開發語言： Java 數據庫： MySQL 技術： SpringBoot框架工具： MyEclipse 系統展示首頁個人中心特產信息管理訂單管…

閱讀更多...

華寬通中標長沙市政務共性能力建設項目，助力智慧政務建設新飛躍

華寬通中標長沙市政務共性能力建設項目，助力智慧政務建設新飛躍

在數字化浪潮的推動下，長沙市政府正積極擁抱智慧城市建設，以科技力量提升政務服務效能。華寬通憑借其卓越的技術實力與豐富的項目經驗，成功中標長沙市政務共性能力建設項目，這無疑是對華寬通在智慧城市領域實力的高度認可。華寬…

閱讀更多...

huggingface_hub 設置國內鏡像

huggingface_hub 設置國內鏡像

要設置HuggingFace Hub的國內鏡像，你可以按照以下步驟進行操作，以確保從國內鏡像站點下載Hugging Face模型和數據集。 1. 安裝依賴首先，確保你已經安裝了huggingface_hub庫。如果沒有，可以通過pip進行安裝： bash復制…

閱讀更多...

背部筋膜炎最有效的治療方法

背部筋膜炎最有效的治療方法

背部筋膜炎的引起原因可以歸結為多個方面，以下是詳細的分點表示和歸納： 1、慢性勞損：長時間使用背部，如經常按摩背部，會導致筋膜老化、發炎，進而引發背部筋膜炎。癥狀可能包括背部疼痛、痙攣、肌肉無力感等…

閱讀更多...

Python 判斷for循環最后一次的6種方法

Python 判斷for循環最后一次的6種方法

在Python中，通常我們不會直接判斷for循環是否正在執行最后一次迭代，因為Python的for循環是基于可迭代對象的，它不知道也不關心迭代的內部狀態（比如當前是第幾次迭代）。但是，我們可以使用一些技巧來間接地實…

閱讀更多...

uboot環境變量操作命令setenv和saveenv

uboot環境變量操作命令setenv和saveenv

uboot啟動的時候會將環境變量從flash讀取到DRAM中,使用命令 setenv修改的是DRAM中環境變量,修改以后要使用saveenv命令將修改后的環境變量保存到flash中,否則的話uboot下一次重啟會繼續使用以前的環境變量值.setenv setenv - set environment variables Usage: setenv seten…

閱讀更多...

LeetCode.295數據流的中位數詳解

LeetCode.295數據流的中位數詳解

問題描述中位數是有序整數列表中的中間值。如果列表的大小是偶數，則沒有中間值，中位數是兩個中間值的平均值。例如 arr [2,3,4] 的中位數是 3 。例如 arr [2,3] 的中位數是 (2 3) / 2 2.5 。實現 MedianFinder 類: MedianFinder() 初始化 Medi…

閱讀更多...

Advantest 93000測試機中CLOCK DOMAIN 詳解

Advantest 93000測試機中CLOCK DOMAIN 詳解

愛德萬測試（Advantest）的V93000系列測試系統是一個高度模塊化和可擴展的平臺，專為復雜和高性能的半導體器件測試而設計，包括系統級芯片（SoC）、存儲器、射頻（RF）和混合信號器件等。在…

閱讀更多...

剪畫小程序：從失業到自媒體：37歲的勇敢轉身！

剪畫小程序：從失業到自媒體：37歲的勇敢轉身！

37歲啦，按說這年紀工作該穩穩當當，家庭也和和美美。可誰能想到，我竟然失業了！當時啊，心里頭那叫一個迷茫、焦慮，感覺天都要塌下來了。可日子還得過呀，總不能就這么被生活給打倒！現在…

閱讀更多...

白敬亭章若楠甜度報表的難哄大師

白敬亭章若楠甜度報表的難哄大師

#白敬亭章若楠，甜度爆表的難哄大師#🎉🎉🎉各位小伙伴們，你們還記得那個讓我們心跳加速、嘴角上揚的CP組合嗎？沒錯，就是白敬亭和章若楠！他們可是憑借一部新劇，再次讓我們感…

閱讀更多...

antd中Select大數據分頁觸底刷新處理優化

antd中Select大數據分頁觸底刷新處理優化

平時使用antd中Select的下拉一般就幾十幾百條，這時候直接使用組件模糊查詢就能實現大部分業務場景需求。今天遇到一個需要模糊查詢并且總量上萬條的下拉框，如果一次性懟上去上萬條，會造成瀏覽器卡頓。所以這邊采用后端分頁，前端…

閱讀更多...

希喂生骨肉凍干值得入手嗎？拯救瘦弱、增強抵抗力最強主食測評！

希喂生骨肉凍干值得入手嗎？拯救瘦弱、增強抵抗力最強主食測評！

希喂生骨肉凍干值得入手嗎？很多小姐妹覺著自家貓咪太瘦了、體質不咋好，換季還敏感、掉毛、不吃東西，聽說生骨肉凍干好吸收、營養好，可以改善體質、拯救瘦弱、增強抵抗力，為了圖省事，開始盲入生骨肉凍干&…

閱讀更多...

盲盒小程序：線上盲盒發展機遇

盲盒小程序：線上盲盒發展機遇

盲盒已經成為了當下年輕人的潮玩首選方式。隨著二次元、影視行業的快速發展，給盲盒提供了各種新的發展方向，盲盒商品也在不斷創新，種類豐富多樣。玩家在拆盲盒時隨機獲得某一商品，具有驚喜感和刺激性。目前，隨著小程…

閱讀更多...

194.回溯算法：組合總和||（力扣）

194.回溯算法：組合總和||（力扣）

代碼解決 class Solution { public:vector<int> res; // 當前組合的臨時存儲vector<vector<int>> result; // 存儲所有符合條件的組合// 回溯函數void backtracing(vector<int>& candidates, int target, int flag, int index, vector<bool>…

閱讀更多...

怎么優化亞馬遜Listing？看這一篇就夠了！

怎么優化亞馬遜Listing？看這一篇就夠了！

運營亞馬遜最重要的工作之一就是優化listing，精心優化好亞馬遜標題、五點描述、圖片和關鍵詞才能提高產品的可見性和吸引力，很多小伙伴對于怎么寫出專業的亞馬遜listing還是不知道如何下手，今天為大家分享一套實用的亞馬遜listing優化指南&am…

閱讀更多...

java 簡單零錢通

java 簡單零錢通

目標面向過程版代碼 package new_pluse;import java.text.SimpleDateFormat; import java.util.Date; import java.util.Scanner;public class change_common{public static void main(String arg[]){//定義相關變量Scanner scanner new Scanner(System.in);String key&qu…

閱讀更多...

最新文章