Spark 4.0的VariantType 類型以及內部存儲

背景

本文基于Spark 4.0

總結

Spark中的 VariantType 類型,用盡量少的字節來存儲Json的格式化數據

分析

這里主要介紹 Variant 的存儲,我們從VariantBuilder.buildJson方法(把對應的json數據存儲為VariantType類型)開始:

public static Variant parseJson(JsonParser parser, boolean allowDuplicateKeys)throws IOException {VariantBuilder builder = new VariantBuilder(allowDuplicateKeys);builder.buildJson(parser);return builder.result();}

這個方法會調用buildJson這個方法:

JsonToken token = parser.currentToken();if (token == null) {throw new JsonParseException(parser, "Unexpected null token");}switch (token) {case START_OBJECT: {ArrayList<FieldEntry> fields = new ArrayList<>();int start = writePos;while (parser.nextToken() != JsonToken.END_OBJECT) {String key = parser.currentName();parser.nextToken();int id = addKey(key);fields.add(new FieldEntry(key, id, writePos - start));buildJson(parser);}finishWritingObject(start, fields);break;}case START_ARRAY: {ArrayList<Integer> offsets = new ArrayList<>();int start = writePos;while (parser.nextToken() != JsonToken.END_ARRAY) {offsets.add(writePos - start);buildJson(parser);}finishWritingArray(start, offsets);break;}case VALUE_STRING:appendString(parser.getText());break;case VALUE_NUMBER_INT:try {appendLong(parser.getLongValue(

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/87405.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/87405.shtml
英文地址,請注明出處:http://en.pswp.cn/web/87405.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

跨越十年的C++演進:C++20新特性全解析

跨越十年的C演進系列&#xff0c;分為5篇&#xff0c;本文為第四篇&#xff0c;后續會持續更新C23~ 前3篇如下&#xff1a; 跨越十年的C演進&#xff1a;C11新特性全解析 跨越十年的C演進&#xff1a;C14新特性全解析 跨越十年的C演進&#xff1a;C17新特性全解析 C20標準…

LeetCode--40.組合總和II

前言&#xff1a;如果你做出來了39題&#xff0c;但是遇到40題就不會做了&#xff0c;那我建議你去再好好縷清39題的思路&#xff0c;再來看這道題&#xff0c;會有種豁然開朗的感覺解題思路&#xff1a;這道題其實與39題基本一致&#xff0c;所以本次題解是借著39題為基礎來講…

Docker Desktop 安裝到D盤(包括鏡像下載等)+ 漢化

目錄 一、 開啟電腦虛擬化 1. 搜索并打開控制面板 2. 點擊程序 3. 點擊啟用或關閉 Windows 功能 4. 打開相關功能 5. 沒有Hyper-V的情況&#xff1a; 二、配置環境 1. 更新 WSL 到最新版 2. 設置 WSL 2為默認版本 3. 安裝 Ubuntu 三. WSL 遷移到D盤 1. 停止運行wsl…

基于 OpenCV 的圖像 ROI 切割實現

一、引言 在計算機視覺領域&#xff0c;我們經常需要處理各種各樣的圖像數據。有時候&#xff0c;我們只對圖像中的某一部分區域感興趣&#xff0c;例如在一張人物照片中&#xff0c;我們可能只關注人物的臉部。在這種情況下&#xff0c;將我們感興趣的區域從整個圖像中切割出…

Linux操作系統01

一、操作系統簡史 二、Linux誕生與分支 三、Linux內核與發行版 內核版本號&#xff1a;cat /proc/version 、 u name -a 操作系統內核漏洞 【超詳細】CentOS編譯安裝升級新內核_centos源碼編譯安裝新版本內核 ntfs-CSDN博客 四、虛擬機 五、Docker容器技術 典型靶場集成環境…

Chrome 下載文件時總是提示“已阻止不安全的下載”的解決方案

解決 Chrome 谷歌瀏覽器下載文件時提示“已阻止不安全的下載”的問題。 ? 前言 最近更新 Chrome 后&#xff0c;下載文件時總是提示“已攔截未經驗證的下載內容”、“已阻止不安全的下載”&#xff1a; ? 身為一個互聯網沖浪高手&#xff0c;這些提醒非常沒有必要&#x…

RocketMQ延遲消息是如何實現的?

RocketMQ的延遲消息實現機制非常巧妙&#xff0c;其核心是通過多級時間輪 定時任務 消息重投遞來實現的。以下是詳細實現原理&#xff1a; ? 一、延遲消息的核心設計 預設延遲級別&#xff08;非任意時間&#xff09; RocketMQ不支持任意時間延遲&#xff0c;而是預設了18個…

D3 面試題100道之(21-40)

這里是D3的面試題,我們從第 21~40題 開始逐條解答。一共100道,陸續發布中。 ?? 面試題(第 21~40 題) 21. D3 中的數據綁定機制是怎樣的? D3 的數據綁定機制通過 selection.data() 方法實現。它將數據數組與 DOM 元素進行一一對應,形成三種狀態: Update Selection:已…

PyTorch nn.Parameter理解及初始化方法總結

一、理解 nn.Parameter 本質是什么&#xff1f; nn.Parameter 是 torch.Tensor 的一個子類。這意味著它繼承了 Tensor 的所有屬性和方法&#xff08;如 .data, .grad, .requires_grad, .shape, .dtype, .device, .backward() 等&#xff09;。它本身不是一個函數或模塊&#xf…

【Linux】環境基礎和開發工具

Linux 軟件包管理器 yum 什么是軟件包 在Linux下安裝軟件, 一個通常的辦法是下載程序的源代碼, 并進行編譯, 得到可執行程序. 但是這樣太麻煩了, 于是有些人把一些常用的軟件提前編譯好, 做成軟件包(可以理解成windows上的安裝程序)放在一個服務器上, 通過包管理器可以很方便…

多模態進化論:GPT-5V圖文推理能力在工業質檢中的顛覆性應用

前言 前些天發現了一個巨牛的人工智能免費學習網站&#xff0c;通俗易懂&#xff0c;風趣幽默&#xff0c;忍不住分享一下給大家。點擊跳轉到網站 &#x1f680;《多模態進化論&#xff1a;GPT-5V圖文推理能力在工業質檢中的顛覆性應用》 副標題&#xff1a;2025年實測報告顯…

Linux實現一主二從模式

主從復制&#xff1a; 復制概念中分為兩類數據庫&#xff0c;一類是主數據庫&#xff08;master&#xff09;&#xff0c;一類是從數據&#xff08;slave&#xff09;&#xff0c;主 數據庫可以進行讀寫操作&#xff0c;并把寫的操作同步給從數據庫&#xff0c;一般從數據庫是只…

大勢智慧亮相第十八屆中國智慧城市大會

6月26日-28日&#xff0c;第十八屆中國智慧城市大會在武漢盛大舉行。本次大會以“數智賦能城市創新協同共治發展藍圖”為主題&#xff0c;匯聚了李德仁、劉經南等八位院士及全國智慧城市領域的專家學者、行業精英&#xff0c;共同探討行業發展新方向。作為實景三維技術領域領軍…

Xbox One 控制器轉換為 macOS HID 設備的工作原理分析

Xbox One 控制器轉換為 macOS HID 設備的工作原理分析 源代碼在 https://github.com/guilhermearaujo/xboxonecontrollerenabler.git 這個工程的核心功能是將 Xbox One 控制器&#xff08;macOS 原生不支持的設備&#xff09;轉換為 macOS 可識別的 HID 設備。這里通過分析代…

Notepad++ 復制宏、編輯宏的方法

Notepad具有宏的功能&#xff0c;能夠記錄當下所有操作&#xff0c;后續只需要一鍵就可以重復執行&#xff0c;大大減少工作量。 比如我需要把很多文件里面的字符完成替換&#xff0c;那我只需要把替換的過程錄制成宏&#xff0c;后續打開文件就可以一鍵替換了。 但是Notepad的…

Oracle:報錯jdbc:oracle:thin:@IP地址:端口:實例名, errorCode 28001, state 99999

報錯原因是oracle密碼過期&#xff0c;根本解決辦法是讓密碼不再過期&#xff0c;永久有效。具體操作記錄一下。 cmd命令行輸入&#xff1a; sqlplus / as sysdba修改Oracle密碼期限為無限&#xff1a; SQL> ALTER PROFILE DEFAULT LIMIT PASSWORD_LIFE_TIME UNLIMITED;SQL&…

Apipost 簽約中原消費金融:共建企業級 API 全鏈路協作平臺,推動接口管理與測試智能化升級

隨著企業數字化轉型的不斷深化&#xff0c;API 正在從技術細節演變為業務協作的核心樞紐。特別是在金融行業&#xff0c;微服務架構、系統聯動、合規要求等多重因素交織下&#xff0c;接口數量激增、管理復雜度提升、質量保障難度加大。近日&#xff0c;Apipost 與中原消費金融…

AntV L7 之LarkMap 地圖

一、安裝$ npm install -S antv/l7 antv/larkmap # or $ yarn add antv/l7 antv/larkmap二、引入包import type { LarkMapProps, LineLayerProps } from antv/larkmap; import { LarkMap, LineLayer, Marker } from antv/larkmap;三、config配置const layerOptions:Omit<Lin…

客戶案例 | 某新能源車企依托Atlassian工具鏈+龍智定制開發服務,打造符合ASPICE標準的研發管理體系

客戶案例 ASPICE標準已成為衡量整車廠及供應商研發能力的重要標尺。某知名車企在其重點項目研發過程中&#xff0c;面臨著ASPICE 4.0評估認證的挑戰——項目團隊缺乏體系經驗、流程規范和數字化支撐工具。 為幫助該客戶團隊順利通過ASPICE認證并提升研發合規性&#xff0c;At…

stm32的USART使用DMA配置成循環模式時發送和接收有著本質區別

stm32的USART使用DMA配置成循環模式時發送和接收有著本質區別&#xff0c;不要被網上誤導了。發送數據時會不停的發送數據&#xff0c;而接收只有有數據時才會接收&#xff0c;沒有數據時就會掛起等待。 一、觸發機制的差異? ?發送方向&#xff08;TX&#xff09;——狀態驅…