【spark-submit】--提交任務

Spark-submit

spark-submit 是 Apache Spark 提供的用于提交 Spark 應用程序到集群的命令行工具。

基本語法

spark-submit [options] <app-jar> [app-arguments]

常用參數說明

應用程序配置

  • --class <class-name>: 指定應用程序的主類(對于 Java/Scala 程序)
  • --name <app-name>: 設置應用程序名稱
  • --jars <jars>: 添加額外的 JAR 文件到 classpath(逗號分隔)
  • --py-files <files>: 為 Python 應用添加額外的文件(.zip, .egg, .py)
  • --files <files>: 將文件上傳到執行器工作目錄(逗號分隔)
  • --conf <key>=<value>: 設置任意 Spark 配置屬性

資源分配

  • --driver-memory <memory>: 設置 Driver 進程內存(如 1g)
  • --executor-memory <memory>: 設置每個 Executor 進程內存(如 1g)
  • --executor-cores <num>: 設置每個 Executor 使用的核心數
  • --num-executors <num>: 設置要啟動的 Executor 數量
  • --total-executor-cores <num>: 設置所有 Executor 使用的總核心數

部署模式

  • --master <master-url>: 指定集群管理器

    • local: 本地模式(單線程)
    • local[K]: 本地模式(K 個線程)
    • local[*]: 本地模式(使用所有核心)
    • spark://host:port: 連接到獨立部署的 Spark 集群
    • mesos://host:port: 連接到 Mesos 集群
    • yarn: 連接到 YARN 集群
    • k8s://https://host:port: 連接到 Kubernetes 集群
  • --deploy-mode <mode>: 部署模式(client 或 cluster)

    • client: Driver 在提交的客戶端運行(默認)
    • cluster: Driver 在集群中運行

其他參數

  • --verbose: 打印調試信息
  • --version: 打印 Spark 版本
  • --help: 顯示幫助信息
  • --supervise: 如果失敗則自動重啟 Driver(僅限獨立集群)
  • --kill <submissionId>: 終止指定應用程序
  • --status <submissionId>: 查詢指定應用程序狀態

使用示例

spark-submit --master yarn \
--deploy-mode client \
--driver-memory xG \
--executor-memory XG \
--class org.xx.xx \
--executor-cores x \
jar包
arg0 arg1

基本示例

# 本地運行(4個線程)
spark-submit --class org.apache.spark.examples.SparkPi \--master local[4] \/path/to/examples.jar \100# YARN 集群模式
spark-submit --class org.apache.spark.examples.SparkPi \--master yarn \--deploy-mode cluster \--executor-memory 2g \--num-executors 10 \/path/to/examples.jar \100

Python 應用示例

spark-submit --master spark://master:7077 \--executor-memory 1g \--py-files dependencies.zip \my_python_app.py \arg1 arg2

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/900893.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/900893.shtml
英文地址,請注明出處:http://en.pswp.cn/news/900893.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

2025.4.10總結

今日記錄&#xff1a;今天提了兩個問題單&#xff0c;最近要關注一下產出了&#xff0c;上半年的考核如今還剩兩個月了&#xff0c;然后發現一同入職的同事&#xff0c;有的人進步得很快&#xff0c;得向優秀得同事看齊了&#xff0c;不然幾年過去&#xff0c;別人連升好幾年&a…

SvelteKit 最新中文文檔教程(18)—— 淺層路由和 Packaging

前言 Svelte&#xff0c;一個語法簡潔、入門容易&#xff0c;面向未來的前端框架。 從 Svelte 誕生之初&#xff0c;就備受開發者的喜愛&#xff0c;根據統計&#xff0c;從 2019 年到 2024 年&#xff0c;連續 6 年一直是開發者最感興趣的前端框架 No.1&#xff1a; Svelte …

Winform入門進階企業級開發示例:http接口數據清洗轉換、斷線續傳、mqtt數據傳輸實例詳解(附代碼資源下載)

場景 C#/Winform入門、進階、強化、擴展、知識體系完善等知識點學習、性能優化、源碼分析專欄分享: C#/Winform入門、進階、強化、擴展、知識體系完善等知識點學習、性能優化、源碼分析專欄分享_winform 強化學習-CSDN博客 如何將以上相關理論知識學以致用。下面針對Winform…

Python代碼縮進統一規范

一、Python縮進的重要性:邏輯與可讀性的橋梁 1. 語法規則的核心 Python與其他編程語言顯著不同之處在于,它使用縮進來表示代碼塊的層次結構。不像C、Java等語言依靠大括號{}來明確函數體、循環體和條件語句的范圍,Python完全依賴縮進來界定這些邏輯單元。例如,在一個if條…

asp.net core 項目發布到 IIS 服務器

目錄 一、VS2022 發布 二、設置IIS服務 三、配置IIS管理器 &#xff08;一&#xff09;打開IIS管理器 &#xff08;二&#xff09;添加站臺 &#xff08;三&#xff09;配置應用程式集區 四、安裝ASP.NET Core Hosting Bundle 五、設定IIS的日志位置 六、測試 一、VS2…

spring mvc中不同服務調用類型(聲明式(Feign)、基于模板(RestTemplate)、基于 SDK、消息隊列、gRPC)對比詳解

RestControllerAdvice 和 ControllerAdvice 對比詳解 1. 基本概念 注解等效組合核心作用ControllerAdviceComponent RequestMapping&#xff08;隱式&#xff09;定義全局控制器增強類&#xff0c;處理跨控制器的異常、數據綁定或全局響應邏輯。RestControllerAdviceControll…

CVE-2025-29927 Next.js 中間件鑒權繞過漏洞

Next.js Next.js 是一個基于 React 的現代 Web 開發框架&#xff0c;用來構建高性能、可擴展的 Web 應用和網站。 CVE-2025-29927 Next.js 中間件鑒權繞過漏洞 CVE-2025-29927是Next.js框架中的一個授權繞過漏洞&#xff0c;允許攻擊者通過特制的HTTP請求繞過在中間件中執行…

WP最主題專業的wordpress主題開發

WP最主題&#xff08;wpzui.com&#xff09; WP最主題是一個提供高品質WordPress主題的平臺。它注重主題的設計和功能&#xff0c;旨在為用戶提供美觀且實用的主題選擇。其主題通常具有良好的用戶體驗、豐富的自定義選項以及優化的性能&#xff0c;能夠滿足不同類型的網站搭建…

玩轉代理 IP :實戰爬蟲案例

在現代互聯網環境下&#xff0c;爬蟲不僅是數據獲取的利器&#xff0c;也成為應對網站反爬機制的技術博弈。而在這場博弈中&#xff0c;"代理 IP" 是核心武器之一。本文將以高匿名的代理ip為核心&#xff0c;結合 Python 實戰、代理策略設計、高匿技巧與反封鎖優化&a…

Vue 3 中 ref 與 reactive 的對比

Vue 3 中 ref 與 reactive 的對比 Vue 3 中 ref 與 reactive 的對比一、定義和基本使用refreactive 二、響應式原理refreactive 三、適用場景refreactive 四、注意事項refreactive Vue 3 中 ref 與 reactive 的對比 在 Vue 3 中&#xff0c;ref 和 reactive 都是用于創建響應式…

《Vue.js組件化開發實戰:從安全縱深到性能躍遷》

開篇&#xff1a;組件化開發的工業革命 當全球500強企業的核心業務系統在12.12大促中經受每秒38萬次請求沖擊時&#xff0c;我們突然意識到&#xff1a;現代前端組件已不再是簡單的UI積木&#xff0c;而是承載業務邏輯、安全防護、性能優化的納米級作戰單元。本文將從軍工級系統…

從0到1的Python接口自動化學習路線

Python 是一門非常適合初學者且功能強大的編程語言,它在接口自動化測試領域具有廣泛應用。 以下是一份針對 Python 與接口自動化測試的詳細學習路線,幫助你從零開始學習并逐步掌握相關知識。 第一階段:Python基礎 目標:掌握 Python 基本語法和編程能力。 一、學習內容 1.…

HDCP(五)

HDCP 2.2 測試用例設計詳解 基于HDCP 2.2 CTS v1.1規范及協議核心機制&#xff0c;以下從正常流程與異常場景兩大方向拆解測試用例設計要點&#xff0c;覆蓋認證、密鑰管理、拓撲驗證等關鍵環節&#xff1a; 1. 正常流程測試 1.1 單設備認證 ? 測試目標&#xff1a;驗證源設…

國標GB28181協議EasyCVR視頻融合平臺:5G時代遠程監控賦能通信基站安全管理

一、背景介紹 隨著移動通信行業的迅速發展&#xff0c;無人值守的通信基站建設規模不斷擴大。這些基站大多建于偏遠地區&#xff0c;周邊人跡罕至、交通不便&#xff0c;給日常的維護帶來了極大挑戰。其中&#xff0c;位于空曠地帶的基站設備&#xff0c;如空調、蓄電池等&…

A2L文件解析

目錄 1 摘要2 A2L文件介紹2.1 A2L文件作用2.2 A2L文件格式詳解2.2.1 A2L文件基本結構2.2.2 關鍵元素與聲明2.2.3 完整A2L文件示例 3 總結 1 摘要 A2L文件&#xff08;也稱為ASAP2文件&#xff09;是ECU開發的核心接口文件&#xff0c;用于標定、測量和診斷的關鍵配置文件&…

光學工程考研調劑推薦

一、調劑院校推薦 1. 華南農業大學 ? 調劑分數參考&#xff1a;光學工程調劑生分數通常在300分左右&#xff0c;過國家線即可嘗試。例如&#xff0c;2023年有297分考生成功調劑至此。 ? 優勢&#xff1a;對分數要求相對寬松&#xff0c;適合分數接近國家線的考生。 2. 安…

SQLite 注入:深入理解與防范策略

SQLite 注入:深入理解與防范策略 引言 SQLite,作為一款輕量級的數據庫,被廣泛應用于嵌入式系統、移動應用以及個人電腦中。盡管SQLite以其簡單易用而受到青睞,但其安全機制若不恰當配置,則可能面臨注入攻擊的風險。本文旨在深入探討SQLite注入的原理、類型及防范策略。 …

汽車與航空航天領域軟件維護:深度剖析與未來展望

一、引言 在當今科技飛速發展的時代&#xff0c;汽車和航空航天領域的軟件應用愈發廣泛和深入&#xff0c;軟件已成為這些行業系統的核心組成部分。從汽車的智能駕駛輔助系統到航空航天飛行器的飛行控制軟件&#xff0c;軟件的可靠性、安全性直接關系到整個系統的正常運行和人…

Jupyter notebook使用技巧

一、打開指定文件夾 在快捷方式目標中&#xff0c;使用如下代碼 anaconda3\python.exe anaconda3\cwp.py anaconda3 anaconda3\python.exe anaconda3\Scripts\jupyter-notebook-script.py --notebook-dirD:\code\python

車輛視頻檢測器linux版對于密碼中包含敏感字符的處理方法

由于密碼中含有敏感字符&#xff0c;導致前端頁面異常&#xff0c;圖標變灰&#xff0c;坐標拾取打不開圖像等&#xff0c;主要原因是&#xff1a;密碼比較前后不一致&#xff0c;左邊是Abc_110&#xff0c;右邊是&#xff1a;Abc_110%2B&#xff0c;對于此問題&#xff0c;特別…