大數據Spark(五十八):Spark Pi介紹

文章目錄

Spark Pi介紹


Spark Pi介紹

Spark Pi是Apache Spark官方提供的一個示例程序,該案例使用 Spark 進行分布式計算,通過蒙特卡羅方法估算圓周率(π)的值,其估算π原理如下:

上圖中,正方形邊長為2,圓的半徑為1,那么正方形面積為4,圓的面積為π。現在向正方形內隨機“打點”,即隨機生成(x,y)坐標,范圍不超過正方向范圍,最終記錄在圓內打點的個數與正方形內打點的個數,兩者比例為4/π,當“打點”個數非常大時,可以大約算出π的大小。

Spark Pi源碼如下(Spark源碼examples模塊中org.apache.spark.examples.SparkPi):

object SparkPi {def main(args: Array[String]): Unit = {val spark = SparkSession.builder.appName("Spark Pi").getOrCreate()val slices = if (args.length > 0) args(0).toInt else 2//如果slices為100,那么n為一千萬val n = math.min(100000L * slices, Int.MaxValue).toInt // avoid overflow//隨機生成n-1個點,然后計算落在圓內的點的個數val count = spark.sparkContext.parallelize(1 until n, slices).map { i =>//random返回的是0到1之間的隨機數,x,y的取值范圍是-1到1val x = random * 2 - 1val y = random * 2 - 1if (x*x + y*y <= 1) 1 else 0}.reduce(_ + _)//計算pi-圓的面積/正方形的面積=count/n,即:pi = 4*count/(n-1)println(s"Pi is roughly ${4.0 * count / (n - 1)}")spark.stop()}
}

以上代碼注意如下幾點:

  • SparkSession為SparkSQL中的對象,可以通過SparkSession對象獲取SparkContext對象。
  • slices參數是用戶在運行SparkPi 任務傳入的參數,該參數用于在并行化集合為RDD過程中指定RDD的分區個數,即并行度個數。

  • 📢博客主頁:https://lansonli.blog.csdn.net
  • 📢歡迎點贊 👍 收藏 ?留言 📝 如有錯誤敬請指正!
  • 📢本文由 Lansonli 原創,首發于 CSDN博客🙉
  • 📢停下休息的時候不要忘了別人還在奔跑,希望大家抓緊時間學習,全力奔赴更美好的生活?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/904447.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/904447.shtml
英文地址,請注明出處:http://en.pswp.cn/news/904447.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Doris索引機制全解析,如何用高效索引加速數據分析

在當今大數據時代&#xff0c;企業對于實時數據分析的需求呈現爆發式增長。面對動輒PB級的數據量和秒級響應的業務訴求&#xff0c;傳統數據庫系統往往力不從心。Apache Doris作為新一代MPP分析型數據庫&#xff0c;憑借其獨特的索引機制&#xff0c;在京東、美團等企業的實時數…

基于SpringBoot + Vue 的作業管理系統

產品包含&#xff1a; 項目源碼數據庫文件論文ppt 技術棧 架構: B/S、MVC 系統環境&#xff1a;Windows/Mac 開發環境&#xff1a;IDEA、JDK1.8、Maven、Mysql 技術棧&#xff1a;Java、Mysql、SpringBoot、Mybatis、Vue 功能模塊 用戶模塊&#xff1a;學生用戶、管理員、…

HCL(HashiCorp Configuration Language)是一種結構化配置語言

HCL&#xff08;HashiCorp Configuration Language&#xff09;是一種結構化配置語言&#xff0c;語法簡潔且可讀性強&#xff0c;廣泛用于 Docker Buildx Bake、Terraform、Nomad 等工具的配置。以下是其核心語法規則和示例&#xff1a; 1. 基礎結構 HCL 使用 塊&#xff08;…

《AI大模型應知應會100篇》第50篇:大模型應用的持續集成與部署(CI/CD)實踐

第50篇&#xff1a;大模型應用的持續集成與部署&#xff08;CI/CD&#xff09;實踐 &#x1f9fe; 摘要 在AI大模型開發中&#xff0c;隨著模型版本迭代頻繁、依賴復雜、部署環境多樣&#xff0c;構建一套高效可靠的持續集成與持續交付&#xff08;CI/CD&#xff09;流程顯得尤…

【Linux深入淺出】之全連接隊列及抓包介紹

【Linux深入淺出】之全連接隊列及抓包介紹 理解listen系統調用函數的第二個參數簡單實驗實驗目的實驗設備實驗代碼實驗現象 全連接隊列簡單理解什么是全連接隊列全連接隊列的大小 從Linux內核的角度理解虛擬文件、sock、網絡三方的關系回顧虛擬文件部分的知識struct socket結構…

DB-GPT V0.7.1 版本更新:支持多模態模型、支持 Qwen3 系列,GLM4 系列模型 、支持Oracle數據庫等

V0.7.1版本主要新增、增強了以下核心特性 &#x1f340;DB-GPT支持多模態模型。 &#x1f340;DB-GPT支持 Qwen3 系列&#xff0c;GLM4 系列模型。 &#x1f340; MCP支持 SSE 權限認證和 SSL/TLS 安全通信。 &#x1f340; 支持Oracle數據庫。 &#x1f340; 支持 Infini…

2025五一數學建模競賽A題完整分析論文(共45頁)(含模型、可運行代碼、數據)

2025年五一數學建模競賽A題完整分析論文 摘 要 一、問題分析 二、問題重述 三、模型假設 四、符號定義 五、 模型建立與求解 5.1問題1 5.1.1問題1思路分析 5.1.2問題1模型建立 5.1.3問題1參考代碼 5.1.4問題1求解結果 5.2問題2 5.2.1問題2思路分析 …

[學習]RTKLib詳解:pntpos.c與postpos.c

文章目錄 RTKLib詳解&#xff1a;pntpos.c與postpos.cPart A: pntpos.c一、概述二、整體工作流程三、主要函數說明1. pntpos()2. satposs()3. estpos()4. rescode()5. prange()6. ionocorr()7. tropcorr()8. valsol()9. raim_fde()10. estvel() 四、函數調用關系圖&#xff08;…

【科研繪圖系列】R語言繪制世界地圖(map plot)

禁止商業或二改轉載,僅供自學使用,侵權必究,如需截取部分內容請后臺聯系作者! 文章目錄 介紹加載R包數據下載導入數據數據預處理畫圖輸出圖片系統信息介紹 【科研繪圖系列】R語言繪制世界地圖(map plot) 加載R包 library(ggmap) library(RColorBrewer) library(pals) …

在pycharm profession 2020.3上安裝使用xlwings

之前寫了一篇文章在win7和python3.8上安裝xlwings-CSDN博客 今天安裝了pycharm profession 2020.3&#xff0c;自帶Terminal&#xff0c;所以試一下安裝xlwings。 一、新建一個python項目 二、安裝xlwings 三、輸入安裝命令 pip3.exe install -i https://pypi.tuna.tsinghu…

【PostgreSQL數據分析實戰:從數據清洗到可視化全流程】4.3 數據脫敏與安全(模糊處理/掩碼技術)

&#x1f449; 點擊關注不迷路 &#x1f449; 點擊關注不迷路 &#x1f449; 點擊關注不迷路 文章大綱 PostgreSQL數據脫敏實戰&#xff1a;從模糊處理到動態掩碼的全流程解析4.3 數據脫敏與安全&#xff1a;模糊處理與掩碼技術深度實踐4.3.1 數據脫敏的核心技術體系4.3.1.1 技…

堅鵬:平安保險集團《保險行業發展趨勢與AI應用方法及案例》培訓

堅鵬&#xff1a;平安保險集團《保險行業發展趨勢與AI應用方法及案例》培訓圓滿成功 中國平安保險&#xff08;集團&#xff09;股份有限公司是全球領先的綜合金融生活服務集團&#xff0c;2024年位列《財富》世界500強第16位&#xff0c;連續多年蟬聯全球保險品牌價值榜首。截…

NetSuite 2025.1 學習筆記

目錄 領域、新功能統計表 值得注意功能摘要 最有價值功能詳解 1. 領域、新功能統計表 2. 值得注意功能 3. 最有價值功能 3.1 Customer 360 目前的Customer 360在加入了幾個新的控件后&#xff0c;變得完整了&#xff0c;相比較過去&#xff0c;真正有了實用感。 3.2 CSV Im…

Messenger.Default.Send 所有重載參數說明

Messenger.Default.Send 是 MVVM 框架中實現消息傳遞的核心方法,其重載參數主要用于控制消息的發送范圍和接收條件。以下是其所有重載形式及參數說明: ?1. 基本消息發送? Send<TMessage>(TMessage message) ?參數說明?: TMessage:消息類型(泛型參數),可以是任…

代碼異味(Code Smell)識別與重構指南

1、引言:什么是“代碼異味”? 在軟件開發中,“代碼異味(Code Smell)”是指那些雖然不會導致程序編譯失敗或運行錯誤,但暗示著潛在設計缺陷或可維護性問題的代碼結構。它們是代碼演進過程中的“信號燈”,提示我們某段代碼可能需要優化。 1.1 ? 為什么關注代碼異味? 預…

K8S有狀態服務部署(MySQL、Redis、ES、RabbitMQ、Nacos、ZipKin、Sentinel)

K8S部署MySQL ①、創建配置 ②、創建存儲卷 ③、創建服務 指定配置文件 指定存儲卷 ④、同樣的方式創建mysql-slaver服務&#xff08;配置文件和mysql-master不同&#xff09; ⑤、進行主從同步關聯 進入master服務中 進入從庫的終端 K8S部署Redis…

正則表達式與文本三劍客grep、sed、awk

目錄 一、正則表達式 1.1、字符匹配 1.2、次數匹配 1.3、位置錨定 1.4、分組或其他 二、擴展正則表達式 三、grep 四、awk 4.1、常用命令選項 4.2、工作原理 4.3、基礎用法 4.4、內置變量 4.5、模式 4.6、條件判斷 4.7、awk中的循環語句 4.8、數組 4.9、腳本 …

Matlab/Simulink的一些功能用法筆記(4)

水一篇帖子 01--MATLAB工作區的保護眼睛顏色設置 默認的工作區顏色為白色 在網上可以搜索一些保護眼睛的RGB顏色參數設置 在MATLAB中按如下設置&#xff1a; ①點擊預設 ②點擊顏色&#xff0c;點擊背景色的三角標符號 ③點擊更多顏色&#xff0c;找到RGB選項 ④填寫顏色參數…

Qt國際化實戰--精通Qt Linguist工具鏈

概述 在全球化的今天,軟件產品需要支持多種語言和地區,以滿足來自世界各地用戶的需求。Qt框架提供了一套完整的工具集來幫助開發者實現應用程序的國際化(i18n)和本地化(l10n),其中最核心的就是Qt Linguist工具鏈 關于國際化與本地化 國際化(i18n): 指的是設計和開發…

0基礎 | STM32 | STM32F103C8T6開發板 | 項目開發

注&#xff1a;本專題系列基于該開發板進行&#xff0c;會分享源代碼 F103C8T6核心板鏈接&#xff1a; https://pan.baidu.com/s/1EJOlrTcProNQQhdTT_ayUQ 提取碼&#xff1a;8c1w 圖 STM32F103C8T6開發板 1、黑色制版工藝、漂亮、高品質 2、入門級配置STM32芯片(SEM32F103…