基于spark的澳洲光伏發電站選址預測

基于spark的澳洲光伏發電站選址預測

項目概況

[👇👇👇👇👇👇👇👇]
點這里,查看所有項目
[👆👆👆👆👆👆👆👆]

數據類型

光伏發電站數據

開發環境

centos7

軟件版本

python3.8.18、hadoop3.2.0、hive3.1.2、spark3.1.2、mysql5.7.38、scala2.12.18、jdk8、sqoop1.4.7

開發語言

python、Scala、Java

開發流程

數據上傳(hdfs)->數據清洗(spark)->數據分析(spark)->機器學習(spark)->數據存儲(mysql)->后端(springboot)->前端(vue)

可視化圖表

在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述

操作步驟

啟動MySQL


# 查看mysql是否啟動 啟動命令: systemctl start mysqld.service
systemctl status mysqld.service
# 進入mysql終端
# MySQL的用戶名:root 密碼:123456
# MySQL的用戶名:root 密碼:123456
# MySQL的用戶名:root 密碼:123456
mysql -uroot -p123456

創建MySQL庫


CREATE DATABASE IF NOT EXISTS recommendation CHARACTER SET utf8mb4 COLLATE utf8mb4_unicode_ci;

啟動Hadoop


# 離開安全模式: hdfs dfsadmin -safemode leave
# 啟動hadoop
bash /export/software/hadoop-3.2.0/sbin/start-hadoop.sh

準備目錄


mkdir -p /data/jobs/project/
cd /data/jobs/project/# 解壓 "16個地點完整光伏數據.zip"
# 上傳 "16個地點完整光伏數據" 目錄下 "所有" csv文件 到 "/data/jobs/project/" 目錄# 5-Site_1.csv
# 6-Site_3-C.csv
# 8-Site_5.csv
# 10-Site_2.csv
# 11-Site_4.csv
# 52-Site_33-REC.csv
# 56-Site_30-Q-CELLS.csv
# 78-Site_2-eco-Kinetics.csv
# 79-Site_7-First-Solar.csv
# 87-Site_1B-Trina.csv
# 89-Site_5-Kyocera.csv
# 91-Site_1A-Trina.csv
# 93-Site_8-Kaneka.csv
# 212-Site_25-Hanwha-Solar.csv
# 213-Site_24-Q-CELLS.csv
# 218-Site_9A-Solibro.csv

上傳文件到hdfs


cd /data/jobs/project/hdfs dfs -mkdir -p /data/input/
hdfs dfs -rm -r /data/input/*
hdfs dfs -put 5-Site_1.csv /data/input/
hdfs dfs -put 6-Site_3-C.csv /data/input/
hdfs dfs -put 8-Site_5.csv /data/input/
hdfs dfs -put 10-Site_2.csv /data/input/
hdfs dfs -put 11-Site_4.csv /data/input/
hdfs dfs -put 52-Site_33-REC.csv /data/input/
hdfs dfs -put 56-Site_30-Q-CELLS.csv /data/input/
hdfs dfs -put 78-Site_2-eco-Kinetics.csv /data/input/
hdfs dfs -put 79-Site_7-First-Solar.csv /data/input/
hdfs dfs -put 87-Site_1B-Trina.csv /data/input/
hdfs dfs -put 89-Site_5-Kyocera.csv /data/input/
hdfs dfs -put 91-Site_1A-Trina.csv /data/input/
hdfs dfs -put 93-Site_8-Kaneka.csv /data/input/
hdfs dfs -put 212-Site_25-Hanwha-Solar.csv /data/input/
hdfs dfs -put 213-Site_24-Q-CELLS.csv /data/input/
hdfs dfs -put 218-Site_9A-Solibro.csv /data/input/
hdfs dfs -ls /data/input/

程序打包


cd /data/jobs/project/# 對 "project-spark-station-prediction" 目錄下的項目 "project-spark-station-prediction" 進行打包
# 打包命令: mvn clean package -Dmaven.test.skip=true# 上傳 "project-spark-station-prediction/target/" 目錄下的 "project-spark-station-prediction-jar-with-dependencies.jar" 文件 到 "/data/jobs/project/" 目錄

spark數據清洗


cd /data/jobs/project/# 上傳 "腳本" 目錄下的 "data_clean.sh" 文件/ 到 "/data/jobs/project/" 目錄sed -i 's/\r//g' data_clean.sh
bash data_clean.sh

spark數據分析


cd /data/jobs/project/# 計算不同地區有效功率大于指定值的數量
# 計算各地區的分位數
spark-submit \
--master local[*] \
--driver-memory 512m \
--executor-memory 512m \
--num-executors 4 \
--executor-cores 1 \
--class org.example.StationAnalysisApp \
/data/jobs/project/project-spark-station-prediction-jar-with-dependencies.jar

機器學習


cd /data/jobs/project/spark-submit \
--master local[*] \
--driver-memory 512m \
--executor-memory 512m \
--num-executors 4 \
--executor-cores 1 \
--class org.example.StationPredictModelApp \
/data/jobs/project/project-spark-station-prediction-jar-with-dependencies.jar# 同樣的特征,在不同位置,預測的結果對比,可以體現出哪個地區位置更加優越
spark-submit \
--master local[*] \
--driver-memory 512m \
--executor-memory 512m \
--num-executors 4 \
--executor-cores 1 \
--class org.example.StationPredictOneApp \
/data/jobs/project/project-spark-station-prediction-jar-with-dependencies.jar

啟動后端


# 已安裝 "jdk8" 和 "maven" 環境# 啟動springboot
# 打包命令: mvn clean package -Dmaven.test.skip=true
# 入口類: org.apophis.Application

啟動前端

使用hdfs dfs -rm -r /user/example/test刪除目錄后,立刻上傳,不一定能成功,因為文件流未完全關閉,需要等一會兒


# 已安裝 "node" 環境# 啟動前端
npm install --registry=https://registry.npmmirror.com
npm run dev

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/922383.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/922383.shtml
英文地址,請注明出處:http://en.pswp.cn/news/922383.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Kibana 雙棧網絡(Dual-Stack)支持能力評估

#作者:Unstopabler 文章目錄一.測試目標二.測試環境三.Kibana1、查詢 Kibana pod信息2、查詢Kibana service信息3、Kibana service 設置四.驗證測試1、Kibana 監聽參數設置2、Kibana節點IPv4狀態檢查3、Kibana節點IPv6…

標準CAN幀介紹

標準CAN幀介紹標準CAN(Controller Area Network)結構1.幀起始(SOF-Start Of Frame)2.仲裁段(Arbitration Field)3.控制段(Control Field)4.數據段(Data Field&#xff09…

easyPoi實現動表頭Excel的導入和導出

easyPoi實現動表頭Excel的導入和導出 Maven依賴 !-- EasyPoi 核心依賴 --><dependency><groupId>cn.afterturn</groupId><artifactId>easypoi-base</artifactId><version>4.4.0</version></dependency><!-- EasyPoi Web…

瘋狂星期四文案網第67天運營日記

網站運營第67天&#xff0c;點擊觀站&#xff1a; 瘋狂星期四 crazy-thursday.com 全網最全的瘋狂星期四文案網站 運營報告 今日訪問量 今日搜索引擎收錄情況

CAS理解

CAS&#xff08;Compare And Swap&#xff09; 是非阻塞同步的實現原理&#xff0c;它是CPU硬件層面的一種指令&#xff1b; CAS制定操作包含三個參數 內存值&#xff08;內存地址&#xff09;v預期值E新增值N 當CAS指令執行時&#xff0c;當且僅當預期值E和內存值V相同時&…

【SQL】指定日期的產品價格

目錄 題目 分析 代碼 題目 產品數據表: Products ------------------------ | Column Name | Type | ------------------------ | product_id | int | | new_price | int | | change_date | date | ------------------------ (product_id, chang…

《突破Unity+騰訊云聯機瓶頸:多人游戲同步延遲與數據安全的雙維度優化》

在Unity開發的多人聯機游戲中&#xff0c;騰訊云的云服務器&#xff08;CVM&#xff09;、游戲多媒體引擎&#xff08;GME&#xff09;與云數據庫&#xff08;CDB&#xff09;共同構成了聯機體驗的核心支撐。但隨著玩家并發量提升與游戲玩法復雜度增加&#xff0c;“實時同步延…

BisenetV1/2網絡以及模型推理轉換

BisenetV1/2網絡以及模型推理轉換 文章目錄BisenetV1/2網絡以及模型推理轉換1 BiSenetV11.1 Contex Path1.2 Spatial Path1.3 ARM1.4 FFM1.5 backbone2 模型推理代碼流程分析2.1 加載模型2.2 模型推理① 轉換張量② 輸入尺寸調整③ 模型推理④ 輸出尺寸還原⑤ 類別預測⑥ 保存繪…

Android開發-文本輸入

一、EditText 基礎&#xff1a;不僅僅是輸入框EditText 是 TextView 的子類&#xff0c;允許用戶輸入和編輯文本。1. 基本布局<EditTextandroid:id"id/et_username"android:layout_width"match_parent"android:layout_height"wrap_content"an…

數據化存儲菜單,國際化方案

djangoclass Menu(models.Model):parent_id models.BigIntegerField(default0, verbose_name父菜單ID)name models.CharField(max_length50, verbose_name菜單名稱)icon models.CharField(max_length50, blankTrue, nullTrue, verbose_name菜單圖標)path models.CharField(…

SQL-用戶管理與操作權限

在 SQL 中&#xff0c;用戶管理和權限操作是數據庫安全管理的核心組成部分&#xff0c;用于控制 “誰能訪問數據庫” 以及 “能對數據庫做什么”。它們共同保障數據庫的安全性、完整性和合規性。一、用戶管理&#xff1a;控制 “誰能訪問數據庫”用戶管理是指對數據庫用戶的創建…

計算機視覺案例分享之答題卡識別

目錄 一、基本流程 二、代碼實現 1. 導入工具包和定義常量 2. 輔助函數定義 2.1 坐標點排序函數 2.2 透視變換函數 2.3 輪廓排序函數 2.4 圖像顯示函數 3. 主程序處理流程 3.1 圖像預處理 3.2 輪廓檢測與透視變換 3.3 閾值處理與選項檢測 3.4 答案識別與評分 我們…

Java面試問題記錄(四)

四、設計模式1、設計模式6大原則1&#xff09;單一職責(一個類和方法只做一件事)、2&#xff09;里氏替換(多態&#xff0c;子類可擴展父類)、3&#xff09;依賴倒置(細節依賴抽象&#xff0c;下層依賴上層)、4&#xff09;接口隔離(建立單一接口)、迪米特原則(最少知道&#x…

高等教育學

高等教育學第一章 高等教育與高等教育學第二章 高等教育發展史2-1西方高等教育發展史2-2中國高等教育發展史第三章 高等教育理念3.1-王一軍-高等教育理念的構成要素3.2-王一軍-高等教育理念的主要流派第四章 高等學校教育4.1 高等學校教育制度4.2-陳何芳-高等教育辦學體制 &…

unordered_map使用MFC的CString作為鍵值遇到C2056和C2064錯誤

文章目錄unordered_map使用MFC的CString作為鍵值遇到C2056和C2064錯誤問題出現的背景解決方案總結unordered_map使用MFC的CString作為鍵值遇到C2056和C2064錯誤 問題出現的背景 在我的一個老工程項目中&#xff0c;使用C的std::unordered_map時&#xff0c;使用了MFC的CStrin…

Maven 本地倉庫的 settings.xml 文件

本地倉庫目錄位置&#xff1a;C:/用戶/用戶名/.m2/repository 需要修改配置&#xff0c;具體的修改方法請看 ↓↓↓ 2024版 IDEA 用 Maven 創建 java 項目&#xff08;Maven 安裝和配置&#xff09; <?xml version"1.0" encoding"UTF-8"?><!…

vue動畫內置組件

文章目錄vue動畫的官方類名EnterLeaveTransition組件注意事項觸發實例TransitionGroup組件注意事項觸發機制實例拓展vue動畫的官方類名 如下來自vue官方文檔&#xff0c;提供了dom元素&#xff0c;插入Enter和刪除Leave的類名 Enter v-enter-from&#xff1a;進入動畫的起始…

軟考中級信息安全與病毒防護知識點

### 一、核心知識點梳理這部分內容可以大致分為三個方面&#xff1a;**信息安全基本概念**、**加解密技術** 和 **惡意代碼&#xff08;病毒&#xff09;防護**。#### 1. 信息安全的基本目標&#xff08;CIA三元組&#xff09; 這是所有信息安全問題的基石&#xff0c;必須熟練…

數組存儲 · 行主序與列主序 | 應用 / 基地址 / 選擇策略

注&#xff1a;本文為 “數組存儲 行主序與列主序” 相關合輯。 英文引文&#xff0c;機翻未校。 中文引文&#xff0c;略作重排。 未整理去重&#xff0c;如有內容異常&#xff0c;請看原文。 Row major and Column Major Address calculations 按行主序和按列主序的地址計算…

在 CentOS 中安裝 VirtualBox 增強功能的步驟

很好&#xff0c;你看到 /run/media/asfor/VBox_GAs_7.2.2&#xff0c;這說明你已經在 VirtualBox 中掛載了“增強功能&#xff08;Guest Additions&#xff09;”光盤&#xff0c;接下來只要手動安裝就可以啟用共享剪貼板、全屏分辨率、鼠標無縫移動等功能。&#x1f4dd; 在 …