數據分析案例-2024 年全電動汽車數據集可視化分析

?

🤵?♂? 個人主頁:@艾派森的個人主頁

?🏻作者簡介:Python學習者
🐋 希望大家多多支持,我們一起進步!😄
如果文章對你有幫助的話,
歡迎評論 💬點贊👍🏻 收藏 📂加關注+


目錄

1.項目背景

2.數據集介紹

3.技術工具

4.導入數據

5.數據可視化

源代碼


1.項目背景

隨著全球對氣候變化和環境污染問題的日益關注,電動汽車作為一種清潔能源交通工具,受到了越來越多的關注和青睞。因此,對全電動汽車數據集進行可視化分析的實驗具有重要的研究背景和意義。

  1. 環境保護意識提升:隨著全球氣候變化問題日益嚴峻,各國政府和國際社會紛紛加強環保政策,提倡低碳出行。電動汽車作為零排放交通工具,具有減少尾氣排放、改善空氣質量的顯著優勢,因此成為了政府和企業推動環保交通發展的重要手段。

  2. 技術發展和市場競爭:隨著電池技術的不斷進步和成本的逐漸下降,全電動汽車的性能不斷提升,續航里程逐漸增加,充電設施也得到了普及。在這種背景下,全球電動汽車市場呈現出蓬勃發展的態勢,各大汽車制造商和科技公司紛紛投入到電動汽車的研發和生產中,形成了激烈的市場競爭。

  3. 消費者需求和行為變化:隨著人們生活水平的提高和對環保意識的增強,越來越多的消費者開始關注并選擇購買電動汽車。他們更傾向于選擇環保、智能、高性能的交通工具,因此電動汽車在市場上的需求持續增長。

  4. 政策支持和激勵措施:各國政府紛紛出臺了一系列政策支持和激勵措施,如補貼、減稅、購車優惠等,以促進電動汽車的推廣和普及。這些政策舉措對于電動汽車市場的快速發展起到了重要的推動作用。

在這樣的背景下,對全電動汽車數據集進行可視化分析,可以幫助我們更深入地了解電動汽車市場的發展趨勢、消費者偏好、技術創新等方面的情況,為政府制定政策、企業制定營銷策略以及消費者做出購車決策提供科學依據和參考。

2.數據集介紹

本數據集來源于Kaggle,原始數據集共有177866條數據,17個變量。該數據集顯示了目前通過華盛頓州許可部 (DOL) 注冊的電池電動汽車 (BEV) 和插電式混合動力電動汽車 (PHEV)。

電池電動汽車 (BEV) 是一種全電動汽車,使用一個或多個電池來存儲電能,為電機提供動力,并通過將車輛插入電源進行充電。插電式混合動力汽車 (PHEV) 是一種使用一個或多個電池為電動機提供動力的車輛;使用另一種燃料,例如汽油或柴油,為內燃機或其他推進源提供動力;并通過將車輛插入電源來充電。

清潔替代燃料汽車 (CAFV) 資格基于 RCW 82.08.809 和 RCW 82.12.809 中概述的燃料要求和純電動續航里程要求,才有資格獲得替代燃料汽車零售和華盛頓州使用稅豁免。這些車輛的銷售或租賃必須在 2019 年 8 月 1 日或之后進行,并滿足購買價格要求,才有資格獲得替代燃料汽車零售和華盛頓州使用稅豁免。

3.技術工具

Python版本:3.9

代碼編輯器:jupyter notebook

4.導入數據

首先導入數據分析用到的第三方庫并加載數據集

查看數據大小

查看數據基本信息

查看數值型變量的描述性統計

查看非數值型變量的描述性統計

統計數據缺失值情況

可以發現,County和Postal Code有5個缺失值,倒數第五列變量有389個缺失值。

刪除缺失值

統計重復值情況

數據集并不存在重復數據

5.數據可視化

可視化1:按電動汽車數量排名的十大電動汽車制造商

可視化顯示,特斯拉是電動汽車市場的領頭羊,其次是日產,雪佛蘭表明特斯拉是最受歡迎的品牌。

可視化2:隨著時間的推移電動汽車的采用

“隨著時間的推移,電動汽車的采用”可視化顯示了電動汽車注冊量的顯著增長,從2010年代初開始增長,并在2020年代進一步加速增長。近年來,電動汽車的采用呈指數級增長,這意味著它正變得越來越受歡迎。

可視化3:電動汽車數量排名前10的縣

可視化顯示,金縣是電動汽車采用的領先地區,其次是斯諾霍米什縣和皮爾斯縣。

可視化4:純電動汽車和插電式混合動力汽車多年流行度的比較

多年來,純電動汽車(bev)和插電式混合動力汽車(phev)之間的比較凸顯了一個明顯的趨勢,即純電動汽車越來越受歡迎,尤其是在2023年。

可視化5:多年來汽車電動續航里程的改善

隨回歸線的散點圖顯示了歷年電動里程的顯著改善,電動里程有明顯的上升趨勢。

可視化6:電動汽車價格歷年分布

可視化顯示了近年來電動汽車中位數價格的增長。2008年到2011年的價格與現在相比非常高。

可視化7:Top10廠商的電動汽車價格分布

箱線圖顯示了前10名電動汽車制造商的基本建議零售價的顯著變化,保時捷非常受歡迎,價格范圍在80000到180000之間。菲斯克的價格第二高。

可視化8:按電動汽車數量排名的十大電力公司

柱狀圖按車輛數量顯示了電力公用事業。普吉特海灣能源公司擁有最多的電動汽車。

可視化圖9:按立法區劃分的電動汽車

可視化顯示了各立法區在電動汽車(EV)采用方面的差異,41區、45區和48區遙遙領先。

源代碼

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')df=pd.read_csv('Electric_Vehicle_Population_Data.csv')
df.head()
df.shape
df.info()
df.describe()
df.describe(include='O')
df.isnull().sum()
df.duplicated().sum()
df.dropna(inplace=True)
可視化1:按電動汽車數量排名的十大電動汽車制造商。
# 按電動汽車數量排名的十大電動汽車制造商
ev_counts_by_make = df['Make'].value_counts().nlargest(10)
sns.set_style("whitegrid")
plt.figure(figsize=(10, 6))
sns.barplot(x=ev_counts_by_make.values, y=ev_counts_by_make.index, palette="viridis")
plt.title('Top 10 Electric Vehicle Makes by Number of Electric Vehicles', fontsize=15)
plt.xlabel('Number of Vehicles', fontsize=12)
plt.ylabel('Make', fontsize=12)
plt.show()
可視化顯示,特斯拉是電動汽車市場的領頭羊,其次是日產,雪佛蘭表明特斯拉是最受歡迎的品牌。
# 可視化2:隨著時間的推移電動汽車的采用
sns.set_style("whitegrid")
ev_adoption_over_time = df['Model Year'].value_counts().sort_index()
plt.figure(figsize=(14, 7))
sns.lineplot(x=ev_adoption_over_time.index, y=ev_adoption_over_time.values, marker='o', color='royalblue')
plt.title('EV Adoption Over Time', fontsize=20)
plt.xlabel('Model Year', fontsize=14)
plt.ylabel('Number of EV Registrations', fontsize=14)
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
“隨著時間的推移,電動汽車的采用”可視化顯示了電動汽車注冊量的顯著增長,從2010年代初開始增長,并在2020年代進一步加速增長。近年來,電動汽車的采用呈指數級增長,這意味著它正變得越來越受歡迎。
# 可視化3:電動汽車數量排名前10的縣
ev_count_distribution = df.groupby('County')['VIN (1-10)'].count().reset_index().sort_values(by='VIN (1-10)', ascending=False)
top_ev_counties = ev_count_distribution.head(10)
plt.figure(figsize=(10, 8))
sns.barplot(x='VIN (1-10)', y='County', data=top_ev_counties, palette='viridis')
plt.title('Top 10 Counties by Electric Vehicle Counts')
plt.xlabel('Number of Electric Vehicles')
plt.ylabel('County')
plt.tight_layout()
plt.show()
可視化顯示,金縣是電動汽車采用的領先地區,其次是斯諾霍米什縣和皮爾斯縣。
# 可視化4:純電動汽車和插電式混合動力汽車多年流行度的比較
# 過濾數據集,只包括bev和PHEV
ev_types_df = df[df['Electric Vehicle Type'].isin(['Battery Electric Vehicle (BEV)', 'Plug-in Hybrid Electric Vehicle (PHEV)'])]
# 將數據按型號、年份和數量分組
yearly_ev_counts = ev_types_df.groupby(['Model Year', 'Electric Vehicle Type']).size().unstack(fill_value=0).reset_index()sns.set_style("whitegrid")
plt.figure(figsize=(14, 8))
yearly_ev_counts.plot(kind='bar', stacked=True, x='Model Year', figsize=(14, 8), width=0.8)
plt.title('Comparison of BEVs and PHEVs Popularity Over Years', fontsize=16)
plt.xlabel('Model Year', fontsize=14)
plt.ylabel('Number of Vehicles', fontsize=14)
plt.xticks(rotation=45)
plt.legend(title='Electric Vehicle Type', fontsize=12)
plt.tight_layout()
plt.show()
多年來,純電動汽車(bev)和插電式混合動力汽車(phev)之間的比較凸顯了一個明顯的趨勢,即純電動汽車越來越受歡迎,尤其是在2023年。
# 可視化5:多年來汽車電動續航里程的改善
plt.figure(figsize=(10, 6))
sns.scatterplot(data=df, x='Model Year', y='Electric Range', alpha=0.6)
plt.title('Improvement in Electric Range of Vehicles Over the Years')
plt.xlabel('Model Year')
plt.ylabel('Electric Range (miles)')
sns.regplot(data=df, x='Model Year', y='Electric Range', scatter=False, color='red')
plt.show()
隨回歸線的散點圖顯示了歷年電動里程的顯著改善,電動里程有明顯的上升趨勢。
# 可視化6:電動汽車價格歷年分布
#過濾掉基本MSRP為零或高的行
filtered_df = df[(df['Base MSRP'] > 0) & (df['Base MSRP'] < 200000)]
sns.set_style("whitegrid")
plt.figure(figsize=(14, 8))
sns.boxplot(data=filtered_df, x='Model Year', y='Base MSRP', palette="viridis")
plt.title('Distribution of Electric Vehicle Prices Over the Years', fontsize=16)
plt.xlabel('Model Year', fontsize=14)
plt.ylabel('Base MSRP ($)', fontsize=14)
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
可視化顯示了近年來電動汽車中位數價格的增長。2008年到2011年的價格與現在相比非常高。
# 可視化7:Top10廠商的電動汽車價格分布
top_makes = filtered_df['Make'].value_counts().nlargest(10).index
filtered_top_makes_df = filtered_df[filtered_df['Make'].isin(top_makes)]
plt.figure(figsize=(16, 10))
sns.boxplot(data=filtered_top_makes_df, x='Make', y='Base MSRP', palette="coolwarm")
plt.title('Distribution of Electric Vehicle Prices by Make (Top 10 Makes)', fontsize=16)
plt.xlabel('Make', fontsize=14)
plt.ylabel('Base MSRP ($)', fontsize=14)
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
箱線圖顯示了前10名電動汽車制造商的基本建議零售價的顯著變化,保時捷非常受歡迎,價格范圍在80000到180000之間。菲斯克的價格第二高。
# 可視化8:按電動汽車數量排名的十大電力公司
utility_counts = df.groupby('Electric Utility')['DOL Vehicle ID'].count().reset_index()
utility_counts_sorted = utility_counts.sort_values(by='DOL Vehicle ID', ascending=False).head(10)
plt.figure(figsize=(10, 6))
sns.barplot(data=utility_counts_sorted, x='DOL Vehicle ID', y='Electric Utility', palette='viridis', order=utility_counts_sorted['Electric Utility'])
plt.title('Top 10 Electric Utilities by Number of Electric Vehicles')
plt.xlabel('Number of Electric Vehicles')
plt.ylabel('Electric Utility')
plt.tight_layout()
plt.show()
柱狀圖按車輛數量顯示了電力公用事業。普吉特海灣能源公司擁有最多的電動汽車。
# 可視化圖9:按立法區劃分的電動汽車
# 按地區分組,按車牌號統計
district_counts = df.groupby('Legislative District')['DOL Vehicle ID'].count().reset_index()
district_counts_sorted = district_counts.sort_values(by='DOL Vehicle ID', ascending=False)
plt.figure(figsize=(14, 8))
sns.barplot(x='Legislative District', y='DOL Vehicle ID', data=district_counts_sorted,palette='coolwarm')
plt.title('Electric Vehicles by Legislative District')
plt.xlabel('Legislative District')
plt.ylabel('Number of Electric Vehicles')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
可視化顯示了各立法區在電動汽車(EV)采用方面的差異,41區、45區和48區遙遙領先。

資料獲取,更多粉絲福利,關注下方公眾號獲取

在這里插入圖片描述

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/43692.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/43692.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/43692.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Navicat BI 教程 | 圖表設計和儀表板

商業智能&#xff08;Business Intelligence&#xff0c;BI&#xff09;是將數據轉化為可操作的洞察力的實踐&#xff0c;使組織能夠簡化生產力和實現更好的整體績效。本博客最近介紹了新的 Navicat BI&#xff0c;這是一個幫助 BI 專業人員通過創建數據可視化&#xff08;如圖…

侯捷C++面向對象高級編程(上)-11-虛函數與多態

1.虛函數 2.virtual 3.繼承&#xff0b;復合關系下的構造和析構 4.委托&#xff0b;繼承

Shell學習——Shell運算符

文章目錄 運算符算術運算符關系運算符布爾運算符邏輯運算符字符串運算符 運算符 算術運算符 #!/bin/bash a10 b20valexpr $a $b echo "a b : $val"valexpr $a - $b echo "a - b : $val"valexpr $a \* $b echo "a * b : $val"valexpr $b / $a…

C語言 | Leetcode C語言題解之第221題最大正方形

題目&#xff1a; 題解&#xff1a; int maximalSquare(char** matrix, int matrixSize, int* matrixColSize){int dp[301][301]{0};int wid0;if(matrixSize0&&matrixColSize[0]0){return 0;}for(int i0;i<matrixSize;i){for(int j0;j<matrixColSize[0];j){if(m…

Docker進入MongoDB

先是命令行開啟docker鏡像&#xff0c;然后進入docker鏡像&#xff0c;這是兩步 進入之后&#xff0c;開頭會變成root&#xff0c;我的理解是進入了另一個linux系統了&#xff0c;直接執行相應的軟件 這里直接use databse就是進入了&#xff0c;據說MongoDB是慢啟動&#xff0c…

MMGPL: 多模態醫學數據分析與圖提示學習| 文獻速遞-基于深度學習的多模態數據分析與生存分析

Title 題目 MMGPL: Multimodal Medical Data Analysis with Graph Prompt Learning MMGPL: 多模態醫學數據分析與圖提示學習 01 文獻速遞介紹 神經學障礙&#xff0c;包括自閉癥譜系障礙&#xff08;ASD&#xff09;&#xff08;Lord等&#xff0c;2018年&#xff09;和阿…

開發個人Go-ChatGPT–6 OpenUI

開發個人Go-ChatGPT–6 OpenUI Open-webui Open WebUI 是一種可擴展、功能豐富且用戶友好的自托管 WebUI&#xff0c;旨在完全離線運行。它支持各種 LLM 運行器&#xff0c;包括 Ollama 和 OpenAI 兼容的 API。 功能 由于總所周知的原由&#xff0c;OpenAI 的接口需要密鑰才…

C#字符串操作:判斷一個字符串是否存在于另一個字符串按特定字符分割后的子字符串中的幾種方法

要判斷一個字符串是否存在于另一個字符串按特定字符分割后的子字符串中&#xff0c;可以使用以下幾種方法&#xff1a; 方法一&#xff1a;使用Split和Array.Exists 你可以使用 Split 方法將字符串分割成子字符串數組&#xff0c;然后使用 Exists方法檢查目標字符串是否在數組…

Elasticsearch詳細介紹

B站對應視頻&#xff1a; Elasticsearch01-01.為什么學習elasticsearch_嗶哩嗶哩_bilibili 大多數日常項目&#xff0c;搜索肯定是訪問頻率最高的頁面之一。目前搜索功能是基于數據庫的模糊搜索來實現的&#xff0c;存在很多問題。 首先&#xff0c;查詢效率較低。 由于數據…

Java面試題:三個線程交替打印ABC如何實現?

目錄 方法一&#xff1a;使用synchronized和wait/notify方法二&#xff1a;使用CompletableFuture實現 方法一&#xff1a;使用synchronized和wait/notify package com.demo;import java.util.concurrent.CompletableFuture;public class PrintABC {// 當前狀態private static…

數據結構 Java DS——鏈表部分經典題目 (1)

前言 筆者計劃在暑假啃完JavaDS,Mysql的內容當然也會繼續更 這次給讀者們分享的是鏈表的幾個比較典型的題目,關于如何手搓一個鏈表,筆者還在籌劃中, 畢竟鏈表的種類也有那么多,但是在下面的題目中,只有單向鏈表 題目一 : 反轉鏈表 206. 反轉鏈表 - 力扣&#xff08;LeetCode…

什么是 VueQuill(前端的富文本編輯器)?

什么是 VueQuill&#xff1f; 1. 簡介 VueQuill 是 Vue.js 的一個富文本編輯器插件&#xff0c;它基于 Quill 編輯器構建&#xff0c;提供了簡潔且功能強大的富文本編輯功能。Quill 是一個現代化的富文本編輯器&#xff0c;提供豐富的文本編輯能力&#xff0c;支持多種格式和…

paddlenlp cpu windows 下測試gpt

paddlenlp 安裝python3.11版本 conda create -n python311 python3.11 激活python conda activate python311 安裝paddlepaddle conda install paddlepaddle3.0.0b0 -c paddle pip install paddlenlp3.0.0b0 -U -i https://pypi.tuna.tsinghua.edu.cn/simple windows下…

RockYou2024 發布史上最大密碼憑證

參與 CTF 的每個人都至少使用過一次臭名昭著的rockyou.txt單詞表&#xff0c;主要是為了執行密碼破解活動。 該文件是一份包含1400 萬個唯一密碼的列表。 源自 2009 年的 RockYou 黑客攻擊&#xff0c;創造了計算機安全歷史。 多年來&#xff0c;“rockyou 系列”不斷發展。…

爬蟲怎么實現抓取的

1.4爬蟲工程師常用的庫通過圖1-3我們了解到&#xff0c;爬蟲程序的完整鏈條包括整理需求、分析目標、發出網絡請求、文本解析、數據入庫和數據出庫。其中與代碼緊密相關的有&#xff1a;發出網絡請求、文本解析、數據入庫和數據出庫&#xff0c;接下來我們將學習不同階段中爬蟲…

C++OCR API減輕人們文字錄入的負擔

曾幾何時&#xff0c;許多大企業會設立文字錄入專員的崗位。相信有不少人第一份實習工作就是錄入資料&#xff0c;文檔、發票、證件等形形色色的文件堆積如山&#xff0c;日積月累的敲擊鍵盤&#xff0c;一張一張的錄入電腦系統。這種工作是枯燥的&#xff0c;可以練就文字錄入…

實驗01 黑盒測試方法(等價類劃分、邊界值分析)

一 實驗目的&#xff1a; 1、理解黑盒測試的定義&#xff1b; 2、掌握等價類劃分法&#xff1b; 3、掌握邊界值分析法。 二 實驗環境 1、Windows操作系統計算機&#xff1b; 三 實驗準備 1、理解黑盒測試的定義&#xff1b; 2、等價類劃分法原則&#xff1b; 3、邊界值分…

Java反射與Fastjson的危險反序列化

什么是Java反射&#xff1f; 在前文中&#xff0c;我們有一行代碼 Computer macBookPro JSON.parseObject(preReceive,Computer.class); 這行代碼是什么意思呢&#xff1f;看起來好像就是我們聲明了一個名為 macBookPro 的 Computer 類&#xff0c;它由 fastjson 的 parseObje…

Java入門-Day7-面對對象基礎-構造器

&#xff08;1&#xff09;特點 創建對象時&#xff0c;對象會去調用構造器 &#xff08;2&#xff09;應用場景 創建對象時&#xff0c;同時完成對對象的成員變量&#xff08;屬性&#xff09;&#xff0c;的初始化 &#xff08;3&#xff09;注意事項 //Sutdent構造器 注…

Java 幼兒園(20240709)多來源列表映射多實現類

1、功能場景 對接多個外部廠商&#xff0c;比如多個銀行的賬單獲取&#xff0c;需要根據銀行信息執行對應的實現類。 2、功能代碼 &#xff08;1&#xff09;YAML配置來源列表 bank-source: bank_001, bank_002, bank_003 &#xff08;2&#xff09;外部來源枚舉 public …