?
🤵?♂? 個人主頁:@艾派森的個人主頁
?🏻作者簡介:Python學習者
🐋 希望大家多多支持,我們一起進步!😄
如果文章對你有幫助的話,
歡迎評論 💬點贊👍🏻 收藏 📂加關注+
目錄
1.項目背景
2.數據集介紹
3.技術工具
4.導入數據
5.數據可視化
源代碼
1.項目背景
隨著全球對氣候變化和環境污染問題的日益關注,電動汽車作為一種清潔能源交通工具,受到了越來越多的關注和青睞。因此,對全電動汽車數據集進行可視化分析的實驗具有重要的研究背景和意義。
-
環境保護意識提升:隨著全球氣候變化問題日益嚴峻,各國政府和國際社會紛紛加強環保政策,提倡低碳出行。電動汽車作為零排放交通工具,具有減少尾氣排放、改善空氣質量的顯著優勢,因此成為了政府和企業推動環保交通發展的重要手段。
-
技術發展和市場競爭:隨著電池技術的不斷進步和成本的逐漸下降,全電動汽車的性能不斷提升,續航里程逐漸增加,充電設施也得到了普及。在這種背景下,全球電動汽車市場呈現出蓬勃發展的態勢,各大汽車制造商和科技公司紛紛投入到電動汽車的研發和生產中,形成了激烈的市場競爭。
-
消費者需求和行為變化:隨著人們生活水平的提高和對環保意識的增強,越來越多的消費者開始關注并選擇購買電動汽車。他們更傾向于選擇環保、智能、高性能的交通工具,因此電動汽車在市場上的需求持續增長。
-
政策支持和激勵措施:各國政府紛紛出臺了一系列政策支持和激勵措施,如補貼、減稅、購車優惠等,以促進電動汽車的推廣和普及。這些政策舉措對于電動汽車市場的快速發展起到了重要的推動作用。
在這樣的背景下,對全電動汽車數據集進行可視化分析,可以幫助我們更深入地了解電動汽車市場的發展趨勢、消費者偏好、技術創新等方面的情況,為政府制定政策、企業制定營銷策略以及消費者做出購車決策提供科學依據和參考。
2.數據集介紹
本數據集來源于Kaggle,原始數據集共有177866條數據,17個變量。該數據集顯示了目前通過華盛頓州許可部 (DOL) 注冊的電池電動汽車 (BEV) 和插電式混合動力電動汽車 (PHEV)。
電池電動汽車 (BEV) 是一種全電動汽車,使用一個或多個電池來存儲電能,為電機提供動力,并通過將車輛插入電源進行充電。插電式混合動力汽車 (PHEV) 是一種使用一個或多個電池為電動機提供動力的車輛;使用另一種燃料,例如汽油或柴油,為內燃機或其他推進源提供動力;并通過將車輛插入電源來充電。
清潔替代燃料汽車 (CAFV) 資格基于 RCW 82.08.809 和 RCW 82.12.809 中概述的燃料要求和純電動續航里程要求,才有資格獲得替代燃料汽車零售和華盛頓州使用稅豁免。這些車輛的銷售或租賃必須在 2019 年 8 月 1 日或之后進行,并滿足購買價格要求,才有資格獲得替代燃料汽車零售和華盛頓州使用稅豁免。
3.技術工具
Python版本:3.9
代碼編輯器:jupyter notebook
4.導入數據
首先導入數據分析用到的第三方庫并加載數據集
查看數據大小
查看數據基本信息
查看數值型變量的描述性統計
查看非數值型變量的描述性統計
統計數據缺失值情況
可以發現,County和Postal Code有5個缺失值,倒數第五列變量有389個缺失值。
刪除缺失值
統計重復值情況
數據集并不存在重復數據
5.數據可視化
可視化1:按電動汽車數量排名的十大電動汽車制造商
可視化顯示,特斯拉是電動汽車市場的領頭羊,其次是日產,雪佛蘭表明特斯拉是最受歡迎的品牌。
可視化2:隨著時間的推移電動汽車的采用
“隨著時間的推移,電動汽車的采用”可視化顯示了電動汽車注冊量的顯著增長,從2010年代初開始增長,并在2020年代進一步加速增長。近年來,電動汽車的采用呈指數級增長,這意味著它正變得越來越受歡迎。
可視化3:電動汽車數量排名前10的縣
可視化顯示,金縣是電動汽車采用的領先地區,其次是斯諾霍米什縣和皮爾斯縣。
可視化4:純電動汽車和插電式混合動力汽車多年流行度的比較
多年來,純電動汽車(bev)和插電式混合動力汽車(phev)之間的比較凸顯了一個明顯的趨勢,即純電動汽車越來越受歡迎,尤其是在2023年。
可視化5:多年來汽車電動續航里程的改善
隨回歸線的散點圖顯示了歷年電動里程的顯著改善,電動里程有明顯的上升趨勢。
可視化6:電動汽車價格歷年分布
可視化顯示了近年來電動汽車中位數價格的增長。2008年到2011年的價格與現在相比非常高。
可視化7:Top10廠商的電動汽車價格分布
箱線圖顯示了前10名電動汽車制造商的基本建議零售價的顯著變化,保時捷非常受歡迎,價格范圍在80000到180000之間。菲斯克的價格第二高。
可視化8:按電動汽車數量排名的十大電力公司
柱狀圖按車輛數量顯示了電力公用事業。普吉特海灣能源公司擁有最多的電動汽車。
可視化圖9:按立法區劃分的電動汽車
可視化顯示了各立法區在電動汽車(EV)采用方面的差異,41區、45區和48區遙遙領先。
源代碼
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')df=pd.read_csv('Electric_Vehicle_Population_Data.csv')
df.head()
df.shape
df.info()
df.describe()
df.describe(include='O')
df.isnull().sum()
df.duplicated().sum()
df.dropna(inplace=True)
可視化1:按電動汽車數量排名的十大電動汽車制造商。
# 按電動汽車數量排名的十大電動汽車制造商
ev_counts_by_make = df['Make'].value_counts().nlargest(10)
sns.set_style("whitegrid")
plt.figure(figsize=(10, 6))
sns.barplot(x=ev_counts_by_make.values, y=ev_counts_by_make.index, palette="viridis")
plt.title('Top 10 Electric Vehicle Makes by Number of Electric Vehicles', fontsize=15)
plt.xlabel('Number of Vehicles', fontsize=12)
plt.ylabel('Make', fontsize=12)
plt.show()
可視化顯示,特斯拉是電動汽車市場的領頭羊,其次是日產,雪佛蘭表明特斯拉是最受歡迎的品牌。
# 可視化2:隨著時間的推移電動汽車的采用
sns.set_style("whitegrid")
ev_adoption_over_time = df['Model Year'].value_counts().sort_index()
plt.figure(figsize=(14, 7))
sns.lineplot(x=ev_adoption_over_time.index, y=ev_adoption_over_time.values, marker='o', color='royalblue')
plt.title('EV Adoption Over Time', fontsize=20)
plt.xlabel('Model Year', fontsize=14)
plt.ylabel('Number of EV Registrations', fontsize=14)
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
“隨著時間的推移,電動汽車的采用”可視化顯示了電動汽車注冊量的顯著增長,從2010年代初開始增長,并在2020年代進一步加速增長。近年來,電動汽車的采用呈指數級增長,這意味著它正變得越來越受歡迎。
# 可視化3:電動汽車數量排名前10的縣
ev_count_distribution = df.groupby('County')['VIN (1-10)'].count().reset_index().sort_values(by='VIN (1-10)', ascending=False)
top_ev_counties = ev_count_distribution.head(10)
plt.figure(figsize=(10, 8))
sns.barplot(x='VIN (1-10)', y='County', data=top_ev_counties, palette='viridis')
plt.title('Top 10 Counties by Electric Vehicle Counts')
plt.xlabel('Number of Electric Vehicles')
plt.ylabel('County')
plt.tight_layout()
plt.show()
可視化顯示,金縣是電動汽車采用的領先地區,其次是斯諾霍米什縣和皮爾斯縣。
# 可視化4:純電動汽車和插電式混合動力汽車多年流行度的比較
# 過濾數據集,只包括bev和PHEV
ev_types_df = df[df['Electric Vehicle Type'].isin(['Battery Electric Vehicle (BEV)', 'Plug-in Hybrid Electric Vehicle (PHEV)'])]
# 將數據按型號、年份和數量分組
yearly_ev_counts = ev_types_df.groupby(['Model Year', 'Electric Vehicle Type']).size().unstack(fill_value=0).reset_index()sns.set_style("whitegrid")
plt.figure(figsize=(14, 8))
yearly_ev_counts.plot(kind='bar', stacked=True, x='Model Year', figsize=(14, 8), width=0.8)
plt.title('Comparison of BEVs and PHEVs Popularity Over Years', fontsize=16)
plt.xlabel('Model Year', fontsize=14)
plt.ylabel('Number of Vehicles', fontsize=14)
plt.xticks(rotation=45)
plt.legend(title='Electric Vehicle Type', fontsize=12)
plt.tight_layout()
plt.show()
多年來,純電動汽車(bev)和插電式混合動力汽車(phev)之間的比較凸顯了一個明顯的趨勢,即純電動汽車越來越受歡迎,尤其是在2023年。
# 可視化5:多年來汽車電動續航里程的改善
plt.figure(figsize=(10, 6))
sns.scatterplot(data=df, x='Model Year', y='Electric Range', alpha=0.6)
plt.title('Improvement in Electric Range of Vehicles Over the Years')
plt.xlabel('Model Year')
plt.ylabel('Electric Range (miles)')
sns.regplot(data=df, x='Model Year', y='Electric Range', scatter=False, color='red')
plt.show()
隨回歸線的散點圖顯示了歷年電動里程的顯著改善,電動里程有明顯的上升趨勢。
# 可視化6:電動汽車價格歷年分布
#過濾掉基本MSRP為零或高的行
filtered_df = df[(df['Base MSRP'] > 0) & (df['Base MSRP'] < 200000)]
sns.set_style("whitegrid")
plt.figure(figsize=(14, 8))
sns.boxplot(data=filtered_df, x='Model Year', y='Base MSRP', palette="viridis")
plt.title('Distribution of Electric Vehicle Prices Over the Years', fontsize=16)
plt.xlabel('Model Year', fontsize=14)
plt.ylabel('Base MSRP ($)', fontsize=14)
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
可視化顯示了近年來電動汽車中位數價格的增長。2008年到2011年的價格與現在相比非常高。
# 可視化7:Top10廠商的電動汽車價格分布
top_makes = filtered_df['Make'].value_counts().nlargest(10).index
filtered_top_makes_df = filtered_df[filtered_df['Make'].isin(top_makes)]
plt.figure(figsize=(16, 10))
sns.boxplot(data=filtered_top_makes_df, x='Make', y='Base MSRP', palette="coolwarm")
plt.title('Distribution of Electric Vehicle Prices by Make (Top 10 Makes)', fontsize=16)
plt.xlabel('Make', fontsize=14)
plt.ylabel('Base MSRP ($)', fontsize=14)
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
箱線圖顯示了前10名電動汽車制造商的基本建議零售價的顯著變化,保時捷非常受歡迎,價格范圍在80000到180000之間。菲斯克的價格第二高。
# 可視化8:按電動汽車數量排名的十大電力公司
utility_counts = df.groupby('Electric Utility')['DOL Vehicle ID'].count().reset_index()
utility_counts_sorted = utility_counts.sort_values(by='DOL Vehicle ID', ascending=False).head(10)
plt.figure(figsize=(10, 6))
sns.barplot(data=utility_counts_sorted, x='DOL Vehicle ID', y='Electric Utility', palette='viridis', order=utility_counts_sorted['Electric Utility'])
plt.title('Top 10 Electric Utilities by Number of Electric Vehicles')
plt.xlabel('Number of Electric Vehicles')
plt.ylabel('Electric Utility')
plt.tight_layout()
plt.show()
柱狀圖按車輛數量顯示了電力公用事業。普吉特海灣能源公司擁有最多的電動汽車。
# 可視化圖9:按立法區劃分的電動汽車
# 按地區分組,按車牌號統計
district_counts = df.groupby('Legislative District')['DOL Vehicle ID'].count().reset_index()
district_counts_sorted = district_counts.sort_values(by='DOL Vehicle ID', ascending=False)
plt.figure(figsize=(14, 8))
sns.barplot(x='Legislative District', y='DOL Vehicle ID', data=district_counts_sorted,palette='coolwarm')
plt.title('Electric Vehicles by Legislative District')
plt.xlabel('Legislative District')
plt.ylabel('Number of Electric Vehicles')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()
可視化顯示了各立法區在電動汽車(EV)采用方面的差異,41區、45區和48區遙遙領先。
資料獲取,更多粉絲福利,關注下方公眾號獲取