一、數據源
本項目使用了兩個csv的數據文件,一個是中國高校(大學)的數據,一個是中國高校專業設置的數據
- 數據基本欄位:
高校(大學)的數據 | 高校專業設置的數據 |
---|---|
學校 | 學校 |
省份 | 專業類別 |
城市 | 專業名稱 |
地址 | 國家特色專業 |
水平層次 | |
辦學類別 | |
辦學類型 | |
985 | |
211 | |
雙一流 |
二、數據分析目標
本項目主要使用了學校、省份、水平層次、辦學類別、985、211、雙一流、專業名稱、國家特色專業等數據,通過pandas相關模塊對數據進行抽取、清洗和分組統計計算,再而用pyecharts數據可視化模塊繪制交互式可視化圖表,分析得出各省大學數量分布、本科,專科占比、各辦學類別占比、985,211,雙一流學校分布、開設數量前二十的專業以及國家特色專業分布等數據結果,旨在結合這些數據分析中國目前高校(大學)辦學狀況、中國開設數量排名前20的熱門專業和國家特色專業主要分布在哪些學校等關于高校辦學的信息,為報志愿的高考生和想了解這方面信息的人提供參考。