1 賽題
問題C 我國新能源電動汽車的發展趨勢
新能源汽車是指以先進技術原理、新技術、新結構的非常規汽車燃料為動力來源( 非常規汽車燃料指汽油、柴油以外的燃料),將先進技術進行汽車動力控制和驅動相結 合的汽車。新能源汽車主要包括四種類型:混合動力汽車、純電動汽車、燃料電池電動 汽車和其他新能源汽車。新能源電動汽車作為一種新型汽車,由于其低污染、低能耗、 能夠調節峰值用電量的特點,近年來取得了快速的發展。新能源電動汽車,包括電動公交車和少于7座的家庭電動汽車,已經受到了世界各地的消費者和政府的歡迎。
2011年以來,中國政府積極推動新能源電動汽車的發展,制定了一系列優惠政策 。新能源電動汽車產業取得了巨大的發展,逐漸成為“ 中國高鐵 ”之后的另一個中國標志。現在,我們邀請您的團隊來完成以下問題。 ”
問題1:
分析影響中國新能源電動汽車發展的主要因素,建立數學模型,描述這些因素對中國新能源電動汽車發展的影響。
問題2:
收集中國新能源電動汽車的行業發展數據,建立一個數學模型,以描述和預測未來10年中國新能源電動汽車的發展情況。
問題3:
收集數據,建立數學模型,分析新能源電動汽車對全球傳統能源汽車產業的影響。
問題4:
一些國家制定了一系列針對中國抵制新能源電動汽車發展的政策。建立數學模型,分析這些政策對我國新能源電動汽車發展的影響。
問題5:
分析城市新能源電動汽車(包括電動公交車)電氣化對生態環境的影響。假設城市人口為100萬,則提供該模型的計算結果。
問題6:
根據問題5的結論,給公民寫一封公開信,宣傳世界各地對新能源電動汽車的好處和電動汽車行業的貢獻。
2 賽題分析
A題屬于圖像目標檢測與圖像特征提取分類問題,需要用到深度學習算法,題目開放性不高,但需要找到合適的網絡進行訓練,訓練階段會比較麻煩!
B題屬于經典的物理建模與目標優化問題,往往計算量較大,會有一定難度!
C題屬于自由性數據分析題型,需要自己找到數據,做傳統的數據挖掘即可!
本次建模題目難度(由高到低) C=A>B
!!!A君會先出AC題思路!!!
3 更新記錄
C題的開放度非常高,不僅要自己找數據,還需要自己構建模型.。
尋找影響主題的相關因子,找到了因子就是找到了變量!
有了相關因素以后,接下來一步我們需要找到相關數據,然后量化我們上一步找的因素!
第一次更新: C題第一問思路已更新:
第二次更新: C題爬蟲+數據更新:
目前市面上沒有免費的新能源數據集合,數據都相對零散,需要逐個手動收集,A君實現了一個爬蟲爬取相關數據開放給大家
數據來源
爬取的數據來源于以下三部分:
- 1 道路機動車輛生產企業及產品,基本為doc文件形式
- 2 新能源汽車推廣應用推薦車型目錄,基本為html形式
- 3 免征車輛購置稅的新能源汽車車型目錄,基本為pdf文件形式
其中數據主要為第2、3部分。
項目結構說明
vehicles_db/
|-- data/
| |-- origin_data(由 Spider 爬取的原始文件)
| |-- output(解析清洗后的 Excel 數據文件)
| |-- revised_data(對原始文件的備份及修改)
|
|-- DataParser/
| |-- __init__.py
| |-- clean_data.py(清洗數據腳本)
| |-- convert.py(轉換文件格式腳本)
| |-- main.py(數據解析主程序)
| |-- output.py(輸出解析后數據)
| |-- parse_data.py(對不同文件格式的表格數據進行解析)
|
|-- Spider/
| |-- __init__.py
| |-- download.py(下載目標鏈接的響應內容)
| |-- main.py(爬蟲主程序)
| |-- output.py(下載目標文件)
| |-- parse_respa.py(對響應內容進行解析)
| |-- spider.py(異步爬蟲函數)
| |-- urls.py(構造初始 url)
|
|-- __init__.py
|-- main.py
環境及依賴
- Python 3.X
- pandas
- win32com
- pdfplumber
- docx
- bs4
- aiohttp
- asyncio
- json
運行方法
進入 vehicles_db 文件夾,運行 main.py 文件即可。
輸出數據位于 /data/output 文件夾中。
輸出
部分輸出如圖所示:
爬蟲代碼不需要大家重新運行,數據已經爬好上傳,大家直接下載即可!
第三次更新: 分析代碼+完整思路更新
更新分析代碼
分析代碼已上傳,大家直接下載使用即可,不需要抄文檔上的代碼!