數據分析、數據挖掘與數據可視化是一個古老的話題,并非什么新生事物。近些年來,借助于計算機軟硬件的飛速發展,數據分析、挖掘、可視化相關理論和技術在各領域的應用更是有了質的飛躍。飯店選址、公交路線與站牌規劃、物流規劃、春運加班車次安排、原材料選購、商場進貨與貨架位置擺放、查找隱性貧困生、房價預測、股票預測、尋找黑客攻擊向量、犯罪人員社交關系挖掘、網絡布線、潛在客戶挖掘、個人還貸能力預測、異常交易分析、網絡流量預測、成本控制與優化、客戶關系分析、商品推薦、文本分類、筆跡識別與分析、智能交通、智能醫療,這些都要借助于數據分析與挖掘相關的理論和工具才能更好更快地完成,而可視化則一直是用來輔助數據分析、挖掘進而做出正確決策的有力工具與技術。
數據分析、數據挖掘與數據可視化是一門綜合性非常強的學科領域,既要掌握線性代數、統計學、人工智能、機器學習等大量理論知識,又要熟悉編程語言或相關軟件的使用。
在眾多編程語言中,Python應該是最適合做數據分析、數據挖掘和數據可視化的,其簡潔的語法、強大的功能、豐富的擴展庫以及開源免費、易學易用的低門檻特點,使得Python成為多個領域不可替代的語言。
課程主要內容和目標:
1)掌握數據分析、挖掘、可視化時需要了解的Python基礎知識;2)掌握擴展庫numpy數組運算與矩陣運算;3)掌握擴展庫pandas在數據分析與處理相關領域的相關技術;4)掌握擴展庫sklearn機器學習常用模型的實現與應用;5)掌握擴展庫matplotlib在數據可視化與科學計算可視化方面的應用。