實驗
算法
python
線性回歸實驗
【實驗名稱】
Python
線性回歸實驗
【實驗要求】
掌握
Python
線性回歸模型應用過程,根據模型要求進行數據預處理,建模,評價與應用;
【背景描述】
線性回歸是利用數理統計中回歸分析,來確定兩種或兩種以上變量間相互依賴的定量關系的一
種統計分析方法,運用十分廣泛。其表達形式為
y?=?w'x+e
,
e
為誤差服從均值為
0
的正態分布。
【知識準備】
了解線性回歸模型的使用場景,
數據標準。
了解
Python/Spark
數據處理一般方法。
了解
spark
模型調用,訓練以及應用方法
【實驗設備】
Windows
或
Linux
操作系統的計算機。部署
Python
,本實驗提供
centos6.8
環境。
【實驗說明】
采用成績數據集作為算法數據,對模型進行訓練和回歸。
【實驗環境】
Pyrhon3.X
,實驗在命令行
python
中進行,或者把代碼寫在
py
腳本,由于本次為實驗,以學
習模型為主,所以在命令行中逐步執行代碼,以便更加清晰地了解整個建模流程。
【實驗步驟】
第一步:啟動
python
: