根據相關數據集進行回歸分析
1.
import statsmodels.api as sm
# df.loc[:, ...] 表示選擇所有行。
# df.columns != 'mpg' 創建一個布爾數組,指示哪些列不等于 'mpg'。
# df.loc[:, df.columns != 'mpg'] 選擇 df 中所有行和列名不等于 'mpg' 的所有列。
x =df.loc[:,df.columns!='mpg']#在數據框 x 中添加一列常數值(通常為 1)。
#這一列稱為截距項(intercept),在回歸分析中非常重要。
#這樣做的目的是確保模型在進行線性回歸時,包括一個常數項(截距)。
x=sm.add_constant(x)
y = df['mpg']# 隨機抽取 x 數據框中的 6 行數據。
x.sample(6)
2.
import statsmodels.formula.api as smf#smf.ols 是使用普通最小二乘法(OLS)進行線性回歸分析的函數。
#formula='mpg~hp+C(vs)+C(am)' 定義了回歸模型的公式
#mpg 是因變量(或目標變量),即我們要預測的變量。
#hp 是自變量之一,即預測變量。
#C(vs) 和 C(am) 表示 vs 和 am 是分類變