2.2.4

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
import joblib
from xgboost import XGBRegressor

# 加載數據集

file_path = '大學生低碳生活行為的影響因素數據集.xlsx' ?# 替換為實際的數據集文件路徑
data = pd.read_excel(file_path)

# 顯示數據集的前五行

print(data.head())

# 刪除不必要的列并處理分類變量

data_cleaned = data.drop(columns=['序號', '所用時間']) ?# 刪除不必要的列

代碼解釋:

drop,dropna、drop_duplicates的區別

  • drop:用于刪除指定的行或列,不涉及缺失值。

  • dropna:用于刪除包含缺失值的行或列,不涉及指定的行或列。

  • drop_duplicates:用于刪除重復

# 定義自變量因變量

# 定義目標變量和特征
target = '5.您進行過綠色低碳的相關生活方式嗎?' ?# 確保這是目標變量
features = data_cleaned.drop(columns=[target]) #清除因變量

X = __________
y = data_cleaned[__________]

---

X = features
y = data_cleaned[target]

代碼解釋:

x是自變量,y是因變量。目標變量是因變量。

所以,y是target

# 將數據拆分為訓練集和測試集

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 訓練線性回歸模型

model = LinearRegression()
model.fit(X_train, y_train)

代碼解釋:

# 保存訓練好的模型

model_filename = '2.2.4_model.pkl'
joblib.__________(model, model_filename)

---

joblib.dump(model, model_filename)

# 進行預測

y_pred = model.predict(X_test)

results.to_csv(results_filename, index=False, sep='\t') ?# 使用制表符分隔值保存到文本文件

? ? f.write(f'均方誤差: {mean_squared_error(y_test, y_pred)}\n')
? ? f.write(f'決定系數: {r2_score(y_test, y_pred)}\n')

# 分析并糾正錯誤(示例:使用XGBoost)

# 訓練XGBoost模型

xgb_model = __________(
? ? n_estimators=1000, ?# 增加樹的數量
? ? __________=0.05, ?# 降低學習率
? ? max_depth=5, ?# 調整樹的深度
? ? subsample=0.8, ?# 調整樣本采樣比例
? ? colsample_bytree=0.8 ?# 調整特征采樣比例
)

----

xgb_model = XGBRegressor(

learning_rate=0.05, ?# 降低學習率

代碼解釋:降低學習率learning_rate,記

# 將XGBoost測試結果保存到報告文件中

report_filename_xgb = '2.2.4_report_xgb.txt'
with open(report_filename_xgb, 'w') as f:
? ? f.write(f'均方誤差: {mean_squared_error(y_test, y_pred_xg)}\n')
? ? f.write(f'決定系數: {r2_score(y_test, y_pred_xg)}\n')

代碼解釋:

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/80428.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/80428.shtml
英文地址,請注明出處:http://en.pswp.cn/web/80428.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

使用IDEA創建Maven版本的web項目以及lombok的使用

1.新建項目 2.修改pom.xml 3.修改項目結構 4.在main/java下面寫一個Servlet測試一下 然后當前頁面往下滑 -Dfile.encodingUTF-8編寫一句輸出語句,測試是否成功部署配置,并選擇到正確的位置: 回車以后 再回到idea里面,發現控…

【數據結構】1-3 算法的時間復雜度

數據結構知識點合集:數據結構與算法 ? 知識點 ? 時間復雜度的定義 1、算法時間復雜度 事前預估算法時間開銷T(n)與問題規模 n 的關系(T 表示 “time”) 2、語句頻度 算法中語句的執行次數 對于以上算法,語句頻度:…

【Python 算法零基礎 3.遞推】

壓抑與痛苦,那些輾轉反側的夜,終會讓我們更加強大 —— 25.5.16 一、遞推的概念 遞推 —— 遞推最通俗的理解就是數列,遞推和數列的關系就好比 算法 和 數據結構 的關系,數列有點像數據結構中的線性表(可以是順序表,也…

淘寶扭蛋機系統開發前景分析:解鎖電商娛樂化新藍海

在電商行業競爭日益白熱化的當下,如何通過創新玩法提升用戶粘性、激活消費潛力,成為平臺突破增長瓶頸的關鍵。淘寶扭蛋機系統作為“電商娛樂”的跨界融合產物,正憑借其趣味性、隨機性和社交屬性,成為撬動年輕消費市場的潛力工具。…

NHANES指標推薦:UHR

文章題目:Elevated log uric acid-to-high-density lipoprotein cholesterol ratio (UHR) as a predictor of increased female infertility risk: insights from the NHANES 2013-2020 DOI:10.1186/s12944-025-02521-w 中文標題:對數尿酸與高…

【c庫主要功能】

1 stdio.h 功能:處理文件和標準輸入/輸出流的各種函數和類型 包含變量: size_t:無符號整形,sizeof關鍵字的結果FILE:文件流類型,適合存儲文件流信息的對象類型 庫宏: stderr、stdin、stdout&a…

npm 報錯 gyp verb `which` failed Error: not found: python2 解決方案

一、背景 npm 安裝依賴報如下錯: gyp verb check python checking for Python executable "python2" in the PATH gyp verb which failed Error: not found: python2 一眼看過去都覺得是Python環境問題,其實并不是你python環境問題&#xf…

常見的請求頭(Request Header)參數

1. Accept 作用:告知服務器客戶端支持的響應數據格式(如 JSON、XML、HTML)。示例:Accept: application/json(優先接收 JSON 格式數據)。 2. Content-Type 作用:說明請求體的數據格式&#xff08…

計算機網絡:移動通信蜂窩網絡指的是什么?

無線基站的蜂窩網絡(Cellular Network)是現代移動通信系統的核心架構,其核心思想是通過蜂窩狀小區劃分和頻率復用,實現廣域覆蓋、高效頻譜利用和動態資源管理。以下從設計原理、網絡架構、關鍵技術及實際挑戰等方面深入解析蜂窩網絡。 一、蜂窩網絡的設計原理 1. 蜂窩結構…

【AI論文】對抗性后期訓練快速文本到音頻生成

摘要:文本到音頻系統雖然性能不斷提高,但在推理時速度很慢,因此對于許多創意應用來說,它們的延遲是不切實際的。 我們提出了對抗相對對比(ARC)后訓練,這是第一個不基于蒸餾的擴散/流模型的對抗加…

Word文檔圖片和圖表自動添加序號

0 Preface/Foreword Word文檔是辦公常用的文檔,里面經常會插入圖片或者表格,當表格和圖片數量過多時,如果有些圖片需要刪除或者添加,那么大概率需要修改大量圖片的序號或者引用記錄,如果通過手工一個一個修改&#xf…

軟件架構設計--期末復習

質量屬性 參考視頻:【13.5質量屬性-架構評估】 在軟件架構中,質量屬性是衡量系統設計優劣的關鍵指標,通常分為運行時屬性和非運行時屬性。以下是一些常見的質量屬性: 一、軟件架構中的質量屬性 運行時屬性: 性能&am…

多指標組合策略思路

一種基于多種技術指標和日歷因素的綜合交易策略,旨在通過復雜的條件判斷來預測市場的短期走勢,并據此進行買賣操作。 策略概述 該策略的核心思想是通過結合多個技術指標和日歷因素來判斷市場的短期趨勢,并在合適的時機進行買入或賣出操作。 具…

STM32 HAL驅動程序 內部Flash

hal_flash.c #include "hal_flash.h"volatile uint32_t flashWriteOffset SYS_APP_BAK_SAVE_ADDR_BASE; volatile uint32_t flashReadOffset SYS_APP_BAK_SAVE_ADDR_BASE;/* MCU OTA */ /*擦除指定的Flash頁*/ void flash_erase_page(uint8_t flashPage , uint32_…

電子電路:什么是電流離散性特征?

關于電荷的量子化,即電荷的最小單位是電子的電荷量e。在宏觀電路中,由于電子數量極大,電流看起來是連續的。但在微觀層面,比如納米器件或單電子晶體管中,單個電子的移動就會引起可觀測的離散電流。 還要提到散粒噪聲,這是電流離散性的表現之一。當電流非常小時,例如在二…

AI agent與lang chain的學習筆記 (1)

文章目錄 智能體的4大要素一些上手的例子與思考。創建簡單的AI agent.從本地讀取文件,然后讓AI智能體總結。 也可以自己定義一些工具 來完成一些特定的任務。我們可以使用智能體總結一個視頻。用戶可以隨意問關于視頻的問題。 智能體的4大要素 AI 智能體有以下幾個…

react+html2canvas+jspdf將頁面導出pdf

主要使用html2canvasjspdf 1.將前端頁面導出為pdf 2.處理導出后圖表的截斷問題 export default function AIReport() {const handleExport async () > {try {// 需要導出的內容idconst element document.querySelector(#AI-REPORT-CONTAINER);if (!element) {message.err…

FFmpeg:多媒體處理的終極利器

FFmpeg詳細介紹 1. 定義與基本概述 FFmpeg是一套開源的跨平臺多媒體處理工具集,最初由法國程序員Fabrice Bellard于2000年開發,其名稱源自“Fast Forward MPEG”,體現了其高效處理MPEG格式的能力。它不僅是命令行工具,還包含多個庫和開發套件,支持視頻轉碼、剪輯、合并、…

【應用開發十】pwm

1 應用層操作PWM 與LED設備一樣,操作PWD也是通過sysfs方式 1) 所在目錄:/sys/class/pwm,該目錄下的文件為pwmchipX,為PWM控器,I.MX6ULL有八個pwm控制器 1.1 pwm 控制器 PWM控制器里內容(即pw…

LeetCode算 法 實 戰 - - - 雙 指 針 與 移 除 元 素、快 慢 指 針 與 刪 除 有 序 數 組 中 的 重 復 項

LeetCode算 法 實 戰 - - - 雙 指 針 與 移 除 元 素、快 慢 指 針 與 刪 除 有 序 數 組 中 的 重 復 項 第 一 題 - - - 移 除 元 素方 法 一 - - - 雙 重 循 環方 法 二 - - - 雙 指 針方 法 三 - - - 相 向 雙 指 針(面 對 面 移 動) 第 二 題 - - -…