機器學習(12):拉索回歸Lasso

- 拉索回歸可以將一些權重壓縮到零,從而實現特征選擇。這意味著模型最終可能只包含一部分特征。
- 適用于特征數量遠大于樣本數量的情況,或者當特征間存在相關性時,可以從中選擇最相關的特征。
- 拉索回歸產生的模型可能更簡單,因為它會去除一些不重要的特征。

API

sklearn.linear_model.Lasso()

參數:

  1. alpha (float, default=1.0):

    • 控制正則化強度;必須是非負浮點數。較大的 alpha 增加了正則化強度。

  2. fit_intercept (bool, default=True):

    • 是否計算此模型的截距。如果設置為 False,則不會使用截距(即數據應該已經被居中)。

  3. precompute (bool or array-like, default=False):

    • 如果為 True,則使用預計算的 Gram 矩陣來加速計算。如果為數組,則使用提供的 Gram 矩陣。

  4. copy_X (bool, default=True):

    • 如果為 True,則復制數據 X,否則可能對其進行修改。

  5. max_iter (int, default=1000):

    • 最大迭代次數。

  6. tol (float, default=1e-4):

    • 精度閾值。如果更新后的系數向量減去之前的系數向量的無窮范數除以 1 加上更新后的系數向量的無窮范數小于 tol,則認為收斂。

  7. warm_start (bool, default=False):

    • 當設置為 True 時,再次調用 fit 方法會重新使用之前調用 fit 方法的結果作為初始估計值,而不是清零它們。

  8. positive (bool, default=False):

    • 當設置為 True 時,強制系數為非負。

  9. random_state (int, RandomState instance, default=None):

    • 隨機數生成器的狀態。用于隨機初始化坐標下降算法中的隨機選擇。

  10. selection ({'cyclic', 'random'}, default='cyclic'):

    • 如果設置為 'random',則隨機選擇坐標進行更新。如果設置為 'cyclic',則按照循環順序選擇坐標。

屬性:

  1. coef_

    • 系數向量或者矩陣,代表了每個特征的權重。

  2. intercept_

    • 截距項(如果 fit_intercept=True)。

  3. n_iter_

    • 實際使用的迭代次數。

  4. n_features_in_ (int):

    • 訓練樣本中特征的數量。

?

from sklearn.linear_model import Lasso
from sklearn.model_selection import train_test_split
from sklearn.datasets import fetch_california_housing
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_errorx,y = fetch_california_housing(return_X_y=True,data_home = "./src")x_train,x_test,y_train,y_test = train_test_split(x,y,test_size = 0.2,random_state = 42)
scaler = StandardScaler()
x_train = scaler.fit_transform(x_train)
x_train = scaler.fit_transform(x_train)model = Lasso(alpha =0.01,max_iter = 100,fit_intercept=True)
#調節alpha越大出現的零越多,因此拉索回歸自帶降維
model.fit(x_train,y_train)y_hat = model.predict(x_test)
print("loss:",mean_squared_error(y_test,y_hat))
print("w:",model.coef_)
print("b:",model.intercept_)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/pingmian/92182.shtml
繁體地址,請注明出處:http://hk.pswp.cn/pingmian/92182.shtml
英文地址,請注明出處:http://en.pswp.cn/pingmian/92182.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Redis持久化存儲

Redis持久化存儲詳解 一、核心持久化機制 Redis提供兩種主要持久化方式:RDB(快照) 和 AOF(追加文件),以及兩者的混合模式。 RDB(Redis Database)快照持久化 工作原理 RDB通過創建數據…

python學智能算法(三十四)|SVM-KKT條件回顧

【1】引言 前序學習進程中,對軟邊界拉格朗日方程進行了初步構建。 其中約定了兩個拉格朗日乘子要非負,其本質是要滿足KKT條件。 今天就乘此次機會,在回顧一下KKT條件。 【2】定義 當問題無約束的時候,只要讓函數梯度為零&#…

【網絡基礎】計算機網絡發展背景及傳輸數據過程介紹

本文旨在幫助初學者建立起計算機網絡的基礎認知,從網絡的發展背景到網絡協議的分層模型,再到IP與MAC地址的基本概念,全面覆蓋第一階段學習重點。 📌 本節重點 了解計算機網絡的發展背景,掌握局域網(LAN&am…

阿里云-通義靈碼:解鎖云原生智能開發新能力,讓云開發更“靈”~

免責聲明:此篇文章所有內容皆是本人實驗,并非廣告推廣,并非抄襲,如有侵權,請聯系筆者。 每日一句 信念其實就是相信未來, 相信內在, 以及坦然美好的心境。 目錄 每日一句 一. 引言 二.通義…

lesson33:Python協程詳解:從原理到實戰的異步編程指南

目錄 一、協程核心概念:輕量級并發的本質 1.1 什么是協程? 1.2 協程與線程/進程的對比 二、協程工作原理:事件循環與協作式調度 2.1 事件循環(Event Loop):協程的"調度中心" 2.2 協作式調度…

深入理解C++模板進階:非類型參數、特化與分離編譯

前言C模板是泛型編程的核心,它允許我們編寫與類型無關的代碼。在掌握了模板的基礎知識后,我們需要進一步了解模板的高級特性,以便更靈活地使用它們。本文將深入探討三個重要的模板進階主題:非類型模板參數、模板特化以及模板的分離…

使用winsw把SpringBoot項目注冊成window服務

目錄 一、使用winsw注冊 1.1、項目打jar包 1.2、下載winsw 1.3、把 WinSW.NET4.exe 重新命名 1.4、編寫m配置文件用于配置注冊信息 1.5、創建文件夾存放你的文件 1.6、安裝服務 1.7、啟動服務 1.8、卸載服務 1.8、停止服務 一、使用winsw注冊 1.1、項目打jar包 例如項目jar包名…

進階向:Python開發簡易QQ聊天機器人

數字化時代的聊天機器人應用在當今數字化時代,聊天機器人已經成為日常生活和商業活動中不可或缺的一部分。根據市場研究數據顯示,全球聊天機器人市場規模預計將在2026年達到102億美元,年復合增長率達到34.75%。這些智能助手正廣泛應用于以下場…

基于開源鏈動2+1模式AI智能名片S2B2C商城小程序的用戶留存策略研究

摘要:在數字化商業競爭白熱化的當下,用戶留存成為企業可持續發展的核心命題。本文聚焦開源鏈動21模式AI智能名片S2B2C商城小程序這一創新技術組合,通過分析其技術架構、模式創新與生態閉環的協同效應,揭示其在降低用戶決策成本、提…

單詞的劃分(動態規劃)

題目描述有一個很長的由小寫字母組成字符串。為了便于對這個字符串進行分析,需要將它劃分成若干個部分,每個部分稱為一個單詞。出于減少分析量的目的,我們希望劃分出的單詞數越少越好。你就是來完成這一劃分工作的。輸入第一行,一…

C語言學習筆記——文件

目錄1 文件的概念2 程序文件和數據文件3 二進制文件和文本文件4 流4.1 流的概念4.2 標準流5 文件信息區和文件指針6 處理文件的庫函數6.1 fopen6.2 fclose6.3 fgetc6.4 fputc6.5 fgets6.6 fputs6.7 fscanf6.8 fprintf6.9 fread6.10 fwrite6.11 fseek6.12 ftell6.13 rewind6.14 …

C++語法與面向對象特性(2)

一.inline函數1.inline的基本特性被inline修飾的函數被稱為內聯函數。inline函數設計的初衷是為了優化宏的功能,編譯器會在編譯階段對inline函數進行展開。然而需要注意的是,inline對于編譯器而言是一種建議,它通常會展開一些簡短的&#xff…

Linux中grep命令

Linux 中的 grep 用法詳解grep 是 Linux 中強大的文本搜索工具,用于在文件或輸入流中查找匹配指定模式的行。其基本語法為:grep [選項] "模式" [文件]核心功能基礎搜索在文件中查找包含特定字符串的行:grep "error" log.…

【遙感圖像入門】遙感中的“景”是什么意思?

在遙感成像中,“3景城市影像”和“5景城市影像”中的“景”是遙感數據的基本單位,通常指一次成像過程中獲取的獨立遙感影像塊。這一概念的具體含義需結合技術背景和應用場景理解: 一、“景”的技術定義 單次成像的獨立覆蓋區域 遙感平臺(如衛星、飛機)在特定時間和位置對…

Pytorch-07 如何快速把已經有的視覺模型權重扒拉過來為己所用

下載,保存,加載,使用模型權重 在這一節里面我們會過一遍對模型權重的常用操作,比如: 如何下載常用模型的預訓練權重如何下載常用模型的無訓練權重(只下載網絡結構)如何加載模型權重如何保存權…

C語言零基礎第9講:指針基礎

目錄 1.內存和地址 2.指針變量和地址 2.1 取地址操作符(&) 2.2 指針變量 2.3 解引用操作符(*) 2.4 指針變量的大小 3.指針變量類型的意義 3.1 指針的解引用 3.2 指針 - 整數 3.3 void*指針 4.指針運算 4.1 指針…

013 HTTP篇

3.1 HTTP常見面試題 1、HTTP基本概念: 超文本傳輸協議:在計算機世界里專門在「兩點」之間「傳輸」文字、圖片、音頻、視頻等「超文本」數據的「約定和規范」HTTP常見的狀態碼 [[Pasted image 20250705140705.png]]HTTP常見字段 Host 字段:客戶…

每日面試題20:spring和spring boot的區別

我曾經寫過一道面試題,題目是為什么springboot項目可以直接打包給別人運行?其實這涉及到的就是springboot的特點。今天來簡單了解一下springboot和spring的區別, Spring 與 Spring Boot:從“全能框架”到“開箱即用”的進化之路 …

ClickHouse數據遷移

ClickHouse實例是阿里云上的云實例,想同步數據到本地,本地部署有ClickHouse實例,下面為單庫單表 源實例:阿里云cc-gs5xxxxxxx.public.clickhouse.ads.aliyuncs.com:8123 目標實例:本地172.16.22.10:8123 1、目標實例建…

sqli-labs-master/Less-41~Less-50

Less-41這一關還是用堆疊注入,這關數字型不需要閉合了。用堆疊的話,我們就不爆信息了。我們直接用堆疊,往進去寫一條數據?id-1 union select 1,2,3;insert into users (id,username,password) values(666,zk,180)--看一下插進去了沒?id-1 u…