【機器學習筆記Ⅰ】2 線性回歸模型

【機器學習筆記Ⅰ】2 線性回歸模型

news/2025/7/7 7:16:47/文章來源:https://blog.csdn.net/weixin_44077623/article/details/149157400

線性回歸（Linear Regression）是機器學習中最基礎、最常用的監督學習模型之一，用于解決回歸問題（預測連續數值輸出）。它的核心思想是通過擬合一條直線（或超平面）來描述輸入特征（自變量）與目標變量（因變量）之間的線性關系。

核心概念

模型形式
- 簡單線性回歸（單特征）：
  [
  y = w_1 x + b
  ]
  - ( y )：預測值（目標變量）。
  - ( x )：輸入特征。
  - ( w_1 )：權重（斜率），表示特征的重要性。
  - ( b )：偏置（截距），表示基線值。
- 多元線性回歸（多特征）：
  [
  y = w_1 x_1 + w_2 x_2 + \dots + w_n x_n + b
  ]
  - ( x_1, x_2, \dots, x_n )：多個特征。
  - ( w_1, w_2, \dots, w_n )：每個特征的權重。
目標
找到最優的權重 ( w ) 和偏置 ( b )，使得預測值 ( y ) 與真實值 ( y_{\text{true}} ) 的誤差最小。

如何訓練？

損失函數（Loss Function）
衡量預測值與真實值的差距，常用均方誤差（MSE）：
[
\text{MSE} = \frac{1}{N} \sum_{i=1}^{N} (y_{\text{true}}^{(i)} - y^{(i)})2
]
- ( N )：樣本數量。
- 目標是最小化MSE。
優化方法
- 最小二乘法：通過數學推導直接求解最優解（適用于小規模數據）。
- 梯度下降（Gradient Descent）：迭代調整參數，逐步降低損失（適用于大規模數據）。

代碼示例（Python）

from sklearn.linear_model import LinearRegression
import numpy as np# 示例數據：X是特征，y是目標值
X = np.array([[1], [2], [3], [4]])  # 單特征
y = np.array([2, 4, 6, 8])          # y = 2x# 創建模型并訓練
model = LinearRegression()
model.fit(X, y)# 預測
print(model.predict([[5]]))  # 輸出: [10.] （符合 y=2x）
print("權重 w:", model.coef_)   # 輸出: [2.]
print("截距 b:", model.intercept_)  # 輸出: 0.0

特點

優點：
- 簡單、易解釋（權重直接表示特征影響）。
- 計算效率高，適合小規模數據。
缺點：
- 假設數據是線性的，對復雜關系擬合不足。
- 對異常值和噪聲敏感。

應用場景

房價預測（特征：面積、地段 → 目標：房價）。
銷售額預測（特征：廣告投入、季節 → 目標：銷量）。
任何需要量化特征與目標之間線性關系的場景。

注意事項

數據預處理：
- 特征需歸一化（尤其梯度下降時）。
- 處理多重共線性（特征間高度相關）。
模型評估：
- 使用R2分數、MSE等指標衡量性能。
非線性擴展：
- 可通過多項式回歸（如 ( y = w_1 x + w_2 x^2 )）擬合非線性關系。

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/news/913288.shtml
繁體地址，請注明出處：http://hk.pswp.cn/news/913288.shtml
英文地址，請注明出處：http://en.pswp.cn/news/913288.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！

相關文章

2025.7.6總結

2025.7.6總結

第天，Morning power 1.四四呼吸，做了10分鐘。 2.感恩環節:有兩周沒去新勵成上課了，感謝今天早上去上了當眾講話，遇到了不少老朋友，聊的還蠻開心滴，滿足了我的社交需求。其次，在臺上做了個小面試…

閱讀更多...

RabbitMQ 高級特性之死信隊列

RabbitMQ 高級特性之死信隊列

1. 簡介在前面的高級特性中，我們介紹了重試機制和 TTL，那么產生下列問題： 在重試機制中，當消費者消費消息發生異常時，會觸發消息重發機制，由于我們配置了最大的重發次數，那么當超過這個次數后…

閱讀更多...

如何選擇合適的工業相機快門種類

如何選擇合適的工業相機快門種類

在工業相機領域，常見的三種快門類型：全局快門（Global Shutter）、卷簾快門（Rolling Shutter）以及全局復位式卷簾快門（Global - reset rolling Shutter）。我們主要來講講全局快門&…

閱讀更多...

uloop源碼剖析

uloop源碼剖析

uloop是libubox庫的核心模塊，libubox是OpenWrt基礎庫之一，用來提供事件驅動、基礎數據結構等。 uloop支持文件描述符監控、超時定時器、子進程管理、信號處理事件、間隔定時器等五大核心功能。主體框架 uloop循環的主體框架有三個函數構成&#xff0c…

閱讀更多...

Mac電腦虛擬機 VMware Fusion13

Mac電腦虛擬機 VMware Fusion13

VMware Fusion mac 不僅能讓你在Mac蘋果電腦上運行Windows或Linux系統、使用非Mac平臺的應用，而且還可以支持各種USB硬件設備。原文地址：VMware Fusion 13 Mac虛擬機

閱讀更多...

嵌套容器是隱射宿主機的路徑而不是容器的路徑

嵌套容器是隱射宿主機的路徑而不是容器的路徑

嵌套容器是隱射宿主機的路徑而不是容器的路徑為什么？容器中的 Docker 運行流程為什么？ 這個問題涉及 Docker 的工作原理，特別是嵌套容器的行為。讓我們逐步分析為什么在容器內部啟動其他容器時，文件系統的掛載行為是基于宿主機…

閱讀更多...

Go語言--語法基礎6--基本數據類型--切片類型

Go語言--語法基礎6--基本數據類型--切片類型

Go 語言切片是對數組的抽象。Go 數組的長度不可改變，在特定場景中這樣的集合就不太適用，Go 中提供了一種靈活、功能強悍的內置類型切片 ("動態數組")，與數組相比切片的長度是不固定的，可以追加元素，在追加時…

閱讀更多...

?御控物聯網綜合應用實訓平臺-物聯網系統和實驗室實訓系統?

?御控物聯網綜合應用實訓平臺-物聯網系統和實驗室實訓系統?

在科技飛速發展的今天，物聯網技術已滲透到各個領域，成為推動產業升級和創新發展的重要力量。對于職業教育和科研機構而言，搭建一套完善的物聯網綜合應用實訓系統，培養適應時代需求的物聯網專業人才，顯得尤為迫切。而御…

閱讀更多...

ElasticSearch中的分片是什么?

ElasticSearch中的分片是什么?

大家好，我是鋒哥。今天分享關于【ElasticSearch中的分片是什么?】面試題。希望對大家有幫助； ElasticSearch中的分片是什么? 超硬核AI學習資料，現在永久免費了！ 在 Elasticsearch 中，分片（Shard&#x…

閱讀更多...

基于PHP+MySQL組合開發開源問答網站平臺源碼系統源碼開源可二次開發含完整的搭建指南

基于PHP+MySQL組合開發開源問答網站平臺源碼系統源碼開源可二次開發含完整的搭建指南

問答網站成為人們獲取知識、交流經驗的重要平臺。無論是專業領域的疑難解答，還是生活常識的分享探討，問答網站都發揮著巨大的作用。對于想要搭建問答網站的個人或企業來說，一款優秀的開源問答網站平臺源碼系統至關重要。今天，我們…

閱讀更多...

Python工程師面試題集

Python工程師面試題集

文章目錄一、Python基礎二、關鍵Python庫三、Web開發四、并發與性能五、系統設計答案區一、Python基礎Python的可變與不可變數據類型有哪些？底層實現原理？Python2與Python3的主要區別解釋GIL全局解釋器鎖及其對多線程的影響裝飾器Decorator的作用與實現原…

閱讀更多...

什么是碼率？剪映中如何選擇適合的視頻碼率

什么是碼率？剪映中如何選擇適合的視頻碼率

在視頻編輯過程中，碼率（Bitrate）是一個決定視頻畫質的關鍵參數。對于普通用戶來說，剪映作為一款功能強大的視頻編輯工具，其默認的碼率設置直接影響最終導出視頻的質量和文件大小。那么，剪映的默認碼率是多少…

閱讀更多...

專題：2025電商營銷與AI應用發展趨勢報告|附260+份報告PDF、原數據表匯總下載

專題：2025電商營銷與AI應用發展趨勢報告|附260+份報告PDF、原數據表匯總下載

原文鏈接：https://tecdat.cn/?p42834 電商行業在數字經濟浪潮中持續演進，2025年呈現出多平臺發力、技術驅動增長、消費需求多元等特點。快手和抖音作為國內直播電商的重要陣地，各品類銷售表現各有亮點，同時全球電商市場規模穩步…

閱讀更多...

windows安裝stable diffusion

windows安裝stable diffusion

安裝git https://git-scm.com/downloads/winclone項目創建一個文件夾，clone下來stable diffusion webui git網址：https://github.com/AUTOMATIC1111/stable-diffusion-webui git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git安裝…

閱讀更多...

Python爬蟲 XPath 三方庫lxml

Python爬蟲 XPath 三方庫lxml

前言 XPath是Python爬蟲最重要的過濾原始數據的手段之一,是爬蟲最核心的技術是專業抓取HTML頁面而生的,基本上只用于抓取HTML頁面使用目錄安裝支持XPath三方庫lxml XPath代碼入門示例 XPath表達式語法在源代碼上面直接獲取XPath 安裝支持XPath三方庫lxml pip instal…

閱讀更多...

深度學習洪水推演：Python融合多源衛星數據可視化南方暴雨災情

深度學習洪水推演：Python融合多源衛星數據可視化南方暴雨災情

目錄1. 引言：多源衛星融合分析的突破性價值2. 多模態融合架構設計3. 雙流程對比分析3.1 單源 vs 多源融合分析3.2 洪水推演核心流程4. 核心代碼實現4.1 多源數據融合處理（Python）4.2 時空洪水推演模型（PyTorch）4.3 三維…

閱讀更多...

「日拱一碼」016 深度學習常用庫——PyTorch

「日拱一碼」016 深度學習常用庫——PyTorch

目錄張量操作創建張量： torch.tensor() ：直接從數據創建張量 torch.zeros() ：創建全零張量 torch.ones() ：創建全一張量 torch.randn() ：創建正態分布隨機張量 torch.arange() ：創建等差序列張量 …

閱讀更多...

【Qt】QStringLiteral 介紹

【Qt】QStringLiteral 介紹

QStringLiteral 介紹 QStringLiteral 是 Qt 框架中提供的一個宏，用于在編譯時從字符串字面量創建 QString 對象，具有高效和零內存分配的特點。主要特點編譯時轉換：將字符串字面量在編譯時轉換為 QString 數據，而不是運行時。…

閱讀更多...

UI前端與數字孿生結合實踐探索：智慧物流的貨物追蹤與配送優化

UI前端與數字孿生結合實踐探索：智慧物流的貨物追蹤與配送優化

hello寶子們...我們是艾斯視覺擅長ui設計、前端開發、數字孿生、大數據、三維建模、三維動畫10年經驗!希望我的分享能幫助到您!如需幫助可以評論關注私信我們一起探討!致敬感謝感恩!一、引言：數字孿生重構智慧物流的技術范式在物流行業數字化轉型的浪潮中&#xff0…

閱讀更多...

Java創建型模式---工廠模式

Java創建型模式---工廠模式

工廠模式基礎概念工廠模式是一種創建型設計模式，其核心思想是將對象的創建和使用分離。通過使用工廠模式，可以將對象創建邏輯集中管理，提高代碼的可維護性和可擴展性。在 Java 中，工廠模式主要分為三種類型： 簡單工…

閱讀更多...

最新文章