【機器學習筆記Ⅰ】2 線性回歸模型

線性回歸(Linear Regression)是機器學習中最基礎、最常用的監督學習模型之一,用于解決回歸問題(預測連續數值輸出)。它的核心思想是通過擬合一條直線(或超平面)來描述輸入特征(自變量)與目標變量(因變量)之間的線性關系。

核心概念

  1. 模型形式

    • 簡單線性回歸(單特征):
      [
      y = w_1 x + b
      ]

      • ( y ):預測值(目標變量)。
      • ( x ):輸入特征。
      • ( w_1 ):權重(斜率),表示特征的重要性。
      • ( b ):偏置(截距),表示基線值。
    • 多元線性回歸(多特征):
      [
      y = w_1 x_1 + w_2 x_2 + \dots + w_n x_n + b
      ]

      • ( x_1, x_2, \dots, x_n ):多個特征。
      • ( w_1, w_2, \dots, w_n ):每個特征的權重。
  2. 目標
    找到最優的權重 ( w ) 和偏置 ( b ),使得預測值 ( y ) 與真實值 ( y_{\text{true}} ) 的誤差最小。


如何訓練?

  1. 損失函數(Loss Function)
    衡量預測值與真實值的差距,常用均方誤差(MSE)
    [
    \text{MSE} = \frac{1}{N} \sum_{i=1}^{N} (y_{\text{true}}^{(i)} - y{(i)})2
    ]

    • ( N ):樣本數量。
    • 目標是最小化MSE。
  2. 優化方法

    • 最小二乘法:通過數學推導直接求解最優解(適用于小規模數據)。
    • 梯度下降(Gradient Descent):迭代調整參數,逐步降低損失(適用于大規模數據)。

代碼示例(Python)

from sklearn.linear_model import LinearRegression
import numpy as np# 示例數據:X是特征,y是目標值
X = np.array([[1], [2], [3], [4]])  # 單特征
y = np.array([2, 4, 6, 8])          # y = 2x# 創建模型并訓練
model = LinearRegression()
model.fit(X, y)# 預測
print(model.predict([[5]]))  # 輸出: [10.] (符合 y=2x)
print("權重 w:", model.coef_)   # 輸出: [2.]
print("截距 b:", model.intercept_)  # 輸出: 0.0

特點

  • 優點
    • 簡單、易解釋(權重直接表示特征影響)。
    • 計算效率高,適合小規模數據。
  • 缺點
    • 假設數據是線性的,對復雜關系擬合不足。
    • 對異常值和噪聲敏感。

應用場景

  • 房價預測(特征:面積、地段 → 目標:房價)。
  • 銷售額預測(特征:廣告投入、季節 → 目標:銷量)。
  • 任何需要量化特征與目標之間線性關系的場景。

注意事項

  1. 數據預處理
    • 特征需歸一化(尤其梯度下降時)。
    • 處理多重共線性(特征間高度相關)。
  2. 模型評估
    • 使用R2分數、MSE等指標衡量性能。
  3. 非線性擴展
    • 可通過多項式回歸(如 ( y = w_1 x + w_2 x^2 ))擬合非線性關系。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/913288.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/913288.shtml
英文地址,請注明出處:http://en.pswp.cn/news/913288.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

2025.7.6總結

第天,Morning power 1.四四呼吸,做了10分鐘。 2.感恩環節:有兩周沒去新勵成上課了,感謝今天早上去上了當眾講話,遇到了不少老朋友,聊的還蠻開心滴,滿足了我的社交需求。其次,在臺上做了個小面試…

RabbitMQ 高級特性之死信隊列

1. 簡介 在前面的高級特性中,我們介紹了重試機制和 TTL,那么產生下列問題: 在重試機制中,當消費者消費消息發生異常時,會觸發消息重發機制,由于我們配置了最大的重發次數,那么當超過這個次數后…

如何選擇合適的工業相機快門種類

在工業相機領域,常見的三種快門類型:全局快門(Global Shutter)、卷簾快門(Rolling Shutter)以及全局復位式卷簾快門(Global - reset rolling Shutter)。我們主要來講講全局快門&…

uloop源碼剖析

uloop是libubox庫的核心模塊,libubox是OpenWrt基礎庫之一,用來提供事件驅動、基礎數據結構等。 uloop支持文件描述符監控、超時定時器、子進程管理、信號處理事件、間隔定時器等五大核心功能。 主體框架 uloop循環的主體框架有三個函數構成&#xff0c…

Mac電腦 虛擬機 VMware Fusion13

VMware Fusion mac 不僅能讓你在Mac蘋果電腦上運行Windows或Linux系統、使用非Mac平臺的應用,而且還可以支持各種USB硬件設備。 原文地址:VMware Fusion 13 Mac虛擬機

嵌套容器是隱射宿主機的路徑而不是容器的路徑

嵌套容器是隱射宿主機的路徑而不是容器的路徑 為什么?容器中的 Docker 運行流程 為什么? 這個問題涉及 Docker 的工作原理,特別是嵌套容器的行為。讓我們逐步分析為什么在容器內部啟動其他容器時,文件系統的掛載行為是基于 宿主機…

Go語言--語法基礎6--基本數據類型--切片類型

Go 語言切片是對數組的抽象。Go 數組的長度不可改變,在特定場景中這樣的集合就不太適用,Go 中提供了一種靈活、功能強悍的內置類型切片 ("動態數組"),與數組相比切片的長度是不固定的,可以追加元素,在追加時…

?御控物聯網綜合應用實訓平臺-物聯網系統和實驗室實訓系統?

在科技飛速發展的今天,物聯網技術已滲透到各個領域,成為推動產業升級和創新發展的重要力量。對于職業教育和科研機構而言,搭建一套完善的物聯網綜合應用實訓系統,培養適應時代需求的物聯網專業人才,顯得尤為迫切。而御…

ElasticSearch中的分片是什么?

大家好,我是鋒哥。今天分享關于【ElasticSearch中的分片是什么?】面試題。希望對大家有幫助; ElasticSearch中的分片是什么? 超硬核AI學習資料,現在永久免費了! 在 Elasticsearch 中,分片(Shard&#x…

基于PHP+MySQL組合開發開源問答網站平臺源碼系統 源碼開源可二次開發 含完整的搭建指南

問答網站成為人們獲取知識、交流經驗的重要平臺。無論是專業領域的疑難解答,還是生活常識的分享探討,問答網站都發揮著巨大的作用。對于想要搭建問答網站的個人或企業來說,一款優秀的開源問答網站平臺源碼系統至關重要。今天,我們…

Python工程師面試題集

文章目錄一、Python基礎二、關鍵Python庫三、Web開發四、并發與性能五、系統設計答案區一、Python基礎Python的可變與不可變數據類型有哪些?底層實現原理?Python2與Python3的主要區別解釋GIL全局解釋器鎖及其對多線程的影響裝飾器Decorator的作用與實現原…

什么是碼率?剪映中如何選擇適合的視頻碼率

在視頻編輯過程中,碼率(Bitrate)是一個決定視頻畫質的關鍵參數。對于普通用戶來說,剪映作為一款功能強大的視頻編輯工具,其默認的碼率設置直接影響最終導出視頻的質量和文件大小。那么,剪映的默認碼率是多少…

專題:2025電商營銷與AI應用發展趨勢報告|附260+份報告PDF、原數據表匯總下載

原文鏈接:https://tecdat.cn/?p42834 電商行業在數字經濟浪潮中持續演進,2025年呈現出多平臺發力、技術驅動增長、消費需求多元等特點。快手和抖音作為國內直播電商的重要陣地,各品類銷售表現各有亮點,同時全球電商市場規模穩步…

windows安裝stable diffusion

安裝git https://git-scm.com/downloads/winclone項目 創建一個文件夾,clone下來stable diffusion webui git網址:https://github.com/AUTOMATIC1111/stable-diffusion-webui git clone https://github.com/AUTOMATIC1111/stable-diffusion-webui.git安裝…

Python爬蟲 XPath 三方庫lxml

前言 XPath是Python爬蟲最重要的過濾原始數據的手段之一,是爬蟲最核心的技術 是專業抓取HTML頁面而生的,基本上只用于抓取HTML頁面使用 目錄 安裝支持XPath三方庫lxml XPath代碼入門示例 XPath表達式語法 在源代碼上面直接獲取XPath 安裝支持XPath三方庫lxml pip instal…

深度學習洪水推演:Python融合多源衛星數據可視化南方暴雨災情

目錄1. 引言:多源衛星融合分析的突破性價值2. 多模態融合架構設計3. 雙流程對比分析3.1 單源 vs 多源融合分析3.2 洪水推演核心流程4. 核心代碼實現4.1 多源數據融合處理(Python)4.2 時空洪水推演模型(PyTorch)4.3 三維…

「日拱一碼」016 深度學習常用庫——PyTorch

目錄 張量操作 創建張量: torch.tensor() :直接從數據創建張量 torch.zeros() :創建全零張量 torch.ones() :創建全一張量 torch.randn() :創建正態分布隨機張量 torch.arange() :創建等差序列張量 …

【Qt】QStringLiteral 介紹

QStringLiteral 介紹 QStringLiteral 是 Qt 框架中提供的一個宏,用于在編譯時從字符串字面量創建 QString 對象,具有高效和零內存分配的特點。 主要特點 編譯時轉換:將字符串字面量在編譯時轉換為 QString 數據,而不是運行時。…

UI前端與數字孿生結合實踐探索:智慧物流的貨物追蹤與配送優化

hello寶子們...我們是艾斯視覺擅長ui設計、前端開發、數字孿生、大數據、三維建模、三維動畫10年經驗!希望我的分享能幫助到您!如需幫助可以評論關注私信我們一起探討!致敬感謝感恩!一、引言:數字孿生重構智慧物流的技術范式在物流行業數字化轉型的浪潮中&#xff0…

Java創建型模式---工廠模式

工廠模式基礎概念 工廠模式是一種創建型設計模式,其核心思想是將對象的創建和使用分離。通過使用工廠模式,可以將對象創建邏輯集中管理,提高代碼的可維護性和可擴展性。在 Java 中,工廠模式主要分為三種類型: 簡單工…