機器學習-線性回歸(簡單回歸、多元回歸)

這一篇文章,我們主要來理解一下,什么是線性回歸中的簡單回歸和多元回歸,順便掌握一下特征向量的概念。

一、簡單回歸

簡單回歸線性回歸的一種最基本形式,它用于研究**一個自變量(輸入)與一個因變量(輸出)**之間的線性關系。其數學表達形式為:

y=?wx + b

其中:

  • y:因變量(輸出),即我們要預測的目標值
  • x:自變量(輸入),即影響因變量的已知因素
  • w(權重/斜率):表示自變量對因變量的影響程度
  • b(偏置/截距):表示當 x = 0 時,y?的取值

通俗舉例 1:通過身高預測體重

假設我們想要建立一個簡單的模型,根據一個人的身高來預測體重,我們有以下數據:

身高(cm)體重(kg)
15050
16060
17070
18080

建模思路:

  • 設身高 x,體重 y,假設兩者之間有一個線性關系 y=wx+b。
  • 通過擬合這些數據,模型可能會得到類似的方程: 體重=0.5×身高?25, 在這里:
    • w=0.5(表示每增加 1 cm 身高,體重約增加 0.5 kg)
    • b=?25(表示身高為 0 時的理論體重,但在實際場景中無意義,僅為模型參數)

預測:
如果一個人的身高是 175 cm,則模型預測體重為:

y=0.5×175?25=62.5kg

通俗舉例 2:學習時間與考試分數

假設我們想要研究學習時間(小時)對考試分數的影響,收集了一些數據:

學習時間(小時)考試分數(分)
150
255
365
470

建模思路:
我們嘗試建立一個簡單回歸模型來預測分數:

考試分數=10×學習時間+45

在這里:

  • 斜率 w=10(表示每增加 1 小時學習時間,分數提高 10 分)
  • 截距 b=45(表示即使不學習,可能的最低分數是 45 分)

預測:
如果某人學習 5 小時,預測的考試分數為:

10×5+45=95

簡單回歸的特點

  1. 只涉及一個自變量(單輸入)
  2. 假設變量之間是線性關系(如果關系復雜,可能需要更高級的回歸方法)
  3. 易于解釋和計算(適合初學者理解和使用)

簡單回歸的應用場景

  • 通過溫度預測冰淇淋銷量
  • 通過廣告支出預測銷售額
  • 通過年齡預測血壓

二、多元回歸

什么是多元回歸?

多元回歸(Multiple Linear Regression, MLR) 是線性回歸的一種擴展,它用于研究**多個自變量(輸入)一個因變量(輸出)**之間的關系。簡單來說,它是一種能同時考慮多個影響因素的回歸模型。

多元回歸的數學公式:

其中:

  • y:因變量(輸出)
  • x1,x2,...,xn:自變量(輸入特征)
  • w1,w2,...,wn:各特征的權重(回歸系數),衡量每個特征對結果的影響程度
  • b:偏置項(截距),表示所有輸入特征為 0 時的輸出值

通俗舉例 1:房價預測

假設我們想要預測一套房子的價格,影響房價的因素有:

面積(㎡)房齡(年)離市中心距離(km)價格(萬元)
10053200
120105180
8022220
1501510150

在這里,我們可以建立一個多元回歸模型:

通俗舉例 2:學生考試成績預測

假設某個學生的考試成績可能受到上課時長、作業完成情況、睡眠時間等因素的影響,我們收集到以下數據:

上課時長(小時)作業完成率(%)睡眠時間(小時)考試成績(分)
1090885
870670
1295990
650560

建立回歸模型:

多元回歸的特點

  1. 同時考慮多個因素,適合更復雜的現實場景
  2. 線性關系假設,適用于數據中存在一定的線性相關性
  3. 解釋性強,可以分析每個變量對結果的貢獻

多元回歸的應用場景

  • 市場營銷:影響銷售額的因素可能包括廣告投放、產品價格、品牌影響力等
  • 醫學研究:預測患者的疾病風險,考慮年齡、體重、血壓、運動習慣等
  • 商業分析:評估員工績效,考慮工作時長、項目數量、經驗等

三、特征向量

如何簡單理解特征向量?

通俗來說,特征向量(Feature Vector) 就是用一組數字來描述一個對象的“特征”。在機器學習中,我們用特征向量來表示數據,使得計算機能夠處理和學習這些數據的模式。

簡單例子 1:水果分類

假設你要訓練一個模型來識別不同的水果,比如蘋果、橘子、香蕉。我們可以用以下特征來描述水果:

  • 重量(克)
  • 顏色(紅色=1,橙色=2,黃色=3)
  • 大小(直徑 cm)

如果你拿到一個水果,它的特征如下:

  • 重量:150 克
  • 顏色:1(紅色,代表蘋果)
  • 大小:8 cm

那么,這個水果可以表示成一個特征向量:

[150,1,8]

同樣,橘子和香蕉的特征可能分別是:

[120,2,7](橘子)

[130,3,9](香蕉)

這些特征向量可以作為機器學習模型的輸入,讓模型學習如何區分不同的水果。

簡單例子 2:學生成績分析

假設你想分析學生的表現,考慮以下特征:

  • 上課時長(小時)
  • 作業完成率(%)
  • 考試成績(分)

學生 A:

[10, 90, 85]

學生 B:

[8,70,78]

這些數據可以組成特征向量,讓我們對學生的學習情況進行分析和預測。

特征向量的特點

  1. 數值化:將現實世界的特征轉換為計算機可處理的數值形式。
  2. 多維度:可以同時包含多個屬性,描述一個對象的多個方面。
  3. 通用性:適用于分類、回歸、聚類等各種機器學習任務。

總結

特征向量就是用一組數字來表示事物的特征,它幫助計算機更好地理解和分析數據。你可以把它想象成一個“數據快照”,每個維度(數值)代表事物的一個屬性。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/66833.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/66833.shtml
英文地址,請注明出處:http://en.pswp.cn/web/66833.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Git知識分享

一、理解git首先要理清楚下面五個概念: 1、工作區(git add 命令之前的樣子) 2、stash 暫存(暫存工作區和暫存區的更改) 3、暫存區(git add 命令之后的存儲區, 4、本地倉庫(git commit提交的位置) 5、遠程倉庫(git push提交的位置) 二、git常用命令: 1、g…

2024年度技術總結——MCU與MEMS和TOF應用實踐

引言 2024年對我來說是技術成長與突破的一年。在這一年里,我不僅在技術領域拓展了深度和廣度,還通過與客戶合作的實際項目,成功實現了從單一MCU到MCU、MEMS與TOF技術融合的跨越。這一過程中,我深刻認識到,技術的進步不…

一句話,我讓 AI 幫我做了個 P 圖網站!

每到過節,不少小伙伴都會給自己的頭像 P 個圖,加點兒裝飾。 比如圣誕節給自己頭上 P 個圣誕帽,國慶節 P 個小紅旗等等。這是一類比較簡單、需求量卻很大的 P 圖場景,也有很多現成的網站和小程序,能幫你快速完成這件事…

如何打造一個高并發系統?

今天和大家聊聊作為一個后端開發,在實際工作中,我們如何打造一個高并發的系統? 如下圖所示,大概有六個層面,我們結合具體的場景直播間簽到去一一細說。 一、前端 1、打散請求:即把用戶的接口分散一點去請求…

996引擎 - 前期準備-配置開發環境

996引擎 - 前期準備 官網搭建服務端、客戶端單機搭建 開發環境配置后端開發環境配置環境 前端開發環境配置環境 后端簡介前端簡介GUILayoutGUIExport 官網 996傳奇引擎官網 所有資料從官網首頁開始,多探索。 文檔: 996M2-服務端Lua 996M2-客戶端Lua 搭…

迅為RK3568開發板篇OpenHarmony實操HDF驅動控制LED-添加內核編譯

編譯內核時將該 HDF 驅動編譯到鏡像中,接下來編寫驅動編譯腳本 Makefile,代碼如下所示: 加入編譯體系,填加模塊目錄到 drivers/hdf_core/adapter/khdf/linux/Makefile 文件 更多內容可以關注:迅為RK3568開發板篇OpenHa…

生信軟件管家——conda vs pip

pip vs conda: 安裝過python包的人自然兩種管理軟件都用過, Pip install和Conda install在Python環境中用于安裝第三方庫和軟件包,但它們在多個方面存在顯著的區別 總的來說: pip是包管理軟件,conda既是包管理軟件&…

電子電氣工程會議

征稿主題 集中但不限于“電子電氣與信息工程”等其他相關主題。 電子、電氣工程: 電路與電子學、智能芯片、半導體器件、數字信號處理、遙感,雷達和傳感、射頻技術、微電子技術與電子信息、電子工程中的計算智能、電力領域的數據科學技術、智能電力設…

OpenVela 架構剖析:從內核到應用

目錄 一、總體架構概述 二、 內核層 2.1. OpenVela架構的內核基礎 2.2. 內核層的主要職責 2.3. OpenVela對NuttX的擴展與優化 三、系統服務層 2.1. 進程管理 2.2. 內存管理 2.3. 文件系統 2.4. 網絡通信 四、框架層 4.1. 模塊化設計 4.2. API接口 4.3. 組件和服務…

ubuntu 布暑python項目

在Ubuntu上部署Python項目通常包括以下幾個步驟: 1 安裝必要的軟件: 確保系統已經安裝了Python、pip(Python包管理工具)以及virtualenv(可選,用于創建獨立的Python環境)。如果還沒有安裝&#…

RV1126畫面質量一:視頻基礎

在聊視頻畫面調節之前,先來認識一下視頻畫面的有一些基礎問題 如今我們所處的時代,是移動互聯網時代,也可以說是 視頻時代 。 從快播到抖音,從“ 三生三世 ” 到 “ 三十而已 ” ,我們的生活,被越來越多的 …

準備知識——波紋度和粗糙度區別與聯系

在開始齒輪齒面波紋度開始前,先來學習一下基本概念——波紋度和粗糙度,廢話不多說,直接開始: 什么是表面粗糙度? 表面粗糙度定義為實際表面相對于波谷的較短頻率。如果去觀察加工零件,會注意到它們的表面…

五、華為 RSTP

RSTP(Rapid Spanning Tree Protocol,快速生成樹協議)是 STP 的優化版本,能實現網絡拓撲的快速收斂。 一、RSTP 原理 快速收斂機制:RSTP 通過引入邊緣端口、P/A(Proposal/Agreement)機制等&…

寶塔Linux+docker部署nginx出現403 Forbidden

本文主要講述了寶塔docker部署nginx出現403 Forbidden的原因,以及成功部署前端的方法步驟。 目錄 1、問題描述2、問題檢測2.1 檢測監聽端口是否異常2.2 檢測Docker容器是否異常2.2.1 打開寶塔Linux的軟件商店,找到Docker管理器,查看前端容器是…

光交箱啞資源巡檢過程中都要檢查哪些設備,怎樣實現智能化管理

一、光交箱啞資源管理現狀 光交箱啞資源主要包括光纖、光纜、接頭盒、配線架等設備。這些設備在通信網絡中起著至關重要的作用,但由于缺乏智能化的監控和診斷能力,管理難度較大。 效率低下:人工巡檢的頻率和覆蓋范圍有限,資源清…

代碼隨想錄——串

文章目錄 反轉字符串反轉字符串Ⅱ路徑加密反轉字符串中的單詞動態口令字符串匹配重復的子字符串 反轉字符串 344. 反轉字符串 //前后對應交換 //0<->sSize-1 //1<->sSize-2 //... //i<->sSize-1-i,i0,1,...,(sSize-1)/2 void reverseString(char* s, int s…

在K8S中使用Values文件定制不同環境下的應用配置詳解

在Kubernetes&#xff08;簡稱K8s&#xff09;環境中&#xff0c;應用程序的配置管理是一項關鍵任務。為了確保應用程序在不同環境&#xff08;如開發、測試、預發布和生產&#xff09;中都能穩定運行&#xff0c;我們需要為每個環境定制相應的配置。Values文件是在使用Helm管理…

機器學習(5):支持向量機

1 介紹 支持向量機&#xff08;Support Vector Machine&#xff0c;簡稱 SVM&#xff09;是一種監督學習算法&#xff0c;主要用于分類和回歸問題。SVM 的核心思想是找到一個最優的超平面&#xff0c;將不同類別的數據分開。這個超平面不僅要能夠正確分類數據&#xff0c;還要使…

【前端知識】簡單易懂的vue前端頁面元素權限控制

文章目錄 設計思路代碼實現1. **權限數據管理**2. **權限判斷方法**3. **動態控制元素**4. **路由權限控制**5. **無權限頁面** 總結相關文獻 在前端實現基于 Vue 的權限控制&#xff0c;通常需要結合后端返回的用戶權限數據&#xff0c;動態控制頁面元素的顯示與隱藏、按鈕的可…

250123-java設計模式

設計模式是指經過大量實踐后經過總結和理論化后優選的代碼結構。 1.1 單態設計模式 一個類只能創建一個實例化對象。 1.2 模版設計模式 比如抽象類的應用。 1.3 代理設計模式 比如接口的應用。 1.4 共享設計模式 why&#xff1f;有效的減少垃圾空間的產生。 1.5 集成設…