機器學習—線性回歸

一·線性回歸

線性回歸是利用數理統計中回歸分析,來確定兩種或兩種以上變量間相互依賴的定量關系的一種統計分析方法。

相關關系:包含因果關系和平行關系

因果關系:回歸分析【原因引起結果,需要明確自變量和因變量】

平行關系:相關分析【無因果關系,不區分自變量和因變量】

二·一元線性回歸模型理論

一元線性回歸模型表達式為:y=β0?+β1?x+ε

其中:

\beta0.\beta 1為模型參數,用于刻畫自變量?x?與因變量?y?線性關系的截距和斜率 。\beta 1可以看成y=kx+b中的k而\beta 0則可以看看成b

\varepsilon為誤差項,代表除線性因素外,由隨機因素導致的誤差 。

例子:

自變量:工資
因變量:貸款額度
工資到底能產生多大的影響呢?如何比較公平的評定工資的影響呢?

工資(x)貸款額度(y)
400010000
800012000
50008000
300010000
600015000
7000

三·多元線性回歸模型


多元線性回歸模型:

?y=β0?+β1?x1?+β2?x2?+ε

其中:

β0·β1·β2是模型參數。
\varepsilon是誤差項。
誤差項:除線性因素外的隨機因素所產生的誤差。

四·誤差項分析


1. 誤差項可以省略嗎?
答:誤差項不可省略,誤差是必然產生的。并且由于產生了誤差項,我們便可以基于誤差的特點來進行對線性回歸的參數估計的。
2. 誤差項有什么特點?
答:獨立同分布。
獨立:每個樣本點都是獨立的;例:貸款,每個人與每個人之間是沒有聯系的,貸多少錢完全基于你的工資。
同分布:同分布就是我的這套估計體系是我人民銀行的估計體系,每個人都是服從我的分布體系,不會使用別人的估計體系,也就是說每個樣本點都處于同一個分布函數下。

3. 誤差項滿足高斯分布。
高斯分布:

又稱為正態分布,概率密度函數為:

對參數問題的估計就轉化成了對誤差項的分析。
1. 期望為 0;
2. 方差相同,為\sigma ^{2}

\sigma控制正態分布圖像的高矮

4·誤差項分析

誤差項分析
線性回歸的轉化:

y=\beta 0+\beta 1x1+\beta 2x2+\varepsilon

矩陣計算:

y=\beta 0x0+\beta 1x1+\beta 2x2+\varepsilon

其中x0是1,目的是寫成矩陣

由于x為樣本項,為列向量,所以此處對\beta參數進行轉置,轉為行向量,從而得到以下結果。

y^{(i)}=\beta _{T}X^{(i)}+\varepsilon ^{(i)}?其中T是右上標

矩陣計算——并行化計算?

誤差項分析
預測值與誤差的最終的真實結果:

誤差項滿足高斯分布:

將誤差帶入高斯分布:

五·極大似然估計

極大似然估計是根據樣本推測參數的方法。核心是找使樣本出現概率最大的參數值,即“最可能”生成該樣本的參數。通過構建似然函數,求其最大值點得到估計,廣泛用于統計推斷。

極大似然估計

假設一個袋子里面有10個球,你抽了一次,發現是黑球;接著又抽了一次,發現又是黑球;在10 次之后,你發現有9次是黑球,1次是白球,那么請問袋子里面黑球有幾個?白球有幾個?

黑球:9/10*10=9個

白球:1/10*10=1個

前提:規律你不知道。 通過事實的數據結果 得到規律

事實發生的事情,一定是最大概率的結果。

六·似然函數求解

似然函數:
一條數據存在一個概率,每條數據都存在這樣一個概率,那么總的概率最大該怎么辦呢?

每個樣本都是獨立的,獨立的概率最大,自然是連乘了

似然函數求解
可是連乘不好計算啊,怎么辦呢?
對數似然函數:

化簡得:

誤差項分析
觀察一下最終計算結果:

?

?目標函數:

?求\beta ^{/}=0式子=0的極小值

最小二乘法求解
目標函數:

求導結果:

偏導等于 0:

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/917091.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/917091.shtml
英文地址,請注明出處:http://en.pswp.cn/news/917091.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Spring Boot Admin 監控模塊筆記-實現全鏈路追蹤

一、概述Spring Boot Admin(SBA)是一個用于監控和管理 Spring Boot 應用程序的工具。它提供了一個 Web 界面,可以集中管理多個 Spring Boot 應用程序的健康狀態、指標、日志、配置等信息。通過 SBA,你可以輕松地監控和管理你的微服…

容器化與Docker核心原理

目錄 專欄介紹 作者與平臺 您將學到什么? 學習特色 容器化與Docker核心原理 引言:為什么容器化成為云計算時代的基石? 容器化技術全景與Docker核心原理:從概念到實踐 文章摘要 1. 引言:為什么容器化成為云計算…

掌握Python三大語句:順序、條件與循環

PS不好意思各位,由于最近筆者在參加全國大學生電子設計大賽,所以最近會出現停更的情況,望大家諒解,比賽結束后我會加大力度,火速講Python的知識給大家寫完🎖?🎖?🎖?🎖…

JAVA結合AI

Java 與人工智能(AI)的結合正經歷從技術探索到深度融合的關鍵階段。以下從技術生態、應用場景、工具創新、行業實踐及未來趨勢五個維度展開分析,結合最新技術動態與企業級案例,揭示 Java 在 AI 時代的獨特價值與發展路徑。一、技術…

本土DevOps平臺Gitee如何重塑中國研發團隊的工作流

本土DevOps平臺Gitee如何重塑中國研發團隊的工作流 在數字化轉型浪潮席卷各行各業的當下,軟件開發效率已成為企業競爭力的核心指標。Gitee DevOps作為專為中國開發團隊打造的本土化研發管理平臺,正在改變國內技術團隊的工作方式。該平臺通過從代碼管理到…

5G MBS(組播廣播服務)深度解析:從標準架構到商用實踐

一、MBS技術背景與核心價值 1.1 業務需求驅動 隨著超高清視頻(4K/8K)、多視角直播、XR元宇宙應用爆發式增長,傳統單播傳輸面臨帶寬浪費(相同內容重復發送)與擁塞風險(萬人并發場景)的雙重挑戰。5G MBS通過點對多點(PTM)傳輸實現內容一次發送、多終端接收,頻譜效率提…

如何將照片從 realme 手機傳輸到電腦?

對于 realme 用戶來說,將照片傳輸到電腦可以有多種用途,從釋放設備空間到在單獨的存儲設備上創建備份。這個過程不僅有助于高效管理設備內存,還可以讓您利用電腦上強大的照片編輯軟件進行高級增強和創意項目。了解如何將照片從 realme 手機傳…

Centos 7部署.NET 8網站項目

簡介 本文詳細介紹了在CentOS 7系統上部署.NET 8網站項目的完整流程,主要內容包括:系統版本更新與檢查、PostgreSQL數據庫的安裝配置(含防火墻設置、數據庫初始化及遠程訪問配置)、Nginx Web服務的安裝與防火墻配置。文章通過分步…

Windows 11下IDEA中使用git突然變得卡慢及解決辦法

1. 表象 使用idea的git進行update、commit、push等操作時,極度卡慢。需等待幾十秒到幾分鐘。修改文件后,git刷新也不及時。update命令有時候無法點擊。 2.解決方法 停止PC Manager ServiceCtrl shift esc : 打開任務管理器找到服務: 服務中…

MyBatis 的兩級緩存機制

現實分布式項目中會不會開啟mybatis的二級緩存? 在分布式項目中,是否開啟MyBatis的二級緩存需結合具體場景和技術方案綜合評估。 以下是關鍵考量因素: 一、默認二級緩存的局限性 隔離性問題:MyBatis默認的二級緩存基于HashMap實…

分布式原子序列(Distributed Atomic Sequence)

這段內容是關于 Apache Ignite 中的 分布式原子序列(Distributed Atomic Sequence),也就是一個分布式 ID 生成器。我們來一步步深入理解它的原理、用途和使用方式。🔹 一、核心概念:什么是分布式 ID 生成器&#xff1f…

VSCode——插件分享:Markdown PDF

該插件可以將markdown編寫內容轉成PDF。 ? 支持渲染圖表、代碼高亮、表格等 Markdown 內容 安裝 Visual Studio Code安裝插件:Markdown PDF 打開擴展商店,搜索 Markdown PDF 并安裝 打開你的 .md 文件右鍵 → 點擊 Markdown PDF: Export (pdf)自動生成 …

rust-模塊樹中引用項的路徑

模塊樹中引用項的路徑 為了告訴 Rust 在模塊樹中如何找到某個項,我們使用路徑,就像在文件系統中導航時使用路徑一樣。要調用一個函數,我們需要知道它的路徑。 路徑有兩種形式: 絕對路徑是從 crate 根開始的完整路徑&#xff1b…

mac n切換node版本報錯Bad CPU type in executable

該node版本僅支持intel芯片,不支持Apple 芯片(M1/M2/M3/M4),所以需要下載Rosetta 2 ,讓node可以在搭載 Apple 芯片的 Mac 上運行。 env: node: Bad CPU type in executable /opt/homebrew/bin/n: line 753: /usr/local…

經典算法之美:冒泡排序的優雅實現

經典算法之美:冒泡排序的優雅實現基本概念工作原理介紹具體實現代碼實現總結基本概念 冒泡排序是一種簡單的排序算法,通過重復比較相鄰的元素并交換它們的位置來實現排序。它的名稱來源于較小的元素像氣泡一樣逐漸“浮”到數組的頂端。 工作原理 介紹…

click和touch事件觸發順序 糊里糊涂解決的奇怪bug

問題詳情 在嵌入式硬件設備里,測試 “點擊input密碼框,彈出第三方自帶鍵盤,點擊密碼框旁的小眼睛,切換輸入內容加密狀態,鍵盤收起/彈出狀態不變” 的功能邏輯;實際情況卻是 “點擊鍵盤或input框之外的任何地…

【0基礎PS】Photoshop (PS) 理論知識

目錄前言一、Photoshop 核心概念與定位?二、圖像基礎理論?三、圖層理論:PS 的核心工作機制?四、選區與蒙版?五、調色核心理論?六、常用文件格式?學習建議?總結前言 在數字圖像編輯領域,Photoshop(簡稱 PS)無疑是行業標桿級…

數據庫 設計 pdm comment列表顯示和生成建表sql

按如下步驟 生成見建表語句 comment非空使用comment 生成字段注釋, 空的時候使用name 生成字段注釋 sql腳本模板編輯 參考 PowerDesigner生成mysql字段comment 注釋-騰訊云開發者社區-騰訊云 版本不同這邊的設置不同 這個勾打上

嵌入式基礎知識復習(C語言)

知識擴展7.28 嵌入式產品特點、開發環境、計算機組成、Linux終端初識1、嵌入式產品。特點:低功耗、根據用戶需求定制。硬件:arm處理器。軟件:Linux操作系統arm架構:精簡指令集、低功耗(移動/嵌入式)。 …

LeetCode Hot 100 尋找兩個正序數組的中位數

給定兩個大小分別為 m 和 n 的正序(從小到大)數組 nums1 和 nums2。請你找出并返回這兩個正序數組的 中位數 。算法的時間復雜度應該為 O(log (mn)) 。示例 1:輸入:nums1 [1,3], nums2 [2] 輸出:2.00000 解釋&#x…