二、線性回歸

一、回歸

可以拿正態分布為例,比如身高,若平均身高為1.78m,絕大多數人都是1.78m左右,超過2m的很少,低于1m的也不多。
很多事情都會回歸到一定的區間之內,即回歸到平均值。

機器學習沒有完美解,只有最優解。
機器學習的目的就是要以最快的速度,找到誤差最小的那個最優解。

二、線性回歸

線性:一次方關系,y=a+b*x,各點連接可以形成一條直線。
線性即量與量之間按比例、呈直線的關系,在空間和時間上代表規則和光滑的運動。
x是影響y的因素或維度
總結起來:線性回歸就是①數據y和x呈一次方關系、②數據中的每條記錄都符合正態分布

三、最小二乘法

在這里插入圖片描述
例如:y = a * x + b,(x1,y1),(x2,y2),(x3,y3),(x4,y4),因為是一元一次函數,其實只需要兩個點就可以確定出a和b的值,但實際上會有很多的數據點,此時就需要兩兩組合,分別求出a和b的值,對應不同的a和b求得的y’值是不相同的,分別代入損失函數中去,求得損失函數的值,找取最小的a和b的值,即為最優解,該a和b參數就是我們要求的最優解。

假設有m個樣本點,y’為直線上的點,y為真實點的位置,一個樣本誤差為y’-y。
通常把損失函數loss定義為:在這里插入圖片描述
我們的目的就是盡可能使得loss損失函數值最小,找到那個最優參數a和b。

四、多元線性回歸

現實生活中,對數據的分析不可能僅僅一個自變量,絕大多數情況都是多個自變量進行分析。
多元線性也就是多元一次函數。本質就是算法(公式)變換為了多元一次方程組。一般來講W和X都是n維列向量。
在這里插入圖片描述,一般情況下x0恒為1,目的是方便轉換為矩陣進行求解。

在這里插入圖片描述,其中x1,x2…xn表示n個樣本點。
也常表示為:在這里插入圖片描述,其中ε為誤差就等價于隨機變量,θ就是W,y表示真實值,θTx為預測值。真實值=預測值+誤差。

五、最大似然估計

最大似然估計是一種統計方法,它用來求一個樣本集的相關概率密度函數的參數
似然likelihood,也就是可能性,與probabilite概率的同義詞可以互換。

六、中心極限定理

中心極限定理是概率論中討論隨機變量序列部分和分布漸進于正態分布的一類定理。
這組定理是數理統計和誤差分析的理論基礎,指出了大量隨機變量積累分布函數逐點收斂到正態分布的積累分布函數的條件。
它是概率論中最重要的一類定理,有廣泛的實際應用背景。在自然界與生產中,一些現象受到許多相互獨立的隨機因素的影響,如果每個因素所產生的影響都很微小時,總的影響可以看作是服從正態分布的。中心極限定理就是從數學上證明了這一現象。

七、誤差

第i個樣本實際的值(y) = 預測的值(y’) + 誤差(ε)
假定所有的樣本都是獨立的,有上下的震蕩,震蕩認為是隨機變量,足夠多的隨機變量疊加之后形成的分布,根據中心極限定理,它服從的就是正態分布,因為它是正常狀態下的分布,也就是高斯分布。均值和方差都是某個具體的值。
既然誤差符合均值為0,方差為平方的正態分布,那么就可以把它的概率密度函數給寫出來。

八、概率密度函數

最簡單的概率密度函數是均勻分布的密度函數。
最簡單的概率密度函數是均勻分布的 密度函數,也就是說,當x不在[a,b]上的時候,函數值等于0;而在區間[a,b]上的時候,函數值等于這個函數。這個函數并不是完全的連續函數,但是它是可積函數。
在這里插入圖片描述

正態分布是重要的概率分布,它的概率密度函數是:在這里插入圖片描述,隨著參數μ和σ的變化,概率分布也產生變化。

真實值 = 預測值 + 誤差,ε誤差等價于隨機變量,目的是用ε代替(x-μ)。
把公式公式代入上述概率密度函數中得:
在這里插入圖片描述,求得第i個樣本的概率密度。
在這里插入圖片描述,把誤差ε用表達式代替,得出第i個樣本的最大似然估計函數。

概率密度不等于概率,但是概率密度跟概率是等價的。就類似 你不知這個人的體型,但是你知道他穿的衣服的長度等信息。
上述為一個樣本的概率密度,要求所有樣本的概率密度即:
最大總似然估計函數(likelihood):
在這里插入圖片描述
連乘確實優點麻煩,故想到了通過對數函數運行進行轉換為連加。
在這里插入圖片描述
前半部分是個常數,為了簡化操作,將后半部分提出來,形成一個新的目標函數。
最終得到目標函數:
在這里插入圖片描述
要求L(θ)最大,即等價于求解J(θ)最小,我們關系的不是J(θ),我們要找的只是θ取何值,J(θ)最小,關心的是θ!

九、總結

Ⅰ為什么求總似然的時候,要用正態分布的概率密度函數?
答:因為中心極限定理可以得知,如果假設樣本之間是獨立事件,誤差變量隨機產生,那么它就服從正態分布。

Ⅱ總似然不是概率相乘嗎?為什么用概率密度函數進行相乘?
答:因為概率不好求,所以當找到概率密度相乘最大的時候,就相當于找到了概率相乘最大的時候。

Ⅲ概率為什么不好求?
答:概率在正態分布中表示的時候面積,面積需要積分,然而我們的樣本都是離散的點,故真正的面積是無法積分出來的,即概率不好求。

Ⅳ總似然最大和最優解有啥關系?
答:當找到可以使得總似然最大的條件,也就可以找到DataSet數據集最吻合某個正態分布,即找到了最優解。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/377846.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/377846.shtml
英文地址,請注明出處:http://en.pswp.cn/news/377846.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【轉】HMM學習最佳范例五:前向算法1 .

五、前向算法(Forward Algorithm) 計算觀察序列的概率(Finding the probability of an observed sequence) 1.窮舉搜索( Exhaustive search for solution)  給定隱馬爾科夫模型,也就是在模型參…

vs 字體

看代碼看得眼疼不能不說是程序員的惡夢,那么,選擇適當的字體也算是對自己的救贖吧。周末閑得無聊,在網上亂逛,搜索了一些資料整理一下給大家分享,僅作記錄而已,參考使用: 1.一個編程人員痛苦的選…

leetcode 349. 兩個數組的交集 思考分析

題目 給定兩個數組&#xff0c;編寫一個函數來計算它們的交集。 1、暴力雙for循環 class Solution { public:vector<int> intersection(vector<int>& nums1, vector<int>& nums2) {vector<int> result;vector<int> res;if(nums1.siz…

random.next_Java Random next()方法與示例

random.next隨機類的next()方法 (Random Class next() method) next() method is available in java.util package. next()方法在java.util包中可用。 next() method is used to return the pseudo-random number in bits. next()方法用于返回以位為單位的偽隨機數。 next() me…

VS2008下QT開發環境搭建

http://blog.csdn.net/sunnyboycao/article/details/6364444 轉載于:https://www.cnblogs.com/bjfuyumu/p/3321180.html

三、梯度下降法求解最優θ值

一、梯度下降法(GD&#xff0c;Gradient Descent) Ⅰ、得到目標函數J(θ)&#xff0c;求解使得J(θ)最小時的θ值 當然&#xff0c;這里只是取了倆特征而已&#xff0c;實際上會有m個特征維度 通過最小二乘法求目標函數最小值 令偏導為0即可求解出最小的θ值&#xff0c;即…

Delphi中Messagedlg用法

if MessageDlg(Welcome to my Delphi application. Exit now?, mtConfirmation, [mbYes, mbNo], 0) mrYes then begin Close; end;MessageDlg用法 對話框類型&#xff1a;mtwarning——含有感嘆號的警告對話框mterror——含有紅色叉符號的錯誤對話框mtinformation——含有藍…

leetcode 131. 分割回文串 思考分析

題目 給定一個字符串 s&#xff0c;將 s 分割成一些子串&#xff0c;使每個子串都是回文串。 返回 s 所有可能的分割方案。 思考 問題可以分為兩個子問題&#xff1a;1、判斷回文串2、分割數組 判斷回文串 bool isPalindrome_string(string s,int startindex,int endinde…

android淡入淡出動畫_在Android中淡入動畫示例

android淡入淡出動畫1) XML File: activity_main 1)XML文件&#xff1a;activity_main <?xml version"1.0" encoding"utf-8"?><android.support.constraint.ConstraintLayout xmlns:android"http://schemas.android.com/apk/res/android&…

[慢查優化]聯表查詢注意誰是驅動表 你搞不清楚誰join誰更好時請放手讓mysql自行判定...

寫在前面的話&#xff1a; 不要求每個人一定理解 聯表查詢(join/left join/inner join等)時的mysql運算過程&#xff1b; 不要求每個人一定知道線上&#xff08;現在或未來&#xff09;哪張表數據量大&#xff0c;哪張表數據量小&#xff1b; 但把mysql客戶端&#xff08;如SQL…

四、梯度下降歸一化操作

一、歸一化 Ⅰ什么是歸一化&#xff1f; 答&#xff1a;其實就是把數據歸一到0-1之間&#xff0c;也就是縮放。 常用的歸一化操作是最大最小值歸一化&#xff0c;公式如下&#xff1a; 例如&#xff1a;1&#xff0c;3&#xff0c;5&#xff0c;7&#xff0c;9&#xff0c;10…

[轉帖][強烈推薦]網頁表格(Table/GridView)標題欄和列凍結(跨瀏覽器兼容)

GridView的標題欄、列凍結效果(跨瀏覽器版) 本文來源&#xff1a;http://blog.darkthread.net/blogs/darkthreadtw/archive/2009/02/18/supertable-plugin-for-jquery.aspx 稍早發表了GridView 的標題列凍結效果&#xff0c;足以滿足工作上的需求&#xff0c;不過存在兩個缺點:…

psu是什么電腦配件_PSU的完整形式是什么?

psu是什么電腦配件PSU&#xff1a;電源部門/公共部門事業 (PSU: Power Supply Unit / Public Sector Undertaking) 1)PSU&#xff1a;電源設備 (1) PSU: Power Supply Unit) PSU is an abbreviation of the "Power Supply Unit". PSU是“電源設備”的縮寫 。 It is a…

【C++grammar】斷言與表達式常量

目錄1、常量表達式和constexpr關鍵字2、斷言與C11的靜態斷言1.1. assert : C語言的宏(Macro)&#xff0c;運行時檢測。1.2. assert()依賴于NDEBUG 宏1.3. assert 幫助調試解決邏輯bug &#xff08;部分替代“斷點/單步調試”&#xff09;2.1static_assert (C11的靜態斷言 )2.2.…

一些又用的國內著名期刊

記&#xff1a; 電子學報、電子與信息學報、圖像圖形學報、自動化學報、計算機學報、軟件學報、計算機研究與發展。轉載于:https://www.cnblogs.com/nanyangzp/p/3322244.html

一、Arduino UNO R3將數據上傳至云平臺

一、準備工作 ①ESP12E Shield ②Arduino UNO R3開發板 ③把ESP12E Shield安裝到Arduino UNO R3開發板上 ④登錄物聯網平臺注冊個賬號&#xff0c;到時候需要使用。 ⑤記錄下來你的Uid和key到時候會用到 ⑥創建個設備&#xff0c;用于測試 ⑦beyondyanyu為設備名&…

怎樣做一個快樂的ASP.NET程序員

首先我想解釋一下標題中兩個關鍵字: "快樂", "ASP.NET程序員". 有的人想成為一個"杰出"的程序員, 或者"資深"的程序員, 簡單來說就是"大牛"級的人物 -- 但是本文不是針對此種發展方向不是說我不鼓勵大家朝這方向走, 而是對我…

__eq___C ++'and_eq'關鍵字和示例

__eq__"and_eq" is an inbuilt keyword that has been around since at least C98. It is an alternative to & (Bitwise AND Assignment) operator and it mostly uses for bit manipulations. “ and_eq”是一個內置關鍵字&#xff0c;至少從C 98起就存在。 它…

leetcode 93. 復原IP地址 思考分析

題目 給定一個只包含數字的字符串&#xff0c;復原它并返回所有可能的 IP 地址格式。 有效的 IP 地址 正好由四個整數&#xff08;每個整數位于 0 到 255之間組成&#xff0c;且不能含有前導 0&#xff09;&#xff0c;整數之間用 ‘.’ 分隔。 例如&#xff1a;“0.1.2.201” …

二、通過云平臺反向控制Arduino UNO R3

該篇博文是在第一篇博文(一、Arduino UNO R3將數據上傳至云平臺)的基礎上進行的 一、云平臺發送指令反向控制Arduino UNO R3 ESP12E Shield開關都推到OFF&#xff08;要不然下載會報錯&#xff09;&#xff0c;往Arduino UNO R3開發板上下載下面的代碼 這段代碼進行測試要點&…