高斯擬合 vc++代碼_NMA2020W1 極大似然法模型擬合與bootstrap

329ef55dab3743f0dacb945719d08126.png

常見的線性模型:

求解方式有兩種,一種是計算均方誤差(MSE),使得均方誤差最小。

a15418200262b52c4be3d627ed485217.png
圖1

找到梯度為零的點即可。

而之前一直比較模糊的最大似然法也比較清楚了。一般線性模型,我們假定誤差項是符合高斯分布的,高斯分布的概率密度函數為:

這里x即為原始值,

為估計值,原始描述的是原始點在均值周圍的分布,現在改成估計值圍繞原始值的分布即可。以下便是線性模型的似然函數

我們要找的就是使得p值最大的theta。取log是為了求值的方便,下面的推導直接把前面部分分離出來了,因為是個常數,可以直接不看,看后半部分就行了。

0d84d82b288a17610dda1dfe4a62f928.png
圖2

這樣,我們看只要求后半部分的極值就行了,由于是負號,求其最大值就是求不帶負號的最小值,這樣就跟MSE的公式幾乎一樣了。

84632775e228bab383ca76881e6d2a76.png
圖3

從概念上講就是,由于誤差項是高斯分布的,而估計值是一個確定值,所以當前真實值其實是落在以估計值為中心的高斯分布上的,如下

cd86efea4b904a24ca31fce63f8929e3.png
圖4

我們想要估計值盡可能等于真實值,那么使真實值最好就落在高斯分布的最高點上,即概率最大點,所以我們把每個真實值的落在各自估計值的高斯分布的概率加起來最大,就可以說是最佳的擬合程度了。由于加了log,所以累加在圖2中變成了累乘。

ce61cea3a2b1589c58e4c16cbafc6b4b.png
圖5

而這個極大似然估計也概念化地解釋了過擬合欠擬合中地bias-variance問題,variance就是指這個分布地寬窄,如果過寬,variance過大,即我們的模型變異很大,可能加一個或減一個數據,參數都會變很多。

而估算variance可以用bootstrap來做,bootstrap的過程就是,加入我們有10各樣本,就取隨機在10個樣本中抽取10個樣本,但是抽取方式是可以重復的,因此我們又得到了10個樣本,只是可能有重復樣本。

c866bae16f7497788c8c562d7af468f9.png
圖6

看一下代碼就很清楚了。

def resample_with_replacement(x, y):"""Resample data points with replacement from the dataset of `x` inputs and`y` measurements.Args:x (ndarray): An array of shape (samples,) that contains the input values.y (ndarray): An array of shape (samples,) that contains the correspondingmeasurement values to the inputs.Returns:ndarray, ndarray: The newly resampled `x` and `y` data points."""# Get array of indices for resampled pointssample_idx = np.random.choice(len(x), size=len(x), replace=True)# Sample from x and y according to sample_idxx_ = x[sample_idx]y_ = y[sample_idx]return x_, y_

19e634b217674166d65debf4dd4da46a.png
圖7

這樣就可以通過bootstrap來估計出我們參數的置信區間,雖然我們無從知道真實值是什么樣的,但是給一個區間總比一個點信息更多一點。當然有的顯著性檢驗應該可以用這個區間有沒有過0點來做。

除了bootstrapping可以給出模型的variance,還可以使用交叉驗證的方法評估模型,把所有數據分成n塊,每次用其中一塊做驗證集,其他為測試集。是測試集的平均正確率來判斷模型表現。這里要注意,一般都會做標準化,不能在劃分驗證集和測試集之前做,這樣會帶來很多的假陽性。一個辦法是對訓練集標準化,然把用得到的標準化參數應用到測試集上。

以上,我們的假設是誤差項為高斯分布,而不是所有都符合高斯分布的,如,如果反應是多個離散值的分布,那么我們的誤差項分布使用泊松分布更好。這樣就是個非線性的模型了,做起來很簡單,只需要在線性模型中間加一步非線性轉化,將原來的線性模型得到的輸出,套一個非線性方程即可,這也就是所謂的廣義線性模型(GLM)。

cd8f34aedd9a47cb4e06007c77dae282.png
圖8

而二值分布只需要將非線性方程設置為sigmoid方程,套上即可,這就是Logistic回歸。

這樣就是可以用glm,只是在原來的線性模型加一步非線性轉化就可以結果多樣的問題。

1fee40230c88d2440a1f58e6bb25da61.png
圖9

使用正則化解決過擬合問題,詳見:

https://zhuanlan.zhihu.com/p/146448243?zhuanlan.zhihu.com

上圖均來自于NMA2020的tutorial,代碼來自示例代碼:

https://github.com/NeuromatchAcademy/course-content/tree/master/tutorials?github.com

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/533613.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/533613.shtml
英文地址,請注明出處:http://en.pswp.cn/news/533613.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

java文件快速掃描儀_Java掃描儀具有示例的NextNextShort()方法

掃描儀類hasNextShort()方法語法:public boolean hasNextShort();public boolean hasNextShort(int rad);hasNextShort()方法在java.util包中可用。hasNextShort()方法用于檢查此掃描程序在其輸入中是否具有下一個標記,是否可以將其作為隱式基數中的shor…

python sqlite并發處理_python sqlite大數據 處理

{"moduleinfo":{"card_count":[{"count_phone":1,"count":1}],"search_count":[{"count_phone":4,"count":4}]},"card":[{"des":"阿里技術人對外發布原創技術內容的最大平臺&…

java sax xml文件解析_java解析xml文件-DOM/SAX

java解析xml文件的兩種方式1:DOM原理:把整個文檔加載到內存,轉化成dom樹,之后應用程序可以隨機的訪問dom樹的任何數據,靈活 快,但消耗內存一個簡單的xml使用java解析//builder工廠DocumentBuilderFactory f…

python現有兩個磁盤文件a和b_有兩個磁盤文件A和B,各存放一行字母,今要求把這兩個文件中的信息合并,輸出到一個新文件C中。...

首先,在.cpp所在的文件夾下建立A.txt與B.txt。向其中輸入字母。#include#include#includeint main(){FILE *a,*b,*c;char ch[100],outfile[10];int i0,n;void paixu(char a[100],int n);if((afopen("A.txt","r"))NULL){printf("Cant open …

python 遠程控制_用 Python 遠程控制你的電腦

用 Python 遠程控制你的電腦一、前言很多時候我們有這種需求,因為程序運行比較耗時,但是我們沒有足夠的時間等待。這個時候我們就可以用 Python 做一個遠程控制電腦的小工具,實現遠程控制電腦。當然,我們能做的操作十分有限&#…

攝像頭圖像分析目標物體大小位置_一文讀懂圖像定位及跟蹤技術

文 | 傳感器技術在科學技術日新月異的今天,人們對機器設備的智能性、自主性要求也越來越高,希望其完全替代人的角色,把人們從繁重、危險的工作任務中解脫出來,而能否像人一樣具有感知周圍環境的能力已成為設備實現智能化自主化的關…

java 相對路徑獲取_在java項目中通過相對路徑獲取資源的方式

1.可以通過 類名.class.getResource方法獲取或者getSystemResource2.可以通過當前線程 Thread.currentThread().getContextClassLoader().getResource獲取public class TestDemo {public static void main(String[] args) throws FileNotFoundException, IOException {Properti…

python循環嵌套的外循環必須完全包含內循環_Python:循環與嵌套循環實現規律數列...

很多人覺得編程很難,其實換個想法,這就是個用來解決問題的工具,我們為了解決實際問題而來學習和使用編程,這樣編程學習有了目的性,動力會更強。就像現在十分熱門的Python技術,就是人工智能領域所需求的&…

python爬取正確但不出文件_使用BeautifulSoup進行Python抓取時不顯示所有行

我是美容小組的新手。我試圖從ESPN Fantasy Basketball Standings中獲取“Season Stats”表,但并不是返回所有行。經過一番研究,我認為這可能是一個問題html.parser,所以我用了lxml。我得到了同樣的結果。如果有人能告訴我如何得到所有球隊的…

pat乙級相當于什么水平_雅思6.5是什么水平?相當于托福多少分?

雅思和托福是當前社會中非母語人士的主流英語水平測試。準備出國留學的學生對這兩項考試并不陌生。對于一些學生來說,僅靠雅思成績并不足以申請他們最喜歡的學校。特別是對于申請北美院校的學生,托福成績是申請時提交語言成績的優先考慮事項。那么&#…

java時間方法_JAVA處理日期時間常用方法

轉載JAVA處理日期時間常用方法:1.java.util.CalendarCalendar 類是一個抽象類,它為特定瞬間與一組諸如 YEAR、MONTH、DAY_OF_MONTH、HOUR 等 日歷字段之間的轉換提供了一些方法,并為操作日歷字段(例如獲得下星期的日期)提供了一些方法。瞬間可…

python氣象_Python 在氣象上的應用

Python 在氣象上的應用0.7892019.03.15 23:19:31字數 913閱讀 1,024為什么選擇python功能齊全的編程語言,真正面向對象喜歡可讀的代碼出版質量圖繪制輕松讀/寫netcdf和grib數據輕松使用Fortran / C / C 廣泛的庫支持數字和非數字工作科學計算1.Numpy  Numpy是pyth…

雙飛翼布局內容不換行_web前端入門到實戰:圣杯布局和雙飛翼布局

稍微了解前端的人都知道,圣杯布局和雙飛翼布局是前端面試時必問的問題,因為它既能體現你懂HTML結構又能體現出你對DIVCSS布局的掌握,畢竟我們學習CSS主要就是為了更好地布局帶來最好的用戶體驗嘛~事實上,圣杯布局其實和…

java 去掉 t_關于Java:在LocalDateTime中不能刪除“ T”

這是問題所在:GetMapping("/main/search")public String search (RequestParam String departure,RequestParam String arrival,RequestParam String departureTime,Model model) {DateTimeFormatter formatter DateTimeFormatter.ofPattern("yyyy-…

數據結構知識點總結_大牛帶你學 | 考研數據結構中線性表中順序結構的知識點總結...

前言我們都知道,數據結構中邏輯結構可以劃分為線性結構(線性表)與非線性結構兩大類。而存儲結構指的是數據元素在計算機中的存儲及其邏輯關系的表現,也就是在計算機當中對邏輯結構的表示。線性表的存儲結構主要有順序結構和鏈式結構兩種實現形式。本文主…

java矩形翻轉_如何判斷一個點在旋轉后的矩形中

前言最近在做的一款游戲中,用到點與旋轉矩形的判定來獲得一個選中的物體。在此做個記錄如圖所示,黃色的顏料屏是旋轉的,如果不做處理直接判斷點是否在矩形中,那么點擊紅點的位置會判定為選中物體。顯然這是不對的。如果物體沒有旋…

python中用函數設計棧的括號匹配問題_數據結構和算法(Python版):利用棧(Stack)實現括號的匹配問題...

算法數據結構數據結構和算法(Python版):利用棧(Stack)實現括號的匹配問題在平時寫程序當中,我們會經常遇到程序當中括號的匹配問題,也就是在程序當中左括號的數量和右括號的數量必須相等。如果不相等的話則程序必然會報錯。Hint:在讀取程序的…

python創建空元組_Python——元組的基本語法(創建、訪問、修改、刪除)

原標題:Python——元組的基本語法(創建、訪問、修改、刪除)Python 元組的使用Python 的元組與列表類似,不同之處在于元組的元素不能修改。元組使用小括號 ( ),列表使用方括號 [ ]。元組創建很簡單,只需要在括號中添加元素&#xf…

openssl 生成證書_CentOS7 httpd(Apache)SSL 證書部署

在之前我的文章中我已經搭建了nextcloud服務器,現在我們需要通過域名及https訪問怎么辦1. 進行了簡單的httpd設置后,就可以為網站添加SSL證書功能了。2. 首先得獲取證書,有了證書才能添加。我們采用本地上傳的方式將SSL證書上傳到CentOS上。獲…

FJ的字符串java問題_藍橋杯VIP試題 之 基礎練習 FJ的字符串- JAVA

問題描述FJ在沙盤上寫了這樣一些字符串:A1 “A”A2 “ABA”A3 “ABACABA”A4 “ABACABADABACABA”… …你能找出其中的規律并寫所有的數列AN嗎?輸入格式僅有一個數:N ≤ 26。輸出格式請輸出相應的字符串AN,以一個換行符結束。…