機器學習---最大似然估計和貝葉斯參數估計

1. 估計

貝葉斯框架下的數據收集,在以下條件下我們可以設計一個可選擇的分類器 :

P(wi) (先驗);P(x | wi) (類條件密度)

但是。我們很少能夠完整的得到這些信息!

從一個傳統的樣本中設計一個分類器:

先驗估計不成問題

對類條件密度的估計存在兩個問題:1)樣本對于類條件估計太少了;2 特征空間維數太大

了,計算復雜度太高。

如果可以將類條件密度參數化,則可以顯著降低難度。

例如:P(x | wi)的正態性,P(x | wi) ~ N( mi, Si),用兩個參數表示,這樣就將概率密度估計問題轉

化為參數估計問題。

最大似然估計 (ML) 和貝葉斯估計;結果通常很接近, 但是方法本質是不同的。

最大似然估計將參數看作是確定的量,只是其值是未知!? 通過最大化所觀察的樣本概率得到最優的

參數—用分析方法。

貝葉斯方法把參數當成服從某種先驗概率分布的隨機變量,對樣本進行觀測的過程,就是把先驗概

率密度轉化成為后驗概率密度,使得對于每個新樣本,后驗概率密度函數在待估參數的真實值附近

形成最大尖峰。在參數估計完后,兩種方法都用后驗概率P(wi | x)表示分類準則!

2. 最大似然估計??

最大似然估計的優點:當樣本數目增加時,收斂性質會更好; 比其他可選擇的技術更加簡單。

2.1 基本原理

假設有c類樣本,并且每個樣本集的樣本都是獨立同分布的隨機變量;P(x | wj) 形式已知但參數未

知,例如P(x | wj) ~ N( mj, Sj);記 P(x | wj) o P (x | wj, qj),其中

使用訓練樣本提供的信息估計θ?= (θ1, θ2, …, θc), 每個 θi (i = 1, 2, …, c) 和每一類相關

假定D包括n個樣本, x1, x2,…, xn,

θ的最大似然估計是通過定義最大化P(D | θ)的值θ值與實際觀察中的訓練樣本最相符”

最優估計:令并令為梯度算子,the gradient operator

我們定義 l(θ) 為對數似然函數:l(θ) = ln P(D | θ)

新問題陳述:求解 θ?為使對數似然最大的值? ??

對數似然函數l(θθ)顯然是依賴于樣本集D, 有:

最優求解條件如下:

,來求解。

2.2 高斯情況:μ未知

P(xk | μ) ~ N(μ???????, Σ):(樣本從一組多變量正態分布中提取)

θ?= μ,因此:μ的最大似然估計必須滿足?

Σ并且重新排序, 我們得到:即訓練樣本的算術平均值!

結論:如果P(xk | wj) (j = 1, 2, …, c)被假定為d?維特征空間中的高斯分布;然后我們能夠估計向量

?從而得到最優分類!

2.3?高斯情況:μ???????和Σ未知

未知 μ???????? σ對于單樣本xk:θ?= (θ1, θ2) = (μ, σ2)

對于全部樣本,最后得到:

聯合公式 (1) (2), 得到如下結果:

3. 貝葉斯估計?

在最大似然估計中 θ?被假定為固定值;在貝葉斯估計中 θ?是隨機變量

3.1?類條件密度

目標: 計算 P(wi | x, D),假設樣本為D貝葉斯方程可以寫成

先驗概率通常可以事先獲得,因此

每個樣本只依賴于所屬的類,有:

即:只要在每類中,獨立計算就可以確定x的類別。

因此,核心工作就是要估計

3.2 參數分布

假設??的形式已知, 參數θ的值未知,因此條件概率密度?的函數形式是知道的;假設參

數q是隨機變量,先驗概率密度函數p(θ)已知,利用貝葉斯公式可以計算后驗概率密度函數p(θ|D)

希望后驗概率密度函數p(θ?| D) 在θ的真實值附件有非常顯著的尖峰,則可以使用后驗密度p(θ?| D)

估計 θ?;注意到:

如果p(θ|D) 在某個值附件有非常顯著的尖峰,即如果條件概率密度具有一個已知的形式,則利

用已有的訓練樣本,就能夠通過p(θ?| D) 對p(x?| D) 進行估計。

?3.3 高斯過程

單變量情形的 p(μ?| D)

復制密度:

其中:?

結論:

單變量情形的 p(x|D):

?多變量情形:

復制密度:?

其中:

利用:

得:

利用:,令y=x-μ???????。

4. 貝葉斯參數估計一般理論?

p(x | D) 的計算可推廣于所有能參數化未知密度的情況中,基本假設如下:

假定 p(x |?θ) 的形式未知,但是q的值未知。q被假定為滿足一個已知的先驗密度 P(θ)。

其余的 θ?的信息包含在集合D中,其中D是由n維隨機變量x1, x2, …, xn組成的集合,它們服從于概

率密度函數p(x)

基本的問題是:計算先驗密度p(θ?| D) ,然后 推導出 p(x | D)。

遞歸貝葉斯學習:

該過程稱為參數估計的遞歸貝葉斯方法,一種增量學習方法。

唯一性問題:

p(x|θ) 是唯一的:后驗概率序列 p(θ|Dn) 收斂到 delta 函數;只要訓練樣本足夠多,則 p(x|θ) 能唯

一確定θ

在某些情況下,不同θ值會產生同一個 p(x|θ) p(θ|Dn) 將在 θ?附近產生峰值,這時不管p(x|θ)

否唯一, p(x|Dn)總會收斂到p(x) 。因此不確定性客觀存在。

最大似然估計和貝葉斯參數估計的區別:

最大似然估計

貝葉斯參數估計

計算復雜度

微分

多重積分

可理解性

確定易理解

不確定不易理解

先驗信息的信任程度

不準確

準確

例如 p(x|q)

與初始假設一致

與初始假設不一致

?

?

?

?

?

?

?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/166028.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/166028.shtml
英文地址,請注明出處:http://en.pswp.cn/news/166028.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

蘋果企業簽名失敗常見的問題

蘋果企業簽名失敗的常見問題主要有以下幾種: 證書過期或無效:蘋果開發者需要定期更新他們的簽名證書,以確保其有效性。一旦證書過期,相關應用將無法正常工作。證書不匹配:如果使用的證書與應用程序的Bundle ID不匹配&…

WT588F02B-8S語音芯片支持PWM音頻輸出的特征優勢及應用前景

隨著科技的飛速發展,語音芯片作為人機交互的核心組件,在各個領域的應用越來越廣泛。而在這些語音芯片中,支持PWM音頻輸出的特性日益受到關注。本文將探討語音芯片支持PWM音頻輸出的特征優勢以及其在各個領域的應用前景。 一、特征優勢 1、高…

git本地賬戶如何從一臺電腦遷移到另外一臺

為了表述方便,我們此處用舊電腦、新電腦指代。 在新電腦上安裝git 例如,我舊電腦上安裝的git版本是2.33.1版本,新電腦安裝git的版本是2.43.0,這不妨礙遷移。 將git的全局配置文件從舊電腦拷貝到新電腦 Git的全局配置文件&…

“關愛零距離.情暖老人心”主題活動

為提高社區老年人的生活質量,促進鄰里間的互動與友誼,以及弘揚尊老愛幼的社區精神,11月21日山東省濰坊市金陽公益服務中心、重慶市潼南區同悅社會工作服務中心在潼南區桂林街道東風社區共同在潼南區桂林街道東風社區舉辦了“關愛零距離.情暖老…

22款奔馳S400L升級原廠360全景影像 高清環繞 無死角

360全景影像影像系統提升行車時的便利,不管是新手或是老司機都將是一個不錯的配置,無論是在倒車,挪車以及拐彎轉角的時候都能及時關注車輛所處的環境狀況,避免盲區事故發生,提升行車出入安全性。 360全景影像包含&…

自學編程,用好這幾個網站就夠了!

如果你要自學編程,一定要收藏好這7個網站,上面免費的優質教程很多,完全可以省去你上萬塊錢的學費! 話不多說,直接上干貨! 第一個,W3school 一個主打圖文教程的網站,不管是前端開發…

怎樣將帶表格的圖片批量合并轉換成word表格?

注:本功能適用于V3.66以上版本的金鳴表格文字識別大師 在日常的辦公場景中,我們常常會遇到需要將帶有表格類的圖片識別成excel的需求。我們知道,普通的OCR軟件并不具備識別中文表格的功能,即使有,效果也強差人意&…

JSP:MVC

Web應用 一個好的Web應用: 功能完善 易于實現和維護 易于擴展等 的體系結構 一個Web應用通常分為兩個部分: m 1. 由界面設計人員完成的 表示層 (主要做網頁界面設計) m 2. 由程序設計人員實現的 行為層 (主要完成本…

SELinux零知識學習二十五、SELinux策略語言之類型強制(10)

接前一篇文章:SELinux零知識學習二十四、SELinux策略語言之類型強制(9) 二、SELinux策略語言之類型強制 3. 訪問向量規則 AV規則就是按照對客體類別的訪問許可指定具體含義的規則,SELinux策略語言目前支持四類AV規則: allow:表示允許主體對客體執行允許的操作。neveral…

2015年7月8日 Go生態洞察:Go、開源與社區

🌷🍁 博主貓頭虎(🐅🐾)帶您 Go to New World?🍁 🦄 博客首頁——🐅🐾貓頭虎的博客🎐 🐳 《面試題大全專欄》 🦕 文章圖文…

C#面試題3

1.請解釋一下C#中的并發編程和線程安全性。 并發編程是指在多線程環境下編寫代碼以實現并發執行的能力。C#提供了一些機制來支持并發編程,如線程、任務和并行循環等。線程安全性是指在多線程環境下,代碼能夠正確地處理共享數據并保持一致性。線程安全的代…

基于springboot實現大學生就業服務平臺系統項目【項目源碼】計算機畢業設計

基于springboot實現大學生就業服務平臺系統演示 Java技術 Java是由SUN公司推出,該公司于2010年被oracle公司收購。Java本是印度尼西亞的一個叫做爪洼島的英文名稱,也因此得來java是一杯正冒著熱氣咖啡的標識。Java語言在移動互聯網的大背景下具備了顯著…

企業必看的大數據安全極速傳輸解決方案

在這個大數據時代,企業在享受大數據帶來的便利同時,也面臨著巨大的挑戰,其中最主要的問題就是數據安全方面和傳輸方面,為了更好地滿足企業大數據傳輸的需求,小編將深入分析企業對于大數據傳輸面臨的挑戰和風險以及大數…

【elementui】el-popover在列表里循環使用,取消的doClose無效解決辦法

目錄 一、需求效果二、代碼詳情html方法接口 一、需求效果 在使用elementui的Popover 彈出框時&#xff0c;需求是在table列表里使用&#xff0c;循環出來&#xff0c;無法取消。 二、代碼詳情 html <el-table-column v-if"checkPermission([admin,user:resetPass…

【C++】標準模板庫STL作業(其二)

&#x1f383;個人專欄&#xff1a; &#x1f42c; 算法設計與分析&#xff1a;算法設計與分析_IT閆的博客-CSDN博客 &#x1f433;Java基礎&#xff1a;Java基礎_IT閆的博客-CSDN博客 &#x1f40b;c語言&#xff1a;c語言_IT閆的博客-CSDN博客 &#x1f41f;MySQL&#xff1a…

C 語言文件讀寫

C 語言文件讀寫 在本教程中&#xff0c;您將學習如何在C語言中處理文件。您將通過示例學習在C語言中使用fprintf()、fscanf()、fread()、fwrite()、fseek()等處理標準I/O。 文件是計算機存儲設備中用于存儲數據的容器。 為什么需要文件&#xff1f; 當程序終止時&#xff0…

vue2,vue3使用vuex

vuex vue的狀態管理器 1引入vuex npm install vuex2.創建store/index.js文件 在main.js引入 import { createStore } from vuexconst store createStore({state: () > ({})}) export default store3.state 核心, 用于定義數據 state: () > ({count: 0,name: 陸青,age:…

Py之wikipedia-api:wikipedia-api的簡介、安裝、使用方法之詳細攻略

Py之wikipedia-api&#xff1a;wikipedia-api的簡介、安裝、使用方法之詳細攻略 目錄 wikipedia-api的簡介 wikipedia-api的安裝 wikipedia-api的使用方法 1、 創建 Wikipedia并進行查詢 wikipedia-api的簡介 Wikipedia-API是一個易于使用的Python封裝&#xff0c;用于訪…

計算機是如何執行指令的

計算機組成 現在所說的計算機基本上都是馮諾依曼體系的計算機。其核心原理&#xff1a; 馮諾依曼計算的核心思想是將程序指令和數據以二進制形式存儲存儲在同一存儲器中&#xff0c;并使用相同的數據格式和處理方式來處理它們。這種存儲程序的設計理念使得計算機能夠以可編程…

如何從 C# 制作報表到 FastReport Cloud

眾所周知&#xff0c;我們的世界在不斷發展&#xff0c;新技術幾乎每天都會出現。如今&#xff0c;不再需要在辦公室內建立整個基礎設施、雇用人員來監控設備、處理該設備出現的問題和其他困難。 如今&#xff0c;越來越多的服務提供業務云解決方案&#xff0c;例如FastReport…