極大似然估計與貝葉斯定理

文章轉載自:https://blog.csdn.net/zengxiantao1994/article/details/72787849

極大似然估計-形象解釋看這篇文章:https://www.zhihu.com/question/24124998

貝葉斯定理-形象解釋看這篇文章:https://www.zhihu.com/question/19725590/answer/217025594

極大似然估計

? ? ? ? 以前多次接觸過極大似然估計,但一直都不太明白到底什么原理,最近在看貝葉斯分類,對極大似然估計有了新的認識,總結如下:

貝葉斯決策

? ? ? ? 首先來看貝葉斯分類,我們都知道經典的貝葉斯公式:

?

? ? ? ? 其中:p(w):為先驗概率,表示每種類別分布的概率;:類條件概率,表示在某種類別前提下,某事發生的概率;而為后驗概率,表示某事發生了,并且它屬于某一類別的概率,有了這個后驗概率,我們就可以對樣本進行分類。后驗概率越大,說明某事物屬于這個類別的可能性越大,我們越有理由把它歸到這個類別下。

? ? ? ? 我們來看一個直觀的例子:已知:在夏季,某公園男性穿涼鞋的概率為1/2,女性穿涼鞋的概率為2/3,并且該公園中男女比例通常為2:1,問題:若你在公園中隨機遇到一個穿涼鞋的人,請問他的性別為男性或女性的概率分別為多少?

? ? ? ? 從問題看,就是上面講的,某事發生了,它屬于某一類別的概率是多少?即后驗概率。

? ? ? ? 設:

? ? ? ? 由已知可得:

?

? ? ? ? 男性和女性穿涼鞋相互獨立,所以

(若只考慮分類問題,只需要比較后驗概率的大小,的取值并不重要)。

? ? ? ? 由貝葉斯公式算出:

???

問題引出

? ? ? ? 但是在實際問題中并不都是這樣幸運的,我們能獲得的數據可能只有有限數目的樣本數據,而先驗概率和類條件概率(各類的總體分布)都是未知的。根據僅有的樣本數據進行分類時,一種可行的辦法是我們需要先對先驗概率和類條件概率進行估計,然后再套用貝葉斯分類器。

? ? ? ? 先驗概率的估計較簡單,1、每個樣本所屬的自然狀態都是已知的(有監督學習);2、依靠經驗;3、用訓練樣本中各類出現的頻率估計。

? ? ? ? 類條件概率的估計(非常難),原因包括:概率密度函數包含了一個隨機變量的全部信息;樣本數據可能不多;特征向量x的維度可能很大等等。總之要直接估計類條件概率的密度函數很難。解決的辦法就是,把估計完全未知的概率密度轉化為估計參數。這里就將概率密度估計問題轉化為參數估計問題,極大似然估計就是一種參數估計方法。當然了,概率密度函數的選取很重要,模型正確,在樣本區域無窮時,我們會得到較準確的估計值,如果模型都錯了,那估計半天的參數,肯定也沒啥意義了。

重要前提

? ? ? ? 上面說到,參數估計問題只是實際問題求解過程中的一種簡化方法(由于直接估計類條件概率密度函數很困難)。所以能夠使用極大似然估計方法的樣本必須需要滿足一些前提假設。

? ? ? ??重要前提:訓練樣本的分布能代表樣本的真實分布。每個樣本集中的樣本都是所謂獨立同分布的隨機變量?(iid條件),且有充分的訓練樣本。

極大似然估計

? ? ? ? 極大似然估計的原理,用一張圖片來說明,如下圖所示:

?

? ? ? ? 總結起來,最大似然估計的目的就是:利用已知的樣本結果,反推最有可能(最大概率)導致這樣結果的參數值。

? ? ? ? 原理:極大似然估計是建立在極大似然原理的基礎上的一個統計方法,是概率論在統計學中的應用。極大似然估計提供了一種給定觀察數據來評估模型參數的方法,即:“模型已定,參數未知”。通過若干次試驗,觀察其結果,利用試驗結果得到某個參數值能夠使樣本出現的概率為最大,則稱為極大似然估計。

? ? ? ? 由于樣本集中的樣本都是獨立同分布,可以只考慮一類樣本集D,來估計參數向量θ。記已知的樣本集為:

?? 似然函數(linkehood function):聯合概率密度函數稱為相對于的θ的似然函數。

?

? ? ? ? 如果是參數空間中能使似然函數最大的θ值,則應該是“最可能”的參數值,那么就是θ的極大似然估計量。它是樣本集的函數,記作:

?

求解極大似然函數

? ? ? ? ML估計:求使得出現該組樣本的概率最大的θ值。

?

???????? 實際中為了便于分析,定義了對數似然函數:

??

? ? ? ? 1. 未知參數只有一個(θ為標量)

? ? ? ? 在似然函數滿足連續、可微的正則條件下,極大似然估計量是下面微分方程的解:

? ? ? ? 2.未知參數有多個(θ為向量)

? ? ? ? 則θ可表示為具有S個分量的未知向量:

?

???????? 記梯度算子:

?

???????? 若似然函數滿足連續可導的條件,則最大似然估計量就是如下方程的解。

?

?????????方程的解只是一個估計值,只有在樣本數趨于無限多的時候,它才會接近于真實值。

極大似然估計的例子

? ? ? ? 例1:設樣本服從正態分布,則似然函數為:

?

? ? ? ? 它的對數:

?

? ? ? ? 求導,得方程組:

?

? ? ? ? 聯合解得:

?

? ? ? ? 似然方程有唯一解:,而且它一定是最大值點,這是因為當時,非負函數。于是U和的極大似然估計為

?

? ? ? ? 例2:設樣本服從均勻分布[a, b]。則X的概率密度函數:

?

? ? ? ? 對樣本

?

? ? ? ? 很顯然,L(a,b)作為a和b的二元函數是不連續的,這時不能用導數來求解。而必須從極大似然估計的定義出發,求L(a,b)的最大值,為使L(a,b)達到最大,b-a應該盡可能地小,但b又不能小于,否則,L(a,b)=0。類似地a不能大過,因此,a和b的極大似然估計:

?

總結

? ? ? ? 求最大似然估計量的一般步驟:

? ? ? ? (1)寫出似然函數;

? ? ? ? (2)對似然函數取對數,并整理;

? ? ? ? (3)求導數;

? ? ? ? (4)解似然方程。

? ? ? ? 最大似然估計的特點:

? ? ? ? 1.比其他估計方法更加簡單;

? ? ? ? 2.收斂性:無偏或者漸近無偏,當樣本數目增加時,收斂性質會更好;

? ? ? ? 3.如果假設的類條件概率模型正確,則通常能獲得較好的結果。但如果假設模型出現偏差,將導致非常差的估計結果。

?

轉載于:https://www.cnblogs.com/wangdy0707/p/8872606.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/280557.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/280557.shtml
英文地址,請注明出處:http://en.pswp.cn/news/280557.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

艾媒:第三方應用商店形成BAT3爭霸格局

iiMedia Research(艾媒咨詢)近日發布的《2016Q2中國移動應用商店市場監測報告》,報告顯示,2016年第二季度,第三方移動應用商店用戶增長放緩,用戶規模逐漸飽和。同時,隨著豌豆莢宣布并入阿里移動事業群,中國…

編譯安裝內核

編譯安裝內核 升級內核到 linux-4.20.3.tar.xz 查看當前內核版本: [rootcentos7 data]#uname -r 3.10.0-862.el7.x86_64獲取內核源代碼包:www.kernel.org linux-4.20.3.tar.xz 實施步驟 1. 安裝編譯所需的工具 gcc ncurses-devel make(開發工…

layui 啟用禁用_在不啟用Apple Pay的情況下禁用煩人的Apple Pay通知

layui 啟用禁用iPhone/iPad: Not interested in Apple Pay, and tired of seeing notifications about it? You can disable them, but the option is hidden. iPhone / iPad:對Apple Pay不感興趣,又厭倦了看到有關它的通知? 您可以禁用它們…

數字孿生項目實戰,WPF與Unity結合開發之路(一)

數字孿生項目實戰,WPF與Unity結合開發之路(一)數字孿生項目實戰,WPF與Unity結合開發之路(一)作 者:水娃嗨大家好,我是一名骨灰級的WPF開發者,我叫水娃。這次主要是向大…

django17:importlib應用中間件代碼思想

轉載:https://www.cnblogs.com/alice-bj/articles/9276880.html 背景 仿django的中間件的編程思想 用戶可通過配置,選擇是否啟用某個組件/某個功能,只需要配置 eg:報警系統,發郵件,發微信 。。。 ( 根據字符串導入…

Python 全棧開發基礎

python面向對象 python異常處理 python網絡編程 python并發編程 臨時目錄 轉載于:https://www.cnblogs.com/fixdq/p/8883304.html

IBM連續兩年大數據市場占有率全球第一

ZDNet至頂網服務器頻道 04月22日 新聞消息:IBM 近日宣布,根據市場調研機構Wikibon最新研究報告《大數據供應商收益與市場預測》,IBM連續兩年實現大數據市場占有率第一,領跑報告中的70多家大數據供應商。同期,IBM年度報告也顯示&am…

idou老師教你學Istio06: 如何用istio實現流量遷移

流量遷移是流量管理的一個重要功能。istio提供的流量管理功能將流量從基礎設施擴展中解耦,支持動態請求路由,故障注入、超時重試、熔斷和流量遷移等。流量遷移的主要目的是將流量從微服務的某一版本的逐步遷移至另一個版本,如在新舊版本之間進…

用最少的代碼,寫一個完整MES項目(.NET6+WPF)

工業4.0時代,智能智造MES系統大行其道,然而基于.NET跨平臺的罕見!這里有一套《.NET6WPF企業級MES實戰》教程,基于.NET6跨平臺開發,實現了MES多核心功能,尤其是開發框架完整,非常適合復用。這里分…

django18:auth模塊

Auth模塊 執行數據庫遷移命令后,自動生產多個表。 django_session auth_user 直接訪問admin路由,需要輸入用戶名和密碼,就是參考auth_user表 管理員用戶才能進入 創建超級用戶 createsuperuser from django.contrib import auth1.校驗用…

hulu dpp_什么是直播電視的Hulu,它可以代替您的有線電視訂閱嗎?

hulu dppStreaming cable replacements are becoming a much more appealing option for cable cutters across the board, with more choices available than ever before. Hulu’s Live TV option is a relative newcomer to the scene, but is it worth it? 對于全系列的電…

suse linux ssh遠程無法訪問問題

當正常安裝完Suse Linux Enterprise Server 11 sp1 時,無法通過SecureCRT或者PuTTY之類的終端程序進行連接。 折騰了一下,發現問題所在: 1、 需要關閉防火墻,如下圖在YAST里可以關閉,也可以使用下面命令行的方式&…

4.Linux的目錄結構

Linux的目錄結構 (1)"/"目錄 Linux文件系統的入口,也是出于最高一級的目錄 (2)"/bin" 基礎系統所需要的那些命令位于此目錄。也是最小系統所需要命令;比如ls、cp、mkdir等命令;功能和/usr/bin類似,這個目錄中…

Jade —— 源于 Node.js 的 HTML 模板引擎

2013-12-11 發布Jade —— 源于 Node.js 的 HTML 模板引擎 開源項目介紹 web 模板引擎 node.js jade 207.8k 次閱讀 讀完需要 69 分鐘54Jade 是一個高性能的模板引擎,它深受 Haml 影響,它是用 JavaScript 實現的,并且可以供 Node…

詐騙者如何偽造電子郵件地址,以及如何分辨

Consider this a public service announcement: Scammers can forge email addresses. Your email program may say a message is from a certain email address, but it may be from another address entirely. 考慮這是一項公共服務公告:詐騙者可以偽造電子郵件地…

如何對整個 WPF 應用程序進行灰度

如何對整個 WPF 應用程序進行灰度控件名:GrayscaleEffect作 者:WPFDevelopersOrg - 驚鏵原文鏈接[1]:https://github.com/WPFDevelopersOrg/WPFDevelopers 簡易源碼[2]框架使用.NET40;Visual Studio 2019;如果要實現灰度第一反是…

django19:項目開發流程

參考:https://www.bilibili.com/video/BV1QE41147hU?p831&spm_id_frompageDriver

React Native - FlexBox彈性盒模型

FlexBox布局 1. 什么是FlexBox布局? 彈性盒模型(The Flexible Box Module),又叫FlexBox,意為"彈性布局",旨在通過彈性的方式來對齊和分布容器中內容的空間,使其能適應不同屏幕,為盒模型提供最大的靈活性. ??Flex布局主要思想是: 讓容器有能力讓其子項目能夠改變其…

java虛擬機讀寫其他進程的數據

在java中,process類提供了如下3個方法,用于讓程序和其他子進程進行通信。 InputStream getErrorStream():獲取子進程的錯誤流。 InputStream getInputStream():獲取子進程的輸入流。…

release8_如何在Windows 8 Release Preview中將Chrome用作Metro瀏覽器

release8Windows 8 allows third-party browser to replace Internet Explorer in the Metro environment — except on Windows RT. You can use Google Chrome in Metro today, and Firefox for Metro is on the way. Windows 8允許第三方瀏覽器在Metro環境中替換Internet Ex…