【機器學習理論】樸素貝葉斯網絡

基礎知識:
先驗概率:對某個事件發生的概率的估計。可以是基于歷史數據的估計,可以由專家知識得出等等。一般是單獨事件概率。

后驗概率:指某件事已經發生,計算事情發生是由某個因素引起的概率。一般是一個條件概率。

條件概率:條件事件發生后,另一個事件發生的概率。一般的形式為 P ( B ∣ A ) P(B|A) P(BA),表示 A A A發生的條件下 B B B發生的概率。
P ( B ∣ A ) = P ( A B ) P ( A ) P(B|A) = \frac {P(AB)}{P(A)} P(BA)=P(A)P(AB)?
貝葉斯公式基于先驗概率,計算后驗概率的方法;公式為:
P ( A ∣ B ) = P ( B ∣ A ) ? P ( A ) P ( B ) P(A|B) = \frac {P(B|A) \cdot P(A)}{P(B)} P(AB)=P(B)P(BA)?P(A)?

  • P ( A ∣ B ) P(A∣B) P(AB): 在事件? B B B?發生的條件下,事件? A A A?發生的概率(后驗概率)。
  • P ( B ∣ A ) P(B | A) P(BA):在事件 A A A 發生的條件下,事件 B B B 的發生概率(似然概率)。
  • P ( A ) P(A) P(A):事件 A A A 發生的先驗概率(先驗知識)。
  • P ( B ) P(B) P(B):事件 B B B 發生的總概率。

貝葉斯公式可以從條件概率和全概率公式推導得出:

  1. 條件概率定義:
    P ( A ∣ B ) = P ( A ∩ B ) P ( B ) , P ( B ∣ A ) = P ( A ∩ B ) P ( A ) P(A | B) = \frac {P(A \cap B)}{P(B)}, P(B|A) = \frac {P(A \cap B)}{P(A)} P(AB)=P(B)P(AB)?,P(BA)=P(A)P(AB)?
  2. 公式聯立:
    P ( A ∩ B ) = P ( B ∣ A ) ? P ( A ) = P ( A ∣ B ) ? P ( B ) P(A \cap B) = P(B|A) \cdot P(A) = P(A | B) \cdot P(B) P(AB)=P(BA)?P(A)=P(AB)?P(B)
  3. 整理得到貝葉斯公式:
    P ( A ∣ B ) = P ( B ∣ A ) P ( A ) P ( B ) P(A | B) = \frac {P(B | A) P(A)}{P(B)} P(AB)=P(B)P(BA)P(A)?
  • 貝葉斯公式:將先驗概率? P ( A ) P(A) P(A)、似然概率? P ( B ∣ A ) P(B∣A) P(BA)?和證據? P ( B ) P(B) P(B)?結合,計算后驗概率 P ( A ∣ B ) P(A∣B) P(AB)

樸素貝葉斯做出了一個假設”屬性條件獨立假設“:對所有已知標簽的樣本,假設每個屬性獨立地對標簽結果產生影響。(這是一個很強的條件)

假設樣本為: x = { a 1 , a 2 , . . . , a d } x=\{a_{1}, a_{2}, ..., a_{d} \} x={a1?,a2?,...,ad?},label為 Y = { c 1 , c 2 , c 3 , . . . , c n } Y = \{c_{1}, c_{2}, c_{3}, ...,c_{n} \} Y={c1?,c2?,c3?,...,cn?};則計算這樣一個樣本 x x x 的所屬類別的公式為:
P ( c k ∣ x ) = max ? { P ( c 1 ∣ x ) , P ( c 2 ∣ x ) , P ( c 3 ∣ x ) , . . . , P ( c n ∣ x ) } P(c_{k} | x) = \max \{ P(c_{1} |x), P(c_{2} | x), P(c_{3} | x), ..., P(c_{n} |x)\} P(ck?x)=max{P(c1?x),P(c2?x),P(c3?x),...,P(cn?x)}
基于條件獨立假設;可以得到
P ( c ∣ x ) = P ( c ) P ( x ∣ c ) P ( x ) = P ( c ) P ( x ) ∏ i = 1 d P ( x i ∣ c ) P(c|x) = \frac {P(c)P(x|c)}{P(x)} = \frac {P(c)}{P(x)} \prod_{i=1}^{d} P(x_{i}|c) P(cx)=P(x)P(c)P(xc)?=P(x)P(c)?i=1d?P(xi?c)
其中 d d d為屬性數目, x i x_{i} xi? x x x 在第 i i i 個屬性上的取值。
我們重寫上述公式:
h n b ( x ) = max ? { P ( c 1 ∣ x ) , P ( c 2 ∣ x ) , P ( c 3 ∣ x ) , . . . , P ( c n ∣ x ) } = arg ? max ? c ∈ Y P ( c ) P ( x ) ∏ i = 1 d P ( x i ∣ C ) = arg ? max ? c ∈ Y P ( c ) ∏ i = 1 d P ( x i ∣ C ) \begin{align} h_{nb}(x) &= \max \{ P(c_{1} |x), P(c_{2} | x), P(c_{3} | x), ..., P(c_{n} |x)\} \\ &= \arg \max_{c \in Y} \frac {P(c)}{P(x)} \prod_{i=1}^{d}P(x_{i} | C) \\ &= \arg \max_{c \in Y} P(c) \prod_{i=1}^{d}P(x_{i} | C) \end{align} hnb?(x)?=max{P(c1?x),P(c2?x),P(c3?x),...,P(cn?x)}=argcYmax?P(x)P(c)?i=1d?P(xi?C)=argcYmax?P(c)i=1d?P(xi?C)?? D c D_{c} Dc? 表示訓練集 D D D 中第 c c c 類樣本組成的集合,若有充足的獨立同分布樣本,則可以容易地估計出類別的先驗概率:
P ( c ) = ∣ D c ∣ ∣ D ∣ P(c) = \frac {|D_{c}|}{|D|} P(c)=DDc??
對于離散屬性而言,令 D c , x i D_{c, x_{i}} Dc,xi?? 表示 D c D_{c} Dc? 中第 i i i 個屬性上取值為 x i x_{i} xi? 的樣本組成的集合,則條件概率 P ( x i ∣ c ) P(x_{i} |c) P(xi?c) 可估計為:
P x i ∣ c = ∣ D c , x i ∣ ∣ D c ∣ P{x_{i} | c} = \frac {|D_{c, x_{i}}|}{|D_{c}|} Pxi?c=Dc?Dc,xi???
對于連續屬性可考慮概率密度函數,假定 p ( x i ∣ c ) ~ N ( μ c , i , σ c , i 2 ) p(x_{i}|c) \sim \mathcal{N}(\mu _{c, i}, \sigma _{c,i}^{2}) p(xi?c)N(μc,i?,σc,i2?)d,其中 μ c , i \mu_{c, i} μc,i? σ c , i 2 \sigma_{c, i}^{2} σc,i2?分別是第 c c c 類樣本在第 i i i 個屬性上取值的均值和方差,則有:
p ( x i ∣ c ) = 1 2 π σ c , i exp ? ( ? ( x i ? μ c , i ) 2 2 σ c , i 2 ) p(x_{i} | c) = \frac {1}{\sqrt{2 \pi} \sigma_{c, i}} \exp (- \frac {(x_{i}-\mu_{c, i})^2}{2 \sigma_{c, i}^{2}}) p(xi?c)=2π ?σc,i?1?exp(?2σc,i2?(xi??μc,i?)2?)

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/67668.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/67668.shtml
英文地址,請注明出處:http://en.pswp.cn/web/67668.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

Flutter 新春第一彈,Dart 宏功能推進暫停,后續專注定制數據處理支持

在去年春節,Flutter 官方發布了宏(Macros)編程的原型支持, 同年的 5 月份在 Google I/O 發布的 Dart 3.4 宣布了宏的實驗性支持,但是對于 Dart 內部來說,從啟動宏編程實驗開始已經過去了幾年,但…

計算機組成原理——存儲系統(一)

在人生的道路上,成功與失敗交織成一幅豐富多彩的畫卷。不論我們是面對勝利的喜悅,還是遭遇失敗的痛苦,都不能放棄對夢想的追求。正是在這種追求中,我們不斷地超越自我,不斷地突破自己的極限。只有勇往直前,…

前端知識速記:節流與防抖

前端知識速記:節流與防抖 什么是防抖? 防抖是一種控制事件觸發頻率的方法,通常用于處理用戶頻繁觸發事件的場景。防抖的核心思想是將多個連續觸發事件合并為一個事件,以減少執行次數。它在以下場景中特別有效: 輸入…

無人機圖傳模塊 wfb-ng openipc-fpv,4G

openipc 的定位是為各種模塊提供底層的驅動和linux最小系統,openipc 是采用buildroot系統編譯而成,因此二次開發能力有點麻煩。為啥openipc 會用于無人機圖傳呢?因為openipc可以將現有的網絡攝像頭ip-camera模塊直接利用起來,從而…

藍橋杯例題一

不管遇到多大的困難,我們都要堅持下去。每一次挫折都是我們成長的機會,每一次失敗都是我們前進的動力。路漫漫其修遠兮,吾將上下而求索。只有不斷努力奮斗,才能追逐到自己的夢想。不要害怕失敗,害怕的是不敢去嘗試。只…

【JavaEE進階】圖書管理系統 - 壹

目錄 🌲序言 🌴前端代碼的引入 🎋約定前后端交互接口 🚩接口定義 🍃后端服務器代碼實現 🚩登錄接口 🚩圖書列表接口 🎄前端代碼實現 🚩登錄頁面 🚩…

【算法設計與分析】實驗8:分支限界—TSP問題

目錄 一、實驗目的 二、實驗環境 三、實驗內容 四、核心代碼 五、記錄與處理 六、思考與總結 七、完整報告和成果文件提取鏈接 一、實驗目的 掌握分支界限求解問題的思想;針對不同的問題,能夠利用分支界限法進行問題拆分和求解以及時間復雜度分析…

【3】阿里面試題整理

[1]. ES架構,如何進行路由以及選主 路由:在Elasticsearch(ES)中,默認的路由算法是基于文檔的_id。具體來說,Elasticsearch會對文檔的_id進行哈希計算,然后對分片數量取模,以確定該文…

【Linux】opencv在arm64上提示找不到libjasper-dev

解決opencv在arm64上提示找不到libjasper-dev的問題。 本文首發于?慕雪的寒舍 問題說明 最近我在嘗試編譯opencv,安裝依賴項libjasper1和libjasper-dev的時候就遇到了這個問題。在amd64平臺上,我們可以通過下面的命令安裝(ubuntu18.04&…

【數據結構】_時間復雜度相關OJ(力扣版)

目錄 1. 示例1:消失的數字 思路1:等差求和 思路2:異或運算 思路3:排序+二分查找 2. 示例2:輪轉數組 思路1:逐次輪轉 思路2:三段逆置(經典解法) 思路3…

基于微信小程序的電子商城購物系統設計與實現(LW+源碼+講解)

專注于大學生項目實戰開發,講解,畢業答疑輔導,歡迎高校老師/同行前輩交流合作?。 技術范圍:SpringBoot、Vue、SSM、HLMT、小程序、Jsp、PHP、Nodejs、Python、爬蟲、數據可視化、安卓app、大數據、物聯網、機器學習等設計與開發。 主要內容:…

【linux】Linux 常見目錄特性、權限和功能

目錄特性默認權限主要功能/用途/根目錄,所有目錄的起點755文件系統的頂層目錄,包含所有其他子目錄和文件/bin基礎二進制命令目錄(系統啟動和修復必需的命令)755存放所有用戶可用的基本命令(如 ls, cp, bash 等&#xf…

docker直接運行arm下的docker

運行環境是樹莓派A 處理器是 arm32v6 安裝了docker,運行lamp 編譯安裝php的時候發現要按天來算,于是用電腦vm下的Ubuntu系統運行arm的docker 然后打包到a直接導入運行就可以了 第一種方法 sudo apt install qemu-user-static 導入直接運行就可以了…

計算機網絡一點事(22)

地址解析協議ARP ARP:查詢Mac地址 ARP表(ARP緩存):記錄映射關系,一個數據結構,定期更新ARP表 過程:請求分組,響應分組 動態主機配置協議DHCP 分配IP地址,配置默認網關…

tomcat核心組件及原理概述

目錄 1. tomcat概述 1.1 概念 1.2 官網地址 2. 基本使用 2.1下載 3. 整體架構 3.1 核心組件 3.2 從web.xml配置和模塊對應角度 3.3 如何處理請求 4. 配置JVM參數 5. 附錄 1. tomcat概述 1.1 概念 什么是tomcat Tomcat是一個開源、免費、輕量級的Web服務器。 Tomca…

科技快訊 | OpenAI首次向免費用戶開放推理模型;特朗普與黃仁勛會面;雷軍回應“10后小學生深情表白小米SU7”

不用開口:谷歌 AI 幫你致電商家,價格、預約一鍵搞定 谷歌在1月30日推出Search Labs中的“Ask for Me”實驗性功能,用戶可利用AI代替自己致電商家咨詢價格和服務。該功能已與美汽車修理廠和美甲沙龍店合作,用戶需加入Search Labs并…

帆軟 FCA -業務分析師認證學習

帆軟 FCA -業務分析師認證學習 認證概述 適合人群 企業中有需求管理、指標梳理、業務邏輯梳理、項目規劃等需求的人員,想提升綜合數據能力、推進數據應用落地的業務/IT骨干。 具體-FCA-業務分析理論 考試要求: FCA-業務分析理論考試- 費用&#xff1a…

Vue.js路由管理與自定義指令深度剖析

Vue.js 是一個強大的前端框架,提供了豐富的功能來幫助開發者構建復雜的單頁應用(SPA)。本文將詳細介紹 Vue.js 中的自定義指令和路由管理及導航守衛。通過這些功能,你可以更好地控制視圖行為和應用導航,從而提升用戶體驗和開發效率。 1 自定義指令詳解 1.1 什么是自定義…

Maya軟件安裝步驟與百度網盤鏈接

軟件簡介: MAYA軟件是Autodesk旗下的著名三維建模和動畫軟件。maya軟件功能更為強大,體系更為完善,因此國內很多的三維動畫制作人員都開始轉向maya,maya軟件已成為三維動畫軟件的主流。 百度網盤鏈接: https://pan.baidu.com/s…

kamailio的部分模塊的解釋及代碼示例【文章由DeekSeek大模型提供】

以下是 Kamailio 中這些模塊的詳細說明及示例代碼: 1. tls.so 作用:提供 TLS 支持,用于加密 SIP 通信。示例:loadmodule "tls.so" modparam("tls", "certificate", "/etc/kamailio/tls/serve…