Beta分布Dirichlet分布

目錄

  • Beta分布
  • Dirichlet分布
  • Beta分布&Dirichlet分布
  • 從Dirichlet分布生成Beta樣本
  • Beta分布&Dirichlet分布應用



Beta分布

Beta分布是定義在區間 [ 0 , 1 ] [0, 1] [0,1]上的連續概率分布,通常用于模擬概率或比例的隨機變量。Beta分布的概率密度函數(PDF)如下:

f ( x ; α , β ) = Γ ( α + β ) Γ ( α ) Γ ( β ) x α ? 1 ( 1 ? x ) β ? 1 f(x; \alpha, \beta) = \frac{\Gamma(\alpha + \beta)}{\Gamma(\alpha)\Gamma(\beta)}x^{\alpha - 1}(1 - x)^{\beta - 1} f(x;α,β)=Γ(α)Γ(β)Γ(α+β)?xα?1(1?x)β?1其中:

  • x x x是隨機變量,取值范圍在 [ 0 , 1 ] [0, 1] [0,1] 之間。
  • α \alpha α β \beta β是形狀參數,它們都是正實數 ( α > 0 , β > 0 ) ( \alpha > 0, \beta > 0 ) (α>0,β>0
  • Γ \Gamma Γ是伽馬函數,它是階乘函數在實數與復數域上的擴展。

Beta分布的概率密度函數可以進一步簡化為:

f ( x ; α , β ) = x α ? 1 ( 1 ? x ) β ? 1 B ( α , β ) f(x; \alpha, \beta) = \frac{x^{\alpha - 1}(1 - x)^{\beta - 1}}{B(\alpha, \beta)} f(x;α,β)=B(α,β)xα?1(1?x)β?1?

其中 ( B(\alpha, \beta) ) 是Beta函數,定義為:

B ( α , β ) = Γ ( α ) Γ ( β ) Γ ( α + β ) B(\alpha, \beta) = \frac{\Gamma(\alpha)\Gamma(\beta)}{\Gamma(\alpha + \beta)} B(α,β)=Γ(α+β)Γ(α)Γ(β)?

Beta函數是兩個伽馬函數的比值,它確保了概率密度函數的積分總和為1。


Dirichlet分布

Dirichlet分布是定義在K維實數向量上的多項分布的共軛先驗,通常用于模擬多類別分布。Dirichlet分布的概率密度函數(PDF)如下:

f ( x ; α ) = Γ ( ∑ i = 1 K α i ) ∏ i = 1 K Γ ( α i ) ∏ i = 1 K x i α i ? 1 f(\mathbf{x}; \boldsymbol{\alpha}) = \frac{\Gamma\left(\sum_{i=1}^K \alpha_i\right)}{\prod_{i=1}^K \Gamma(\alpha_i)} \prod_{i=1}^K x_i^{\alpha_i - 1} f(x;α)=i=1K?Γ(αi?)Γ(i=1K?αi?)?i=1K?xiαi??1?

其中:

  • x = ( x 1 , x 2 , … , x K ) \mathbf{x} = (x_1, x_2, \ldots, x_K) x=(x1?,x2?,,xK?)是隨機變量,每個 x i x_i xi?取值范圍在 [ 0 , 1 ] [0, 1] [0,1] 之間,并且 ∑ i = 1 K x i = 1 \sum_{i=1}^K x_i = 1 i=1K?xi?=1
  • α = ( α 1 , α 2 , … , α K ) \boldsymbol{\alpha} = (\alpha_1, \alpha_2, \ldots, \alpha_K) α=(α1?,α2?,,αK?)是形狀參數,每個 α i \alpha_i αi?都是正實數 ( α i > 0 ) ( \alpha_i > 0 ) (αi?>0)
  • Γ \Gamma Γ是伽馬函數。

Dirichlet分布的概率密度函數可以進一步簡化為:

f ( x ; α ) = ∏ i = 1 K x i α i ? 1 Dir ( α ) f(\mathbf{x}; \boldsymbol{\alpha}) = \frac{\prod_{i=1}^K x_i^{\alpha_i - 1}}{\text{Dir}(\boldsymbol{\alpha})} f(x;α)=Dir(α)i=1K?xiαi??1??

其中 ( \text{Dir}(\boldsymbol{\alpha}) ) 是Dirichlet函數,定義為:

Dir ( α ) = Γ ( ∑ i = 1 K α i ) ∏ i = 1 K Γ ( α i ) \text{Dir}(\boldsymbol{\alpha}) = \frac{\Gamma\left(\sum_{i=1}^K \alpha_i\right)}{\prod_{i=1}^K \Gamma(\alpha_i)} Dir(α)=i=1K?Γ(αi?)Γ(i=1K?αi?)?

Dirichlet函數確保了概率密度函數的積分總和為1。


Beta分布&Dirichlet分布

  • Beta分布和Dirichlet分布的概率密度函數都涉及到了伽馬函數 ( Γ ) (\Gamma) (Γ)。這種函數在數學中非常重要,特別是在處理與概率和統計相關的問題時。

  • 兩者的概率密度函數都具有冪函數的形式,其中Beta分布是一維的,而Dirichlet分布是多維的。Dirichlet分布可以看作是Beta分布的多維推廣。


從Dirichlet分布生成Beta樣本

  • Dirichlet分布的一個有趣性質是,它可以用于生成Beta分布的樣本。具體來說,如果我們從Dirichlet分布 Dir ( α ) \text{Dir}(\boldsymbol{\alpha}) Dir(α) 中生成一個樣本 x = ( x 1 , x 2 , … , x K ) \mathbf{x} = (x_1, x_2, \ldots, x_K) x=(x1?,x2?,,xK?),那么對于任意 i i i j j j ( i ≠ j ) (i \neq j) (i=j),比值 x i x i + x j \frac{x_i}{x_i + x_j} xi?+xj?xi??服從參數為 α i \alpha_i αi? α j \alpha_j αj?的Beta分布。



Beta分布&Dirichlet分布應用

  • Beta分布:常用于貝葉斯統計中,作為二項分布的共軛先驗。它也可以用于建模概率或比例,例如在信用評分、市場研究等領域。
  • Dirichlet分布:常用于貝葉斯統計中,作為多項分布的共軛先驗。它也可以用于建模多類別分布,例如在主題模型、聚類分析等領域。

這些分布的概率密度函數在貝葉斯統計和機器學習中非常重要,因為它們提供了一種自然的方式來表示和處理概率分布。



本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/83637.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/83637.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/83637.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

嵌入式系統中常用的開源協議

目錄 1、GNU通用公共許可證(GPL) 2、GNU寬松通用公共許可證(LGPL) 3、MIT許可證 4、Apache許可證2.0 5、BSD許可證 6、如何選擇合適的協議 在嵌入式系統開發中,開源軟件的使用已成為主流趨勢。從物聯網設備到汽車…

告別延遲,擁抱速度:存儲加速仿真應用的解決方案【1】

需求分析 現代仿真(如CFD流體動力學、FEA結構分析、電磁仿真、氣候模擬、自動駕駛場景仿真、芯片設計等)會產生PB級甚至EB級的數據。海量數據的生成、處理和存儲,主要體現在以下幾個關鍵方面: 數據量爆炸式增長:高分…

vue封裝gsap自定義動畫指令

1、指令文件封裝 import { gsap } from gsap;// 動畫類型配置 const ANIMATION_TYPES {// 縮放scale: {from: { scale: 0.5, opacity: 0 },to: { scale: 1, opacity: 1 },hide: { scale: 0.5, opacity: 0 },},// 透明度fade: {from: { opacity: 0 },to: { opacity: 1, ease: …

HTTP 如何升級成 HTTPS

有一個自己的項目需要上線,域名解析完成后,發現只能使用 http 協議,這在瀏覽器上會限制,提示用戶不安全,所以需要把 HTTP 升級成 HTTPS 協議,但又不想花錢。 前提條件: 已經配置好 Nginx 服務器…

測試面試題總結一

目錄 列表、元組、字典的區別 nvicat連接出現問題如何排查 mysql性能調優 python連接mysql數據庫方法 參數化 pytest.mark.parametrize 裝飾器 list1 [1,7,4,5,5,6] for i in range(len(list1): assert list1[i] < list1[i1] 這段程序有問題嘛&#xff1f; pytest.i…

[藍橋杯]密文搜索

密文搜索 題目描述 福爾摩斯從 X 星收到一份資料&#xff0c;全部是小寫字母組成。 他的助手提供了另一份資料&#xff1a;許多長度為 8 的密碼列表。 福爾摩斯發現&#xff0c;這些密碼是被打亂后隱藏在先前那份資料中的。 請你編寫一個程序&#xff0c;從第一份資料中搜…

打卡第36天:模型可視化以及推理

知識點回顧&#xff1a; 1.三種不同的模型可視化方法&#xff1a;推薦torchinfo打印summary權重分布可視化 2.進度條功能&#xff1a;手動和自動寫法&#xff0c;讓打印結果更加美觀 3.推理的寫法&#xff1a;評估模式 作業&#xff1a;調整模型定義時的超參數&#xff0c;對…

8天Python從入門到精通【itheima】-68(元組)

目錄 65節——元組的定義和操作 1.學習目標 2.為什么要學習元組 3.元組的定義 4.定義元組的注意事項 5.元組的嵌套 6.元組的相關操作 【1】index方法 【2】count方法 【3】len方法 7.元組的遍歷 【1】while循環進行元組的遍歷 【2】for循環進行元組的變量 Python …

鏈表題解——環形鏈表【LeetCode】

141. 環形鏈表 方法一 核心思想&#xff1a; 使用一個集合 seen 來記錄已經訪問過的節點。遍歷鏈表&#xff0c;如果當前節點已經存在于集合中&#xff0c;說明鏈表存在環&#xff1b;否則&#xff0c;將當前節點添加到集合中&#xff0c;繼續遍歷。如果遍歷結束&#xff08;h…

【免費數據】1980-2022年中國2384個站點的水質數據

水&#xff0c;是生命之源&#xff0c;關乎著地球上每一個生物的生存與發展。健康的水生生態系統維持著整個水生態的平衡與活力&#xff1b;更是確保人類能持續獲得清潔水源的重要保障。水質數據在水質研究、海洋生物量測算以及生物多樣性評估等諸多關鍵領域都扮演著舉足輕重的…

分享推薦高精度磁阻式磁編碼器芯片

磁編碼器其通過感應旋轉磁場來實現角度、轉速的測量&#xff0c;因此&#xff0c;相較于傳統的光編碼器&#xff0c;磁編碼器對粉塵、污垢和油脂等污染物有很強的耐受性&#xff0c;即使在較為惡劣的環境中仍能夠保持高分辨率與檢測精度&#xff0c;安裝和維護簡捷方便&#xf…

Spring AI 項目實戰(四):Spring Boot + AI + DeepSeek 超參數優化——智能化機器學習平臺(附完整源碼)

系列文章 序號文章名稱1Spring AI 項目實戰&#xff08;一&#xff09;&#xff1a;Spring AI 核心模塊入門2Spring AI 項目實戰&#xff08;二&#xff09;&#xff1a;Spring Boot AI DeepSeek 深度實戰&#xff08;附完整源碼&#xff09;3Spring AI 項目實戰&#xff08…

高效VLM:VisionZip

論文&#xff1a;[2412.04467] VisionZip: Longer is Better but Not Necessary in Vision Language Models github&#xff1a;https://github.com/dvlab-research/VisionZip LLaVA論文&#xff1a;https://arxiv.org/abs/2310.03744 LLaVA倉庫&#xff1a;https://github.…

華為設備OSPF配置與實戰指南

一、基礎配置架構 sysname HUAWEI-ABR ospf 100 router-id 1.1.1.1area 0.0.0.0network 10.1.1.0 0.0.0.255 # 將接口加入區域0 interface GigabitEthernet0/0/1ospf enable 100 area 0.0.0.0 # 華為支持點分十進制區域號bandwidth-reference 10000 # 設置10Gbps參考帶寬…

區塊鏈架構深度解析:從 Genesis Block 到 Layer 2

# 區塊鏈架構深度解析&#xff1a;從 Genesis Block 到 Layer 2 目錄 一、Genesis Block&#xff1a;區塊鏈的起點 二、Layer 0&#xff1a;區塊鏈的底層網絡架構 三、Layer 1&#xff1a;核心協議層 &#x1f680; 四、Layer 2&#xff1a;擴展性解決方案 五、未來展望&a…

【位運算】丟失的數字(easy)

34. 丟失的數字&#xff08;easy&#xff09; 題?描述&#xff1a;方法一&#xff1a;排序解法&#xff08;位運算&#xff09;&#xff1a;C 算法代碼&#xff1a;Java 算法代碼&#xff1a; 題?鏈接&#xff1a; 268. 丟失的數字 題?描述&#xff1a; 給定?個包含 [0, n…

如何通過RL真正提升大模型的推理能力?NVIDIA提出長期強化學習訓練框架ProRL

原文&#xff1a;https://mp.weixin.qq.com/s/QLFKvb8Ol3CX9uWKBXSrow 論文&#xff1a;ProRL: Prolonged Reinforcement Learning Expands Reasoning Boundaries in Large Language Models Abs&#xff1a;https://arxiv.org/abs/2505.24864 權重下載&#xff1a;https://hugg…

ORM 框架的優缺點分析

ORM 框架的優缺點分析 一、ORM 框架概述 ORM(Object-Relational Mapping)是一種將關系型數據庫與面向對象編程進行映射的技術框架。它通過將數據庫表映射為編程語言中的類,將記錄映射為對象,將字段映射為屬性,實現了用面向對象的方式操作數據庫。 核心價值:ORM 在數據庫和…

1. 數據庫基礎

1.1 什么是數據庫 ? mysql 本質是一種網絡服務, 是基于 C(mysql) S(mysqld)的 網絡服務. 存儲數據用文件就可以了&#xff0c;為什么還要弄個數據庫&#xff1f;文件保存數據存在以下缺點&#xff1a; 文件的安全性問題。文件不利于數據查詢和管理。文件不利于存儲海量數據。…

go語言學習 第5章:函數

第5章&#xff1a;函數 函數是編程中不可或缺的一部分&#xff0c;它封裝了一段可重復使用的代碼&#xff0c;用于執行特定的任務。在Go語言中&#xff0c;函數同樣扮演著重要的角色。本章將詳細介紹Go語言中函數的定義、調用、參數傳遞、返回值處理以及一些高級特性&#xff…