期望,積分,均值,求和的關系

1. 回顧期望的定義

對于連續性隨機變量 X X X,期望為:
E X ~ f ( x ) [ X ] = ∫ Ω x f ( x ) d x E_{X\sim f(x)}[X] = \int_{\Omega}xf(x)dx EXf(x)?[X]=Ω?xf(x)dx
其中 f ( x ) f(x) f(x)概率密度函數 Ω \Omega Ω為概率密度函數的定義域。

對于離散型隨機變量 X X X,期望為:
E [ X ] = ∑ x x P ( X = x ) E[X] = \sum_x xP(X = x) E[X]=x?xP(X=x)
其中 P ( X = x ) P(X=x) P(X=x)表示隨機變量 X X X等于 x x x時的概率


2. 積分,期望,求和,均值

然而在機器學習當中,我們常常會發現這種等式,它將求期望,求和,積分統一了起來:
E ( X ) = ∑ x x p ( x ) = ∫ x p ( x ) d x (1) E(X) = \sum_x xp(x) = \int xp(x)dx \tag1 E(X)=x?xp(x)=xp(x)dx(1)
實際上這種寫法是不嚴謹的。如果我們理解了本文開頭部分就會發現,連等式第二,第三項中的 p ( x ) p(x) p(x)表達的含義是不一樣的。第二項的 p ( x ) p(x) p(x)表達的是 x x x事件發生的概率(或者稱為隨機變量 X X X等于 x x x概率),而第三項的 p ( x ) p(x) p(x)則是概率密度函數

那么為什么在求期望時,能夠把求和與積分統一起來(第二項和第三項)?我們可以回顧一下概率密度函數的意義。

定義: f ( x ) f(x) f(x)為概率密度函數, ∫ a b f ( x ) d x \int^b_a f(x)dx ab?f(x)dx表示隨機變量 X X X屬于 [ a , b ] [a,b] [a,b]區間的概率。

2.1. 期望與求積分,求均值的關系:

為了一般性,我們考慮對函數 F ( x ) F(x) F(x)求期望,其中 x x x服從概率密度函數 f ( x ) f(x) f(x)
E X ~ f ( x ) [ F ( X ) ] = ∫ Ω F ( x ) f ( x ) d x E_{X \sim f(x)}[F(X)] = \int_\Omega F(x)f(x)dx EXf(x)?[F(X)]=Ω?F(x)f(x)dx
Ω \Omega Ω拆分成多個無窮小的區間 Ω i \Omega_i Ωi?,在每個無窮小區間內,我們認為 F ( x ) F(x) F(x)不變,因此可以視為常數
∫ Ω F ( x ) f ( x ) d x = ∑ i F ( x i ) ∫ Ω i f ( x ) d x (2) \int_\Omega F(x)f(x)dx = \sum_i F(x_i)\int_{\Omega_i}f(x)dx \tag2 Ω?F(x)f(x)dx=i?F(xi?)Ωi??f(x)dx(2)
同時根據概率密度函數的定義, ∫ Ω i f ( x ) d x \int_{\Omega_i}f(x)dx Ωi??f(x)dx即為: x ∈ Ω i x \in \Omega_i xΩi?這個區間的概率,記為 p ( x i ) p(x_i) p(xi?)。由于區間是無窮小的,我們可以直接近似隨機變量 X = x i X=x_i X=xi?這一事件發生的概率

因此 ( 2 ) (2) (2)式又可以寫做:
∫ Ω F ( x ) f ( x ) d x = ∑ i F ( x i ) ∫ Ω i f ( x ) d x = ∑ i n F ( x i ) p ( x i ) = ∑ i n F ( x i ) N ( x i ) N = 1 N ∑ i n F ( x i ) N ( x i ) \begin{align*} \int_\Omega F(x)f(x)dx & = \sum_i F(x_i)\int_{\Omega_i}f(x)dx \\ & = \sum_i^n F(x_i)p(x_i) \\ & = \sum_i^n F(x_i) \frac{N(x_i)}{N} \\ & = \frac{1}{N}\sum_i^n F(x_i) N(x_i) \tag2 \end{align*} Ω?F(x)f(x)dx?=i?F(xi?)Ωi??f(x)dx=in?F(xi?)p(xi?)=in?F(xi?)NN(xi?)?=N1?in?F(xi?)N(xi?)?(2)?
其中 N N N為總實驗次數, N ( x i ) N(x_i) N(xi?)表示隨機實驗中,隨機變量 X = x i X = x_i X=xi?這一事件發生的次數。
我們可以發現 ( 2 ) (2) (2)式可以近似表示成: N N N次實驗中, F ( x ) F(x) F(x)取值之和的平均值。即 E X ~ f ( x ) [ F ( x ) ] E_{X\sim f(x)}[F(x)] EXf(x)?[F(x)]:在 x x x服從概率密度函數 f ( x ) f(x) f(x)的情況下的期望,或者說是 F ( x ) F(x) F(x)相對于概率密度函數 f ( x ) f(x) f(x)的期望(相對期望)。
由于 F ( x ) F(x) F(x)可以替換成任意以 x x x為自變量的函數,我們可以令 F ( x ) = x F(x)=x F(x)=x,即為 ( 1 ) (1) (1)式。

需要注意的是,求均值是對積分的近似表示,這是因為:

  1. 拆分的區間在實際計算的過程中,不可能是無窮小的,只能盡可能小。 對應于實際采樣/實驗的次數是有限的。
  2. 區間內的采樣不可能是完全均勻的:實際的實驗/采樣過程中,隨機變量 X X X有可能會傾向于取某一段區間內的值(對應于 X X X一直位于重復的 Ω i \Omega_i Ωi?),有些區間內的值可能一直無法取到。比如高斯分布, 3 σ 3 \sigma 3σ外的值很難取到。當然,增加重復實驗/采樣的次數可以緩解這個問題。

有人這里會說,既然 x x x一直位于重復的 Ω i \Omega_i Ωi?,那么我對區間 Ω \Omega Ω構造均勻分布,然后對這個均勻分布采樣不就行了?但是我們要注意, X ~ f ( x ) X \sim f(x) Xf(x),而 f ( x ) f(x) f(x)并不一定是這個對應的均勻分布。因此這種方式不可行。
當然,我們可以采用重要性采樣來解決某些值一直取不到的問題,感興趣的讀者可以自行查閱。

蒙特卡洛方法求積分,最樸素的手段就是定義一個在積分上下限這個區間上的均勻分布,在這個均勻分布上采樣,然后求均值。

因此,出現了求期望,可以把求積分,求和,求均值都聯系在一起。甚至于說,只要出現求積分,也可以與求均值,求和聯系在一起(蒙特卡洛積分)。

3. 總結

出現了這種期望的形式 E X ~ f ( x ) [ F ( X ) ] = ∫ F ( x ) f ( x ) d x E_{X \sim f(x)}[F(X)] = \int F(x)f(x)dx EXf(x)?[F(X)]=F(x)f(x)dx,其中 f ( x ) f(x) f(x)為概率密度函數。我們都可以用求和再求均值的方式來近似:
∫ F ( x ) f ( x ) d x = 1 N ∑ i N F ( x i ) \int F(x)f(x)dx = \frac{1}{N}\sum_i^N F(x_i) F(x)f(x)dx=N1?iN?F(xi?)
其中 N N N為總實驗次數, x i x_i xi?表示第 i i i次實驗隨機變量的取值。
也可以表示為:
∫ F ( x ) f ( x ) d x = ∑ i n F ( x i ) ? p ( x i ) \int F(x)f(x)dx = \sum_i^nF(x_i) \cdot p(x_i) F(x)f(x)dx=in?F(xi?)?p(xi?)
這里的 n n n表示隨機變量 X X X n n n個取值, p ( x i ) p(x_i) p(xi?)為隨機變量 X = x i X = x_i X=xi?的概率。上面兩個式子是完全等價的。但需要注意 x i x_i xi?的含義不一樣。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/87902.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/87902.shtml
英文地址,請注明出處:http://en.pswp.cn/web/87902.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

1.如何對多個控件進行高效的綁定 C#例子 WPF例子

使用ObservableCollection高效為多個控件綁定數據在WPF開發中,數據綁定是一個非常重要的功能,它允許我們將UI控件與數據源進行綁定,從而實現數據的自動更新。當需要為多個控件綁定數據時,使用ObservableCollection可以大大提高開發…

JSONLines和JSON數據格式使用教程

文章目錄 一、核心區別二、JSONLines 的優勢三、Python 中使用 JSONLines1. 寫入 JSONLines 文件2. 讀取 JSONLines 文件3. 處理大文件示例四、常見工具支持1. 命令行工具2. 編程語言庫五、適用場景選擇六、注意事項總結JSONLines(簡稱 jsonl 或 jl)和傳統 JSON 都是用于存儲…

鏈表算法之【反轉鏈表】

目錄 LeetCode-206題 LeetCode-206題 給定一個單鏈表的頭節點,請反轉鏈表,并返回反轉后的鏈表 class Solution {public ListNode reverseList(ListNode head) {// checkif (head null || head.next null)return head;// 雙指針ListNode p1 head;Li…

回溯題解——子集【LeetCode】輸入的視角(選或不選)

78. 子集 ? 一、算法邏輯講解(逐步思路) 邏輯講解: dfs(i):表示從下標 i 開始,做“選 or 不選”的子集構造。 終止條件 if i n: 到達數組末尾,表示一種完整子集構造完成。 把當前構造路徑…

使用Electron開發跨平臺本地文件管理器:從入門到實踐

在當今數字化時代,文件管理是每個計算機用戶日常工作中不可或缺的一部分。雖然操作系統都提供了自己的文件管理器,但開發一個自定義的文件管理器可以帶來更好的用戶體驗、特定功能的集成以及跨平臺的一致性。本文將詳細介紹如何使用Electron框架構建一個…

JBHI 2025 | 潛在擴散模型賦能胸部X射線骨抑制

Abstract: 肺部疾病是全球健康面臨的一項重大挑戰,胸部 X 光檢查(CXR)因其方便性和經濟性而成為一種重要的診斷工具。 然而,CXR 圖像中重疊的骨結構往往會阻礙肺部病變的檢測,從而導致潛在的誤診。 為解決這一問題&am…

408第三季part2 - 計算機網絡 - 計算機網絡基本概念

理解然后區分一下這2個區別特點是建立連接存儲轉發的意思是A先發給B,B再發給C,就這樣這里缺點比如A很大,你給B緩存開銷大還需要排序然后形象的圖題目分組頭部要放一些源地址和目的地址這些東西以后發數據只會往近的發,不可能往下面…

互補功率放大器Multisim電路仿真——硬件工程師筆記

目錄 1 互補功率放大器基礎知識 1.1 工作原理 1.2 電路結構 1.3 優點 1.4 缺點 1.5 應用 1.6 總結 2 OCL乙類互補功率放大電路 2.1 電路結構 2.2 工作原理 2.3 優點 2.4 缺點 2.5 總結 3 OCL甲乙類互補功率放大電路 3.1 電路結構 3.2 工作原理 3.3 優點 3.4 …

【1】確認安裝 Node.js 和 npm版本號

搭建前端項目時需要安裝 Node.js 和 npm,主要是因為它們提供了一些重要的功能和工具,幫助開發者高效地開發、構建和管理項目。一、具體原因如下: Node.js:JavaScript 運行環境 Node.js 是一個基于 Chrome V8 引擎的 JavaScript 運…

7、從網絡中獲取數據

目錄 訂閱網絡狀態變化創建網絡對象獲取默認激活網絡及其能力可訂閱事件可訂閱事件——網絡可用事件可訂閱事件——網絡阻塞狀態事件可訂閱事件——網絡能力變化事件可訂閱事件——網絡連接信息變化事件可訂閱事件——網絡丟失事件常見事件訂閱場景 開發流程 使用HTTP訪問網絡發…

搭建個人博客系列--docker

因為后續所有的組件都會在docker上安裝,所以要先安裝docker。一、安裝docker1.配置yumyum install -y yum-utilsyum makecache fast2.卸載老dockeryum remove docker3.配置鏡像地址yum-config-manager --add-repo http://mirrors.aliyun.com/docker-ce/linux/centos…

【Note】《Kafka: The Definitive Guide》 第5章:深入 Kafka 內部結構,理解分布式日志系統的核心奧秘

《Kafka: The Definitive Guide》 第5章:深入 Kafka 內部結構,理解分布式日志系統的核心奧秘 Apache Kafka 在表面上看似只是一個“分布式消息隊列”,但其背后的存儲架構、分區機制、復制策略與高性能設計,才是它在千萬級 TPS 場景…

當“漏洞”成為雙刃劍——合法披露與非法交易的生死線在哪里?

首席數據官高鵬律師數字經濟團隊創作,AI輔助 一、一場“漏洞”的博弈:從“手術刀”到“毒藥”的分界 2025年夏,某電商平臺因系統漏洞被曝光,引發輿論風暴。白帽子甲在發現漏洞后,第一時間聯系平臺技術團隊&#xff0…

Hadoop 分布式存儲與計算框架詳解

Hadoop開發實戰:https://www.borimooc.com/course/1004.htm hadoop是適合海量數據的分布式存儲,和分布式計算的框架 hadoop有三大組件: mapreduce:適合海量數據的分布式計算,分為map階段、shuffle階段和reduce階段hdfs:分布式文…

LeetCode 2099.找到和最大的長度為 K 的子序列:自定義排序

【LetMeFly】2099.找到和最大的長度為 K 的子序列:自定義排序 力扣題目鏈接:https://leetcode.cn/problems/find-subsequence-of-length-k-with-the-largest-sum/ 給你一個整數數組 nums 和一個整數 k 。你需要找到 nums 中長度為 k 的 子序列 &#x…

循環移位網絡設計

總體架構 模塊描述 循環移位網絡模塊(模塊名:VAL_CS_PROC),對輸入數據(in_data)做循環移位處理,兩個cycle即可輸出數據。 Fig 1 循環移位模塊頂層 設計要求 00】 支持對data_num個有效數據做…

IO進程線程(IPC通訊)

目錄 一、IPC通訊機制 1)傳統的通訊機制: 2)systemV 的通訊機制: 3)跨主機的通訊機制: 1、無名管道 1)無名管道的概念 2)無名管道的函數 3)無名管道通訊&#xf…

Webpack 5 核心機制詳解與打包性能優化實踐

🤖 作者簡介:水煮白菜王,一個web開發工程師 👻 👀 文章專欄: 前端專欄 ,記錄一下平時在博客寫作中,總結出的一些開發技巧和知識歸納總結?。 感謝支持💕💕&am…

Manus AI與多語言手寫識別

技術文章大綱:Manus AI與多語言手寫識別 引言 手寫識別技術的發展背景與市場需求Manus AI的定位與核心技術優勢多語言場景下的挑戰與機遇 Manus AI的核心技術架構 基于深度學習的端到端手寫識別模型多模態數據融合(筆跡壓力、書寫軌跡等)…

Go與Python爬蟲對比及模板實現

go語言和Python語言都可選作用來爬蟲項目,因為python經過十幾年的累積,各種庫是應有盡有,學習也相對比較簡單,相比GO起步較晚還是有很大優勢的,么有對比就沒有傷害,所以我利用一個下午,寫個Go爬…