又要接觸測度論了。隨著隨機規劃的不斷深入,如果涉及到證明部分,測度論的知識幾乎不可或缺。
測度論的相關書籍,基本都非常艱澀難讀,對于非數學專業出身的人入門非常不易。從十幾年前開始,我很難把測度論教材看到超過10頁。結合我對 chatgpt 的反復提問,努力理解每一個抽象的知識點,在這篇博客里總結一下吧。
大學課程里面的《高等數學》講授的是黎曼積分(Riemann Integration),而測度論的核心是勒貝格積分(Lebesgue Integration):
- 黎曼積分的幾何意義是將定義域細分為無數個小區間,將每個小區間的面積(小區間的寬度乘以高度,高度為函數值)加起來
- 勒貝格積分的幾何意義是將值域細分為無數個小區間,將每個小區間的面積(小區間的面積通過構造一個函數逼近)乘以對應的權重(這個權重就是勒貝格測度)加起來。
例如下圖,上圖為黎曼積分,下圖為勒貝格積分:
之所以要用勒貝格積分,是因為有時候黎曼積分對一些復雜的函數進行積分,例如下面這個函數:
f ( x ) = { 1 x ∈ Q 0 x ∈ R \ Q f(x)= \begin{cases} 1 &x\in\mathbb{Q}\\ 0 &x\in\mathbb{R\backslash Q} \end{cases} f(x)={10?x∈Qx∈R\Q?
這個函數在有理數上為1,在無理數為 0,無法用黎曼積分。
在引入勒貝格積分之前,先看看什么是勒貝格測度。
1. 勒貝格測度
勒貝格測度(Lebesgue measure)是用來精確地“測量”集合的大小的一種工具。
- 傳統的測度中,我們可以測量長度(一維空間),面積(二維空間),體積(三維空間)等。
但是對于一些集合,尤其是不連續的或者非常奇怪的,該如何去測量這個集合呢?例如,有理數的集合 Q \mathbb{Q} Q 的測度是多少?就有了勒貝格測度。
- 一個勒貝格可測集合的勒貝格測度實質是指該集合的
外測度
1.1 勒貝格可測集合
勒貝格測度通常定義在實數集上,一個集合 A ? R n A\subset\mathbb{R}^n A?Rn 若是勒貝格可測,必須滿足以下條件:
- 將任意集合分成兩部分:一部分落在 A A A 內,另一部分落在 A A A 外。這兩個部分的測度加起來正好等于原集合的測度,沒有丟也沒有重疊。
換句話說,若一個集合在測度上不“扭曲”別的集合,那么該集合就是勒貝格可測的。
用數學的語言表示就是:
一個集合 A ? R n A\subset\mathbb{R}^n A?Rn 是勒貝格可測的,如果對于任意集合 E ∈ R n E\in\mathbb{R}^n E∈Rn,都有:
λ ? ( E ) = λ ? ( E ∩ A ) + λ ? ( E ∩ A  ̄ ) \lambda^*(E)=\lambda^*(E\cap A)+\lambda^*(E\cap\overline{A}) λ?(E)=λ?(E∩A)+λ?(E∩A)
其中, λ ? \lambda^* λ? 表示外測度。一個集合外測度
的幾何意義是:
- 用最緊的膠帶包裹集合中的每一個元素,所使用的膠帶的總長度。
在數學意義上,這個膠帶是開區間,而膠帶的長度表示這個開區間的體積:一維空間上為長度,二維空間為面積,三維空間為體積等等。
外測度的標準數學定義:
對于任意集合 A ? R n A\subset{R}^n A?Rn,它的外測度 λ ? \lambda^* λ? 為
λ ? ( A ) = inf ? ( ∑ i = 1 ∞ vol ( I i ) ∣ A ? ? i = 1 ∞ I i ) \lambda^*(A)=\inf\left(\sum_{i=1}^\infty \text{vol}(I_i)\mid A\subset\bigcup_{i=1}^\infty I_i\right) λ?(A)=inf(i=1∑∞?vol(Ii?)∣A?i=1?∞?Ii?)
其中, vol ( I i ) \text{vol}(I_i) vol(Ii?) 表示開區間 I i I_i Ii? 的體積。
-
所有開集、閉集、半開半閉集都是勒貝格可測的。
-
所有 Borel 集合(所有 R n \mathbb{R}^n Rn 中的開集及它們的可數并、可數交、補集,也稱為 σ \sigma σ-代數)都是可測的。
-
所有零測集都是勒貝格可測的。
-
所有可數集合都是勒貝格可測的(有理數集合 Q \mathbb{Q} Q 是可數的)。
一個集合可數表示這個集合的所有元素都可以用自然數給它編號,可以有無限多個元素,例如有理數集合 Q \mathbb{Q} Q
其實,常見的集合都是勒貝格可測的,不可測的集合反而比較少。我見不可測的集合例子都是專門構造的,例如 Vitali 集合(這個集合是無數個[0, 1]內不相交開集的并,因為每個開集的界限都是無理數,導致每個開集都無法測量長度)
1.2 勒貝格可測函數
定義在實數集上的函數 f f f,被稱作勒貝格可測函數,是指
對于任意實數 α ∈ R , { x ∣ f ( x ) > α } 為勒貝格可測集合 \text{對于任意實數} \alpha \in\mathbb{R}, \{x\mid f(x)>\alpha\} \text{為勒貝格可測集合} 對于任意實數α∈R,{x∣f(x)>α}為勒貝格可測集合
下函數都是勒貝格可測的:
- 連續函數,包括分段連續函數
- 勒貝格可積函數,即該函數的勒貝格積分不是無窮
- 指示函數,也稱特征函數:若 x x x 在某個集合內,函數值為 1,否則函數值為 0
- 若離散函數在定義域內的每個點都是勒貝格可測集,則該離散函數是可測函數(此時離散函數是可數個指示函數的加和)
- 單調函數
1.3 勒貝格可積函數
某個測度空間上的函數 f ( x ) f(x) f(x) 勒貝格可積,需要滿足兩個條件:
- 該函數 f ( x ) f(x) f(x) 是勒貝格可測函數
- 該函數的積分不是無窮,即 ∫ ∣ f ∣ d x < ∞ \int |f|dx< \infty ∫∣f∣dx<∞
2. 勒貝格積分
勒貝格積分是“從下逼近”的思想:
- 把函數用一堆
非負簡單函數
從下逼近,然后用集合的勒貝格測度來加權求和,是一種更“集合論”的積分方式,適用于更廣泛的函數和空間。
非負簡單函數
是指形如下面的函數:
? ( x ) = ∑ i = 1 n a i 1 E i ( x ) \phi(x)=\sum_{i=1}^n a_i \mathbf{1}_{E_i}(x) ?(x)=i=1∑n?ai?1Ei??(x)
其中:
- a i a_i ai? 是一個大于 0 的常數或函數值
- 1 E i ( x ) \mathbf{1}_{E_i}(x) 1Ei??(x) 表示集合 E i E_i Ei? 的指示函數
- 每個集合 χ E i ( x ) \chi_{E_i}(x) χEi??(x) 是勒貝格可測集,互不重疊
勒貝格積分
的定義針對的是一個非負函數:
設 𝑓 ≥ 0 𝑓\geq 0 f≥0 是一個可測函數,定義它的勒貝格積分為
∫ f d μ : = sup ? { ∫ ? d μ ∣ 0 ≤ ? ≤ f , ? 是簡單函數 } \int fd\mu := \sup\left\{\int \phi d\mu\mid 0\leq \phi\leq f, \phi \text{ 是簡單函數}\right\} ∫fdμ:=sup{∫?dμ∣0≤?≤f,??是簡單函數}
其中, μ \mu μ 為測度,可以為勒貝格測度、概率測度、計數測度等。
對于一般的函數,即可能有負值的函數,則轉化為兩個非負函數相減:
∫ f d μ = ∫ f + d μ ? ∫ f ? d μ \int fd\mu=\int f^+d\mu-\int f^-d\mu ∫fdμ=∫f+dμ?∫f?dμ
其中, f + ( x ) = max ? { 0 , f ( x ) } f^+(x)=\max\{0, f(x)\} f+(x)=max{0,f(x)}, f ? ( x ) = max ? { 0 , ? f ( x ) } f^-(x)=\max\{0, -f(x)\} f?(x)=max{0,?f(x)}.
舉例:利用勒貝格求積分
∫ 0 1 x 2 d μ ( x ) \int_0^1 x^2d\mu(x) ∫01?x2dμ(x)
其中, μ \mu μ 為勒貝格測度,對于這個問題表示長度。
- 第一步,構造一個從下逼近 f ( x ) f(x) f(x) 的簡單函數序列
? k ( x ) = ∑ k = 1 n ( k ? 1 ) 2 n 2 1 ( k ? 1 n , k n ] ( x ) \phi_k(x)=\sum_{k=1}^n\frac{(k-1)^2}{n^2}\mathbf{1}_{(\frac{k-1}{n},\frac{k}{n}]}(x) ?k?(x)=k=1∑n?n2(k?1)2?1(nk?1?,nk?]?(x)
這個簡單函數表示把 [0, 1] 劃分為 n 個等長區間,第 k 個小區間為 ( k ? 1 n , k n ] (\frac{k-1}{n},\frac{k}{n}] (nk?1?,nk?],對應的值為 ( k ? 1 ) 2 n 2 \frac{(k-1)^2}{n^2} n2(k?1)2?.
- 第二步,計算勒貝格積分
∫ 0 1 x 2 d μ ( x ) = lim ? n → ∞ ∑ k = 1 n ( k ? 1 ) 2 n 2 × 1 n = lim ? n → ∞ n ( n ? 1 ) ( 2 n ? 1 ) 6 n 3 = 1 / 3 \begin{aligned} \int_0^1 x^2d\mu(x)=&\lim_{n\rightarrow \infty}\sum_{k=1}^n\frac{(k-1)^2}{n^2}\times\frac{1}{n}\\ =&\lim_{n\rightarrow\infty} \frac{n(n-1)(2n-1)}{6n^3}\\ =&1/3 \end{aligned} ∫01?x2dμ(x)===?n→∞lim?k=1∑n?n2(k?1)2?×n1?n→∞lim?6n3n(n?1)(2n?1)?1/3?
這個與黎曼積分的結果一致。
3. 勒貝格積分的單調保持性質
勒貝格積分有一個單調保持性質1,大致意思是:若一個函數在樣本空間中的每一個樣本中都大于等于另外一個函數,那么它們的勒貝格積分仍然有同樣的大小關系。
更嚴謹的表達為:
( X , F , μ ) (X, \mathcal{F}, \mu) (X,F,μ) 為一個概率空間2,函數 f f f 與 g g g 是 X X X 上的一個可積函數,如果對于 X X X 中的任何一個元素 x x x,都有 f ( x ) ≤ g ( x ) f(x)\leq g(x) f(x)≤g(x),那么
∫ f d μ ≤ ∫ g d μ \int fd\mu\leq \int gd\mu ∫fdμ≤∫gdμ
Cohn, D. L. (2013). Measure theory (Vol. 2). New York: Birkh?user, pp: 57. ??
概率空間的介紹參看我的另一篇博客 ??