從基礎到實戰的量化交易全流程學習:1.3 數學與統計學基礎——概率與統計基礎 | 數字特征
第一部分:概率與統計基礎
第2節:數字特征:期望值、方差、協方差與相關系數
一、期望值(Expected Value):用“平均值”預測未來
期望值是隨機變量的“加權平均”,代表長期來看最可能的“平均結果”,是量化交易中評估策略收益的核心指標。
1. 數學定義與性質
-
離散型隨機變量:
E ( X ) = ∑ i = 1 n x i ? P ( X = x i ) E(X) = \sum_{i=1}^n x_i \cdot P(X=x_i) E(X)=i=1∑n?xi??P(X=xi?)
例:拋一枚硬幣,正面盈利100元(概率0.5),反面虧損50元(概率0.5),期望收益為:
E ( X ) = 100 × 0.5 + ( ? 50 ) × 0.5 = 25 元 E(X) = 100 \times 0.5 + (-50) \times 0.5 = 25 \ \text{元} E(X)=100×0.5+(?50)×0.5=25?元 -
連續型隨機變量:
E ( X ) = ∫ ? ∞ + ∞ x ? f ( x ) d x E(X) = \int_{-\infty}^{+\infty} x \cdot f(x) \, dx E(X)=∫?∞+∞?x?f(x)dx
( f ( x ) f(x) f(x) 為概率密度函數,如股票收益率的正態分布) -
線性性質(關鍵!):
- E ( a X + b Y ) = a E ( X ) + b E ( Y ) E(aX + bY) = aE(X) + bE(Y) E(aX+bY)=aE(X)+bE(Y)( a , b a,b a,b 為常數)
- 無論 X X X 和 Y Y Y 是否獨立,線性性都成立。
2. 量化交易中的應用
-
投資組合預期收益計算:
假設持有30%的股票A(期望收益15%)和70%的債券B(期望收益5%),組合期望收益為:
E ( R ) = 0.3 × 15 % + 0.7 × 5 % = 8 % E(R) = 0.3 \times 15\% + 0.7 \times 5\% = 8\% E(R)=0.3×15%+0.7×5%=8% -
策略有效性篩選:
通過回測計算策略的期望收益 E ( R ) E(R) E(R),若 E ( R ) < 0 E(R) < 0 E(R)<0(長期虧損),則直接排除。
二、方差(Variance)與標準差(Standard Deviation):用“波動”衡量風險
期望值相同的策略,風險可能差異巨大——方差描述收益圍繞均值的離散程度,是量化風險的核心指標。
1. 數學定義與性質
-
方差:
Var ( X ) = E [ ( X ? E ( X ) ) 2 ] = E ( X 2 ) ? [ E ( X ) ] 2 \text{Var}(X) = E\left[(X - E(X))^2\right] = E(X^2) - [E(X)]^2 Var(X)=E[(X?E(X))2]=E(X2)?[E(X)]2
例:上述拋硬幣策略,方差為:
Var ( X ) = ( 100 ? 25 ) 2 × 0.5 + ( ? 50 ? 25 ) 2 × 0.5 = 5625 \text{Var}(X) = (100-25)^2 \times 0.5 + (-50-25)^2 \times 0.5 = 5625 Var(X)=(100?25)2×0.5+(?50?25)2×0.5=5625 -
標準差(方差的平方根):
σ = Var ( X ) \sigma = \sqrt{\text{Var}(X)} σ=Var(X)?
(單位與原變量一致,比方差更直觀) -
性質:
- Var ( a X + b ) = a 2 Var ( X ) \text{Var}(aX + b) = a^2 \text{Var}(X) Var(aX+b)=a2Var(X)(常數 b b b 不影響波動)
- 獨立變量的和的方差: Var ( X + Y ) = Var ( X ) + Var ( Y ) \text{Var}(X+Y) = \text{Var}(X) + \text{Var}(Y) Var(X+Y)=Var(X)+Var(Y)(若 X , Y X,Y X,Y 獨立)
2. 量化交易中的應用
- 風險度量:
- 標準差越大,收益波動越劇烈,風險越高。
- 例:策略A年均收益10%,標準差5%;策略B年均收益10%,標準差20%。雖然期望相同,但策略B的風險遠高于策略A。
圖1:標準差小(左)的收益更集中在均值附近,風險低;標準差大(右)的收益更分散,風險高。
- 馬科維茨有效前沿:
通過優化組合權重,在給定期望收益下最小化方差(或在給定方差下最大化期望收益),構建“風險-收益”最優的投資組合。
三、協方差(Covariance)與相關系數(Correlation):用“聯動性”分析資產關系
單個資產的風險容易衡量,但多個資產的“互動”才是組合風險的關鍵——協方差和相關系數描述變量間的線性關聯程度。
1. 協方差:衡量“同方向波動”的強度
-
定義:
Cov ( X , Y ) = E [ ( X ? μ X ) ( Y ? μ Y ) ] = E ( X Y ) ? μ X μ Y \text{Cov}(X,Y) = E\left[(X - \mu_X)(Y - \mu_Y)\right] = E(XY) - \mu_X \mu_Y Cov(X,Y)=E[(X?μX?)(Y?μY?)]=E(XY)?μX?μY?- 正協方差: X X X 增大時 Y Y Y 傾向于增大(如股票與股市指數)。
- 負協方差: X X X 增大時 Y Y Y 傾向于減小(如股票與黃金)。
- 絕對值越大:聯動性越強;絕對值越小(接近0):聯動性越弱。
-
性質:
- Cov ( X , X ) = Var ( X ) \text{Cov}(X,X) = \text{Var}(X) Cov(X,X)=Var(X)(自身協方差即方差)
- Cov ( X , Y ) = Cov ( Y , X ) \text{Cov}(X,Y) = \text{Cov}(Y,X) Cov(X,Y)=Cov(Y,X)
- 獨立變量協方差為0(反之不一定成立)。
2. 相關系數:“標準化”的協方差
-
定義:
ρ X Y = Cov ( X , Y ) σ X σ Y ( ρ ∈ [ ? 1 , 1 ] ) \rho_{XY} = \frac{\text{Cov}(X,Y)}{\sigma_X \sigma_Y} \quad (\rho \in [-1, 1]) ρXY?=σX?σY?Cov(X,Y)?(ρ∈[?1,1])- ρ = 1 \rho = 1 ρ=1:完全正相關(變量同步波動,如同一行業的兩只股票)。
- ρ = ? 1 \rho = -1 ρ=?1:完全負相關(變量反向波動,如期貨對沖組合)。
- ρ = 0 \rho = 0 ρ=0:無線性相關(可能存在非線性關系)。
-
可視化:散點圖與相關系數
圖2:從左到右分別為 ρ = 1 \rho=1 ρ=1(嚴格正相關)、 ρ = 0.5 \rho=0.5 ρ=0.5(正相關)、 ρ = 0 \rho=0 ρ=0(無相關)、 ρ = ? 1 \rho=-1 ρ=?1(嚴格負相關)。
3. 量化交易中的應用
-
資產配置分散風險:
- 若兩只股票 ρ = 0.3 \rho=0.3 ρ=0.3,組合標準差會低于兩者標準差的加權平均,實現“風險分散”。
- 例:資產A( σ A = 20 % \sigma_A=20\% σA?=20%)和資產B( σ B = 15 % \sigma_B=15\% σB?=15%),等權重配置,若 ρ = 0.3 \rho=0.3 ρ=0.3,則組合標準差為:
σ = ( 0. 5 2 × 0. 2 2 ) + ( 0. 5 2 × 0.1 5 2 ) + 2 × 0.5 × 0.5 × 0.3 × 0.2 × 0.15 ≈ 12.8 % \sigma = \sqrt{(0.5^2 \times 0.2^2) + (0.5^2 \times 0.15^2) + 2 \times 0.5 \times 0.5 \times 0.3 \times 0.2 \times 0.15} \approx 12.8\% σ=(0.52×0.22)+(0.52×0.152)+2×0.5×0.5×0.3×0.2×0.15?≈12.8%
低于簡單平均 ( 20 % + 15 % ) / 2 = 17.5 % (20\% + 15\%)/2 = 17.5\% (20%+15%)/2=17.5%。
-
多因子模型去冗余:
- 若兩個因子的相關系數 ρ > 0.9 \rho>0.9 ρ>0.9,說明存在嚴重多重共線性,需剔除其中一個因子。
四、Python實戰:計算投資組合的風險收益指標
import numpy as np# 資產參數:3只股票的期望收益、協方差矩陣、持倉權重
returns = np.array([0.12, 0.08, 0.06]) # 期望收益
cov_matrix = np.array([[0.04, 0.02, 0.01],[0.02, 0.03, 0.015],[0.01, 0.015, 0.02]
]) # 協方差矩陣
weights = np.array([0.5, 0.3, 0.2]) # 權重# 1. 計算組合期望收益
expected_return = np.dot(weights, returns)
print(f"組合期望收益: {expected_return:.4f}") # 輸出:0.1020 (10.2%)# 2. 計算組合方差與標準差
portfolio_var = np.dot(weights.T, np.dot(cov_matrix, weights))
portfolio_std = np.sqrt(portfolio_var)
print(f"組合方差: {portfolio_var:.4f}, 標準差: {portfolio_std:.4f}")
# 輸出:組合方差: 0.0229, 標準差: 0.1513 (15.13%)# 3. 計算資產間相關系數矩陣
corr_matrix = cov_matrix / (np.outer(np.sqrt(np.diag(cov_matrix)), np.sqrt(np.diag(cov_matrix))))
print("相關系數矩陣:\n", np.round(corr_matrix, 2))
# 輸出:
# 相關系數矩陣:
# [[1. 0.58 0.5 ]
# [0.58 1. 0.75]
# [0.5 0.75 1. ]]
本節總結
- 期望值 是收益的“指南針”,告訴我們長期平均結果。
- 方差/標準差 是風險的“量尺”,衡量收益的波動程度。
- 協方差/相關系數 是聯動性的“溫度計”,幫助我們分散風險、優化組合。