量化面試綠皮書：35. 蒙蒂霍爾問題

文中內容僅限技術學習與代碼實踐參考，市場存在不確定性，技術分析需謹慎驗證，不構成任何投資建議。

35. 蒙蒂霍爾問題

蒙提·霍爾問題是一個基于美國老電視節目《讓我們做個交易》的概率謎題，該問題以該節目的主持人命名。假設你現在在節目現場，有三扇門供你選擇。其中一扇門后面是一輛汽車，另外兩扇門后面是山羊。你事先不知道每扇門后面是什么。
你挑選了一扇門并宣布你的選擇。就在你挑選了這扇門之后，蒙提會打開另外兩扇門中的一扇，他知道這扇門后面是山羊。然后他給你一個選擇，要么堅持你最初的選擇，要么換成第三扇門。

Q: 你該不該換呢？如果你換的話，贏得汽車的概率是多少呢？

A: 是的，你應該換門！換門后贏得汽車的概率是 $\dfrac{2}{3}$ （約 66.7%）。相反，如果堅持最初的選擇，贏得汽車的概率只有 $\dfrac{1}{3}$ （約 33.3%）。下面我來一步步解釋原因，這樣更容易理解。

問題背景回顧

有三扇門：一扇門后面是汽車，另外兩扇門后面是山羊。
你隨機選擇一扇門（假設你選了門 1）。
主持人蒙提·霍爾（他知道每扇門后面是什么）會打開另一扇門，露出山羊（例如，他打開了門 3，后面是山羊）。
然后，蒙提給你機會：堅持選擇門 1，或者換成剩下的門（門 2）。

為什么應該換門？概率分析

很多人直覺上認為，此時只剩兩扇門（你的門 1 和未開的門 2），每扇門有 50% 的概率有汽車，所以換不換無所謂。但這是錯誤的，因為蒙提的行動不是隨機的——他故意打開一扇山羊門，這提供了額外信息，改變了概率分布。

正確的分析基于你最初選擇的概率：

當你最初選擇一扇門時：
- 你選到汽車的概率是 1/3（因為只有一扇門有汽車）。
- 你選到山羊的概率是 2/3（因為有兩扇門是山羊）。
蒙提的行動：
- 如果你最初選到了汽車（概率 1/3），蒙提會打開一扇山羊門（他有兩個選擇，但無論打開哪一扇，剩下的那扇門都是山羊）。如果你換門，你會輸（因為換到山羊）。
- 如果你最初選到了山羊（概率 2/3），蒙提只能打開另一扇山羊門（因為他不能打開你的門或汽車門），所以剩下的那扇門一定是汽車。如果你換門，你會贏。
換門的結果：
- 換門后贏得汽車的概率 = 你最初選到山羊的概率 = 2/3。
- 換門后輸的概率 = 你最初選到汽車的概率 = 1/3。
不換門的結果：
- 堅持原選擇贏得汽車的概率 = 你最初選到汽車的概率 = 1/3。
- 堅持原選擇輸的概率 = 你最初選到山羊的概率 = 2/3。

簡單總結

換門策略將你的贏面從 1/3 提高到 2/3，因為蒙提的干預實際上“轉移”了概率：初始選擇時，你有更高概率（2/3）選錯（山羊），而換門正好利用了這一點，把錯誤選擇轉化為正確選擇。
不換門的話，你只能依賴初始的 1/3 概率，這很低。

為什么不是 50-50？

因為蒙提不是隨機開門——他總是打開一扇山羊門，這相當于幫你排除了一個錯誤選項。但你的初始選擇是隨機的，所以概率“權重”并不平均：初始選錯的概率（2/3）通過換門可以變成贏的機會。

實際驗證

這個問題可以用模擬或枚舉法驗證：

假設汽車在門 1（其他情況類似）：
- 你選門 1（概率 1/3）：蒙提開門 2 或 3（山羊），如果你換門，你輸。
- 你選門 2（概率 1/3）：蒙提必須開門 3（山羊），如果你換到門 1，你贏。
- 你選門 3（概率 1/3）：蒙提必須開門 2（山羊），如果你換到門 1，你贏。
換門贏的情況有 2 種（當你初始選錯時），總贏概率 2/3。

Python 實現

以下是使用Python實現蒙提·霍爾問題模擬的代碼，遵循Google強類型風格和注釋規范：

import random
from typing import Tupledef simulate_monty_hall(num_simulations: int) -> Tuple[float, float]:"""模擬蒙提·霍爾問題并計算獲勝概率。Args:num_simulations (int): 模擬次數Returns:Tuple[float, float]: 包含兩個概率的元組: (不換門的獲勝概率, 換門的獲勝概率)"""# 初始化獲勝計數器stay_wins = 0switch_wins = 0for _ in range(num_simulations):# 隨機放置汽車 (0: 山羊, 1: 汽車)doors = [0, 0, 0]car_index = random.randint(0, 2)doors[car_index] = 1# 參賽者隨機選擇一扇門initial_choice = random.randint(0, 2)# 主持人打開一扇有山羊的門 (不能是參賽者選擇的門)host_options = [i for i in range(3) if i != initial_choice and doors[i] == 0]host_opens = random.choice(host_options)# 計算換門選擇: 既不是初始選擇也不是主持人打開的門switch_choice = next(i for i in range(3) if i != initial_choice and i != host_opens)# 統計兩種策略的結果if doors[initial_choice] == 1:stay_wins += 1if doors[switch_choice] == 1:switch_wins += 1# 計算概率stay_prob = stay_wins / num_simulationsswitch_prob = switch_wins / num_simulationsreturn stay_prob, switch_prob# 配置模擬參數
NUM_SIMULATIONS = 100000# 運行模擬
stay_prob, switch_prob = simulate_monty_hall(NUM_SIMULATIONS)# 打印結果
print(f"模擬次數: {NUM_SIMULATIONS}")
print(f"不換門獲勝概率: {stay_prob:.4f} (理論值: 0.3333)")
print(f"換門獲勝概率: {switch_prob:.4f} (理論值: 0.6667)")
print(f"換門的優勢比: {switch_prob/stay_prob:.2f}:1")

代碼說明

隨機放置汽車位置
參賽者隨機選擇初始門
主持人打開一扇有山羊的門（不能是參賽者選擇的門）
計算換門策略的選擇
統計兩種策略的獲勝次數

輸出：

模擬次數: 100000
不換門獲勝概率: 0.3330 (理論值: 0.3333)
換門獲勝概率: 0.6670 (理論值: 0.6667)
換門的優勢比: 2.00:1

關鍵結論

換門策略的獲勝概率接近理論值2/3 (66.67%)
不換門策略的獲勝概率接近理論值1/3 (33.33%)
換門策略的獲勝概率是不換門策略的兩倍

此模擬驗證了蒙提·霍爾問題的反直覺結論：盡管表面上看起來是二選一，但由于主持人提供的信息改變了概率分布，換門策略能顯著提高獲勝概率。

這道面試題的本質是考察候選人對概率論本質的理解深度、條件概率的建模能力以及在信息不對稱環境下進行最優決策的思維，這些能力直接對應量化交易策略開發、風險管理模型構建和衍生品定價中的核心挑戰。

🔑 核心知識點

條件概率與貝葉斯推理
- 必須掌握 $\frac{P(B|A)P(A)}{P(B)}$ 的實質應用
- 理解主持人行為帶來的信息價值（已知山羊位置改變概率分布）
期望值決策理論
- 量化不同策略的期望收益：換門策略 $\frac{2}{3}$ vs 堅持策略 $\frac{1}{3}$
- 識別表面50/50背后的真實概率分布
蒙特卡洛方法遷移
- 通過模擬驗證理論結果（本題Python實現）
- 將相同方法論應用于金融場景（如期權定價、風險價值計算）
信息經濟學思維
- 主持人行為本質是信息釋放過程
- 類比市場信號對資產價格的影響機制

📊 面試評估維度

考察維度	具體表現要求	本題對應點
概率建模能力	將現實問題轉化為概率模型	用條件概率描述主持人行為對初始選擇的影響
決策優化能力	在動態信息流中尋找最優解	比較換門/堅持策略的期望收益
數值驗證能力	通過編程驗證理論結果	Python模擬中實現概率收斂到理論值
反直覺洞察	突破表面認知發現本質規律	解釋為何50/50的直覺錯誤，揭示信息價值
金融場景遷移	將數學原理映射到金融實踐	類比市場新信息如何改變資產價格概率分布

🧩 典型回答框架

明確規則約束
- 主持人必開山羊門且知悉所有門后內容
- 開門行為非隨機（信息釋放的關鍵）
構建概率模型
- 初始選擇正確概率： $P(\text{正確}) = \frac{1}{3}$
- 換門獲勝條件：初始選擇錯誤（概率 $\frac{2}{3}$ ）
- 條件概率公式： $P(\text{換贏}) = P(\text{初始錯}) \times 1$
貝葉斯推理驗證
$\begin{align*} P(\text{車在B}|\text{開C}) &= \frac{P(\text{開C}|\text{車在B})P(\text{車在B})}{P(\text{開C})} \\ &= \frac{1 \times \frac{1}{3}}{\frac{1}{2}} = \frac{2}{3} \end{align*}$
決策樹分析
結論
換門策略將獲勝概率從 $\frac{1}{3}$ 提升至 $\frac{2}{3}$ ，期望收益翻倍