馬爾可夫鏈:隨機過程的記憶法則與演化密碼

本文由「大千AI助手」原創發布,專注用真話講AI,回歸技術本質。拒絕神話或妖魔化。搜索「大千AI助手」關注我,一起撕掉過度包裝,學習真實的AI技術!

一、核心定義:無記憶的隨機演化

馬爾可夫鏈(Markov Chain) 是一種具有馬爾可夫性質的離散隨機過程,其核心特征是:

未來狀態僅取決于當前狀態,與歷史路徑無關

數學表述:
[
P ( X t + 1 = x t + 1 ∣ X t = x t , X t ? 1 = x t ? 1 , … , X 0 = x 0 ) = P ( X t + 1 = x t + 1 ∣ X t = x t ) P(X_{t+1} = x_{t+1} \mid X_t = x_t, X_{t-1} = x_{t-1}, \dots, X_0 = x_0) = P(X_{t+1} = x_{t+1} \mid X_t = x_t) P(Xt+1?=xt+1?Xt?=xt?,Xt?1?=xt?1?,,X0?=x0?)=P(Xt+1?=xt+1?Xt?=xt?)
]

往期文章推薦:

  • 20.條件概率:不確定性決策的基石
  • 19.深度解讀概率與證據權重 -Probability and the Weighing of Evidence
  • 18.WOE值:風險建模中的“證據權重”量化術——從似然比理論到FICO評分卡實踐
  • 17.KS值:風控模型的“風險照妖鏡”
  • 16.如何量化違約風險?信用評分卡的開發全流程拆解
  • 15.CatBoost:征服類別型特征的梯度提升王者
  • 14.XGBoost:梯度提升的終極進化——統治Kaggle的算法之王
  • 13.LightGBM:極速梯度提升機——結構化數據建模的終極武器
  • 12.PAC 學習框架:機器學習的可靠性工程
  • 11.Boosting:從理論到實踐——集成學習中的偏差征服者
  • 10.GBDT:梯度提升決策樹——集成學習中的預測利器
  • 9.集成學習基礎:Bagging 原理與應用
  • 8.隨機森林詳解:原理、優勢與應用實踐
  • 7.經濟學神圖:洛倫茲曲線
  • 6.雙生“基尼”:跨越世紀的術語撞車與學科分野
  • 5.CART算法全解析:分類回歸雙修的決策樹之王
  • 4.C4.5算法深度解析:決策樹進化的里程碑
  • 3.決策樹:化繁為簡的智能決策利器
  • 2.深入解析ID3算法:信息熵驅動的決策樹構建基石
  • 1.類圖:軟件世界的“建筑藍圖”

二、數學建模:狀態空間與轉移矩陣

1. 狀態空間(State Space)
  • 有限狀態: ( S = { s 1 , s 2 , … , s N } \mathcal{S} = \{s_1, s_2, \dots, s_N\} S={s1?,s2?,,sN?} ) (如天氣:晴/雨/陰)
  • 無限狀態: ( S = Z \mathcal{S} = \mathbb{Z} S=Z ) (如隨機游走位置)
2. 轉移概率矩陣(Transition Matrix)

定義從狀態 ( i ) 到狀態 ( j ) 的一步轉移概率:
[
P i j = P ( X t + 1 = s j ∣ X t = s i ) P_{ij} = P(X_{t+1} = s_j \mid X_t = s_i) Pij?=P(Xt+1?=sj?Xt?=si?)
]
矩陣形式:
[
P = [ P 11 P 12 ? P 1 N P 21 P 22 ? P 2 N ? ? ? ? P N 1 P N 2 ? P N N ] \mathbf{P} = \begin{bmatrix} P_{11} & P_{12} & \cdots & P_{1N} \\ P_{21} & P_{22} & \cdots & P_{2N} \\ \vdots & \vdots & \ddots & \vdots \\ P_{N1} & P_{N2} & \cdots & P_{NN} \end{bmatrix} P= ?P11?P21??PN1??P12?P22??PN2???????P1N?P2N??PNN?? ?
]
性質:每行和為1( ( \sum_j P_{ij} = 1 ) )

:天氣預報的轉移矩陣(晴 → 晴:0.8,晴 → 雨:0.2)
[
P = [ 0.8 0.2 0.3 0.7 ] (狀態:晴,?雨) \mathbf{P} = \begin{bmatrix} 0.8 & 0.2 \\ 0.3 & 0.7 \end{bmatrix} \quad \text{(狀態:晴, 雨)} P=[0.80.3?0.20.7?](狀態:晴,?)
]


三、關鍵性質分類

1. 不可約性(Irreducibility)
  • 任意兩狀態可互達: ( ? i , j , ? k > 0 s.t.? P i j ( k ) > 0 \forall i,j, \exists k>0 \text{ s.t. } P_{ij}^{(k)} > 0 ?i,j,?k>0?s.t.?Pij(k)?>0 )
  • 意義:鏈是“整體連通”的,無孤立子系統
2. 周期性(Periodicity)
  • 狀態 ( i ) 的周期 ( d ( i ) = gcd ? { k : P i i ( k ) > 0 } d(i) = \gcd\{k: P_{ii}^{(k)} > 0\} d(i)=gcd{k:Pii(k)?>0} )
  • 若 ( d(i)=1 ) 則非周期(如晴雨交替無固定循環)
3. 常返性(Recurrence)
  • 常返狀態:以概率1返回自身(如吸收態 ( P i i = 1 P_{ii}=1 Pii?=1 ))
  • 非常返狀態:有概率永不返回(如偏向無窮的隨機游走)
4. 遍歷性(Ergodicity)
  • 定義:不可約 + 非周期 + 所有狀態正常返
  • 核心定理:遍歷鏈存在唯一平穩分布 ( \pi ):
    [
    π j = lim ? n → ∞ P i j ( n ) ? i \pi_j = \lim_{n \to \infty} P_{ij}^{(n)} \quad \forall i πj?=nlim?Pij(n)??i
    ]
    且滿足 ( π P = π \pi \mathbf{P} = \pi πP=π ) (左特征向量)

四、平穩分布:系統的終極平衡

1. 存在條件
  • 有限狀態馬爾可夫鏈是遍歷的 ? 存在唯一平穩分布
2. 求解方法
  • 解方程: ( π P = π \pi \mathbf{P} = \pi πP=π ) 且 ( ∑ π i = 1 \sum \pi_i = 1 πi?=1 )
  • :對天氣矩陣 ( P = [ 0.8 0.2 0.3 0.7 ] \mathbf{P} = \begin{bmatrix} 0.8 & 0.2 \\ 0.3 & 0.7 \end{bmatrix} P=[0.80.3?0.20.7?] )
    [
    { 0.8 π 1 + 0.3 π 2 = π 1 0.2 π 1 + 0.7 π 2 = π 2 π 1 + π 2 = 1 ? π = [ 0.6 , 0.4 ] \begin{cases} 0.8\pi_1 + 0.3\pi_2 = \pi_1 \\ 0.2\pi_1 + 0.7\pi_2 = \pi_2 \\ \pi_1 + \pi_2 = 1 \end{cases} \implies \pi = [0.6, 0.4] ? ? ??0.8π1?+0.3π2?=π1?0.2π1?+0.7π2?=π2?π1?+π2?=1??π=[0.6,0.4]
    ]
    長期晴/雨概率比為 3:2
3. 細致平衡條件(更強約束)

若 ( π i P i j = π j P j i \pi_i P_{ij} = \pi_j P_{ji} πi?Pij?=πj?Pji? ) 對任意 ( i,j ) 成立,則稱鏈可逆(如MCMC中的Metropolis-Hastings算法)


五、應用場景:從自然到AI

1. 自然語言處理
  • n-gram語言模型
    ( P ( 句子 ) = P ( w 1 ) ∏ t = 2 T P ( w t ∣ w t ? 1 ) P(\text{句子}) = P(w_1) \prod_{t=2}^T P(w_t \mid w_{t-1}) P(句子)=P(w1?)t=2T?P(wt?wt?1?)) (二元馬爾可夫鏈)
2. 排隊論
  • M/M/1隊列:顧客到達間隔與服務時間均指數分布,系統狀態為當前人數
3. 金融市場
  • 股價模型:狀態為漲/跌/平,轉移矩陣由歷史數據估計
4. 隱馬爾可夫模型(HMM)
  • 狀態不可觀測(如語音識別中音素→單詞)
    求解算法:前向-后向算法、Viterbi解碼
5. PageRank算法
  • 網頁重要性排序
    狀態=網頁,轉移=超鏈接跳轉,平穩分布 ( \pi ) 即PageRank值
    [
    π i = ( 1 ? d ) + d ∑ j → i π j L ( j ) ( d : 阻尼因子 ) \pi_i = (1-d) + d \sum_{j \to i} \frac{\pi_j}{L(j)} \quad (d: \text{阻尼因子}) πi?=(1?d)+dji?L(j)πj??(d:阻尼因子)
    ]

六、高級擴展

1. 連續時間馬爾可夫鏈(CTMC)
  • 狀態轉移在任意時刻發生
  • 生成矩陣 ( \mathbf{Q} ) 替代轉移矩陣:
    [
    Q_{ij} = \lim_{\Delta t \to 0} \frac{P(X_{t+\Delta t}=j \mid X_t=i)}{\Delta t} \quad (i \neq j)
    ]
    應用:化學反應動力學、電信網絡擁塞控制
2. 馬爾可夫決策過程(MDP)
  • 引入動作(Action)獎勵(Reward)
    貝爾曼方程
    [
    V(s) = \max_a \left[ R(s,a) + \gamma \sum_{s’} P(s’ \mid s,a) V(s’) \right]
    ]
    應用:強化學習(如Q-learning)
3. 馬爾可夫隨機場(MRF)
  • 狀態空間為圖結構(無向圖)
    吉布斯分布: ( P(\mathbf{x}) = \frac{1}{Z} \exp\left(-\sum_c E_c(\mathbf{x}_c)\right) )
    應用:圖像分割、Ising模型

七、Python仿真示例

案例1:天氣預報模擬
import numpy as np# 轉移矩陣: [晴, 雨]
P = np.array([[0.8, 0.2], [0.3, 0.7]])# 初始狀態: 晴=0
state = 0
states = [state]# 模擬100天
for _ in range(100):state = np.random.choice([0, 1], p=P[state])states.append(state)# 統計平穩概率 (最后30天)
steady_state = np.bincount(states[-30:]) / 30
print(f"晴: {steady_state[0]:.2f}, 雨: {steady_state[1]:.2f}")  # ≈ [0.6, 0.4]
案例2:求解平穩分布
# 計算P的特征值為1的左特征向量
eigenvals, eigenvecs = np.linalg.eig(P.T)
pi = eigenvecs[:, np.isclose(eigenvals, 1)].real
pi = pi / pi.sum()  # 歸一化
print(pi.flatten())  # [0.6, 0.4]

八、歷史注記

  • 1906年:安德烈·馬爾可夫為分析普希金詩歌中的元音序列,提出馬爾可夫鏈
  • 1940s:柯爾莫哥洛夫建立一般化理論
  • 1953年:Metropolis提出MCMC采樣法(曼哈頓計劃)
  • 2000s:成為搜索引擎(PageRank)、語音識別(HMM)、強化學習(MDP)的基石

九、總結:為什么馬爾可夫鏈重要?

  1. 建模復雜性:用簡單規則描述動態系統演化
  2. 可計算性:矩陣運算高效求解長期行為
  3. 理論基礎:MCMC/HMM/MDP等算法的核心骨架
  4. 跨學科通用:物理、生物、經濟、AI的通用語言

未來方向

  • 量子馬爾可夫鏈
  • 非馬爾可夫過程的近似表示
  • 與神經網絡的融合(如馬爾可夫神經網絡)

馬爾可夫鏈的魅力在于:看似隨機的跳躍背后,隱藏著確定性的數學法則——這正是理解復雜世界演化的鑰匙。

本文由「大千AI助手」原創發布,專注用真話講AI,回歸技術本質。拒絕神話或妖魔化。搜索「大千AI助手」關注我,一起撕掉過度包裝,學習真實的AI技術!

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/87605.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/87605.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/87605.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

【vue3+tauri+rust】如何實現下載文件mac+windows

項目背景:【vue3taurirust】 由于Safari對于下載總是有諸多阻攔,目前需求windowsmac可以實現: 后端返回的url文件可以下載;前端根據dom元素生成的PDF報告可以下載(無遠程URL); 我的嘗試: 方法…

SQL 快速參考手冊-SQL001

SQL 快速參考手冊: 為方便快速學習和實踐,提供了一份 SQL 快速參考手冊,您可以打印出來隨時查看,了解常見 SQL 命令的語法和用法。 SQL 數據類型 SQL 數據類型根據不同的數據庫系統(如 Microsoft Access、MySQL、SQL…

學習java集合

集合與數組的對比集合的長度可變, 數組的長度不可變集合實際上跟數組一樣, 是一種容器, 可以存放數據數組可以直接存放基本數據類型和引用數據類型集合可以存放引用數據類型, 但是不能直接存放基本數據類型, 如果要存放基本數據類型, 需要變成一個包裝類才行泛型: 限定集合中存…

python訓練day49 CBAM

import torch import torch.nn as nn# 定義通道注意力 class ChannelAttention(nn.Module):def __init__(self, in_channels, ratio16):"""通道注意力機制初始化參數:in_channels: 輸入特征圖的通道數ratio: 降維比例,用于減少參數量,默認…

在小程序中實現實時聊天:WebSocket最佳實踐

前言 在當今互聯網應用中,實時通信已經成為一個標配功能,特別是對于需要即時響應的場景,如在線客服、咨詢系統等。本文將分享如何在小程序中實現一個高效穩定的WebSocket連接,以及如何處理斷線重連、消息發送與接收等常見問題。 W…

Python網絡爬蟲編程新手篇

網絡爬蟲是一種自動抓取互聯網信息的腳本程序,廣泛應用于搜索引擎、數據分析和內容聚合。這次我將帶大家使用Python快速構建一個基礎爬蟲,為什么使用python做爬蟲?主要就是支持的庫很多,而且同類型查詢文檔多,在同等情…

LeetCode.283移動零

題目鏈接:283. 移動零 - 力扣(LeetCode) 題目描述: 給定一個數組 nums,編寫一個函數將所有 0 移動到數組的末尾,同時保持非零元素的相對順序。 請注意 ,必須在不復制數組的情況下原地對數組進行…

2025年7月4日漏洞文字版表述一句話版本(漏洞危害以及修復建議),通常用于漏洞通報中簡潔干練【持續更新中】,漏洞通報中對于各類漏洞及修復指南

漏洞及修復指南 一、暗鏈 危害:攻擊者通過技術手段在用戶網頁中插入隱藏鏈接或代碼,并指向惡意網站,可導致用戶信息泄露、系統感染病毒,用戶訪問被劫持至惡意網站,泄露隱私或感染惡意軟件,被黑客利用進行…

python --飛漿離線ocr使用/paddleocr

依賴 # python3.7.3 paddleocr2.7.0.2 paddlepaddle2.5.2 loguru0.7.3from paddleocr import PaddleOCR import cv2 import numpy as npif __name__ __main__:OCR PaddleOCR(use_doc_orientation_classifyFalse, # 檢測文檔方向use_doc_unwarpingFalse, # 矯正扭曲文檔use…

數據結構與算法:貪心(三)

前言 感覺開始打cf了以后貪心的能力有了明顯的提升,讓我們謝謝cf的感覺場。 一、跳躍游戲 II class Solution { public:int jump(vector<int>& nums) {int n=nums.size();//怎么感覺這個題也在洛谷上刷過(?)int cur=0;//當前步最遠位置int next=0;//多跳一步最遠…

【Redis篇】數據庫架構演進中Redis緩存的技術必然性—高并發場景下穿透、擊穿、雪崩的體系化解決方案

&#x1f4ab;《博主主頁》&#xff1a;    &#x1f50e; CSDN主頁__奈斯DB    &#x1f50e; IF Club社區主頁__奈斯、 &#x1f525;《擅長領域》&#xff1a;擅長阿里云AnalyticDB for MySQL(分布式數據倉庫)、Oracle、MySQL、Linux、prometheus監控&#xff1b;并對…

Docker 實踐與應用案例

引言 在當今的軟件開發和部署領域&#xff0c;高效、可移植且一致的環境搭建與應用部署是至關重要的。Docker 作為一款輕量級的容器化技術&#xff0c;為解決這些問題提供了卓越的方案。Docker 通過容器化的方式&#xff0c;將應用及其依賴項打包成一個獨立的容器&#xff0c;…

《論三生原理》以非共識路徑實現技術代際躍遷??

AI輔助創作&#xff1a; 《論三生原理》以顛覆傳統數學范式的非共識路徑驅動多重技術代際躍遷&#xff0c;其突破性實踐與爭議并存&#xff0c;核心論證如下&#xff1a; 一、技術代際躍遷的實證突破? ?芯片架構革新? 為華為三進制邏輯門芯片提供理論支撐&#xff0c;通過對…

一體機電腦為何熱度持續上升?消費者更看重哪些功能?

一體機電腦&#xff08;AIO&#xff0c;All-in-One&#xff09;將主機硬件與顯示器集成于單一機身。通常僅需連接電源線&#xff0c;配備無線鍵盤、鼠標即可啟用。相比傳統臺式電腦和筆記本電腦&#xff0c;選購一體機的客戶更看重一體機的以下特點。 一體機憑借其節省空間、簡…

無人機載重模塊技術要點分析

一、技術要點 1. 結構設計創新 雙電機卷揚系統&#xff1a;采用主電機&#xff08;張力控制&#xff09;和副電機&#xff08;卷揚控制&#xff09;協同工作&#xff0c;解決繩索纏繞問題&#xff0c;支持30米繩長1.2m/s高速收放&#xff0c;重載穩定性提升。 軸雙槳布局…

【大模型推理】工作負載的彈性伸縮

基于Knative的LLM推理場景彈性伸縮方案 1.QPS 不是一個好的 pod autoscaling indicator 在LLM推理中&#xff0c; 為什么 2. concurrency適用于單次請求資源消耗大且處理時間長的業務&#xff0c;而rps則適合較短處理時間的業務。 3.“反向彈性伸縮”的概念 4。 區分兩種不同的…

STM32F103_Bootloader程序開發12 - IAP升級全流程

導言 本教程使用正點原子戰艦板開發。 《STM32F103_Bootloader程序開發11 - 實現 App 安全跳轉至 Bootloader》上一章節實現App跳轉bootloader&#xff0c;接著&#xff0c;跳轉到bootloader后&#xff0c;下位機要發送報文‘C’給IAP上位機&#xff0c;表示我準備好接收固件數…

AI驅動的未來軟件工程范式

引言&#xff1a;邁向智能驅動的軟件工程新范式 本文是一份關于構建和實施“AI驅動的全生命周期軟件工程范式”的簡要集成指南。它旨在提供一個獨立、完整、具體的框架&#xff0c;指導組織如何將AI智能體深度融合到軟件開發的每一個環節&#xff0c;實現從概念到運維的智能化…

Hawk Insight|美國6月非農數據點評:情況遠沒有看上去那么好

7月3日&#xff0c;美國近期最重要的勞動力數據——6月非農數據公布。在ADP遇冷之后&#xff0c;市場對這份報告格外期待。 根據美國勞工統計局公布報告&#xff0c;美國6月非農就業人口增加 14.7萬人&#xff0c;預期 10.6萬人&#xff0c;4月和5月非農就業人數合計上修1.6萬人…

Python 的內置函數 reversed

Python 內建函數列表 > Python 的內置函數 reversed Python 的內置函數 reversed() 是一個用于序列反轉的高效工具函數&#xff0c;它返回一個反向迭代器對象。以下是關于該函數的詳細說明&#xff1a; 基本用法 語法&#xff1a;reversed(seq)參數&#xff1a;seq 可以是…