基礎數學:圖論與信息論

微積分與概率論由此進:基礎數學:微積分和概率與統計-CSDN博客

線代與優化理論由此進:基礎數學:線性代數與優化理論-CSDN博客

數值分析與離散數學由此進:基礎數學:數值分析與離散數學-CSDN博客

四、圖論與搜索算法

1.圖結構基礎

(1) 圖的表示方法

  • 鄰接矩陣:

? ? ? ? 定義:對于圖?G=(V,E),鄰接矩陣?A\in \left \{ 0,1 \right \}^{|V| \times |V|},其中

????????????????A_{ij}=\left\{\begin{matrix} 1 \quad (i,j)\in E\\ 0 \quad otherwise \end{matrix}\right.

? ? ? ? 適用:稠密圖的存儲,快速判斷節點間是否聯通

  • 鄰接表:

? ? ? ? 定義:為每個節點存儲其鄰居列表,例如?Adj[v]=\left \{ u|(v,u)\in E \right \}

? ? ? ? 適用:稀疏圖的高效存儲,節省空間

  • 權重圖的擴展:

? ? ? ? 定義:鄰接矩陣元素?A_{ij}?表示邊權,鄰接表存儲?(u,w_{vu})?對

(2) 樹與圖遍歷

  • 樹的性質:

? ? ? ? 無環聯通圖,任意兩節點間有唯一路徑

? ? ? ? 節點數?|V|=|E|+1

  • 深度優先搜索(DFS):

? ? ? ? 算法步驟:

? ? ? ? ? 1.從起點出發,訪問未被訪問的鄰居節點

? ? ? ? ? 2.遞歸訪問鄰居的鄰居,直到無法繼續

? ? ? ? ? 3.回溯到最近未探索完的節點繼續

? ? ? ? 復雜度:時間復雜度?O(|V|+|E|),空間復雜度?O(|V|)?(遞歸棧)

? ? ? ? 應用:樹形思維(ToT)中的深度探索

  • 廣度優先搜索(BFS):

? ? ? ? 算法步驟:

? ? ? ? ? 1.使用隊列管理待訪問節點

? ? ? ? ? 2.訪問當前節點的所有鄰居,再訪問鄰居的鄰居

? ? ? ? 復雜度:時間復雜度?O(|V|+|E|),空間復雜度?O(|V|)?(隊列)

? ? ? ? 應用:尋找最短路徑(無權圖)

2.最短路徑算法

(1)Dijkstra算法

  • 核心思想:貪心策略,逐步擴展當前最短路徑
  • 數學描述:

? ? ? ? 初始化距離?d(s)=0,其他節點?d(u)=\infty

? ? ? ? 優先隊列按距離排序,每次取出距離最小的節點?u

? ? ? ? 對?u?的鄰居?v,松弛操作:

????????????????d(v)=min(d(v),d(u)+w(u,v))

  • 復雜度:使用優先隊列(如斐波那契堆):O(|E|+|V|log|V|)
  • 限制:僅適用于非負權邊

(2)A*算法

  • 啟發式搜索:

? ? ? ? 定義評估函數?f(n)=g(n)+h(n),其中

? ? ? ? ??g(n):從起點到節點?n?的實際代價

? ? ? ? ??h(n):啟發函數,估計?n?到終點的代價

  • 算法步驟:

? ? ? ? 1.優先隊列按?f(n)?排序

? ? ? ? 2.每次擴展?f(n)?最小的節點

? ? ? ? 3.到達終點或隊列為空時終止

  • 應用:PRM路徑規劃中的全局搜索

3.搜索策略優化

(1) 剪枝策略

  • Alpha-Beta算法:

? ? ? ? 用于博弈樹搜索,剪除對最終決策無影響的分支

????????核心思想:若某分支的評估值已不可能優于當前最優解,則停止搜索

  • 應用場景:樹形思維(ToT)中減少無效路徑的探索

(2)多路徑生成與自洽性驗證

  • 蒙特卡洛樹搜索(MCTS):

? ? ? ? 四步驟:選擇(Selection)、擴展(Expansion)、模擬(Simulation)、回溯(Backpropagation)

? ? ? ? 選擇策略:

? ? ? ? 使用Upper Confidence Bound(UCB)平衡探索與利用:

????????????????UCB_{v_{i}}=\frac{Q(v_{i})}{N(v_{i})}+c\sqrt{\frac{ln(N(v))}{N(v_{i})}}

? ? ? ? 其中?Q(v_{i})?為節點價值,N(v_{i})?為訪問次數,c?為探索系數

  • 自洽性:

? ? ? ? 通過生成多條路徑?\left \{ p_1,p_2,...,p_k \right \},投票選擇最一致的答案

? ? ? ? 投票規則:多數投票,廣義投票等...

4.應用

(1)PRM路徑規劃:從理論到實踐:帶你快速學習基于PRM的三種搜索方法-CSDN博客

流程:

  1. 采樣階段:在構型空間中隨機采樣節點(蒙特卡洛采樣)
  2. 連接階段:對鄰近節點嘗試連接,過濾碰撞邊
  3. 查詢階段:使用A*或Dijkstra算法在路線圖中搜索路徑

(2)樹形思維:從理論到實踐:樹形思維探索(ToT)-CSDN博客

樹結構構建:

  1. 根節點為初始問題,子節點為推理步驟的中間假設
  2. 節點擴展策略:基于概率或啟發式生成子節點

(3)并行采樣與順序修訂:從理論到實踐:并行采樣+順序修訂的聯合優化-CSDN博客

聯合優化框架:

  1. 并行采樣:生成多條候選路徑?\left \{ p_i \right \}
  2. 順序修訂:對每條路徑局部優化(如梯度下降修正參數)
  3. 聚合結果:選擇綜合得分最高的路徑

5.核心公式

Dijkstra松弛操作:d(v)=min(d(v),d(u)+w(u,v))

A*評估函數:f(n)=g(n)+h(n)

UCB選擇策略:UCB_{v_{i}}=\frac{Q(v_{i})}{N(v_{i})}+c\sqrt{\frac{ln(N(v))}{N(v_{i})}}

五、信息論

1.熵與信息度量

(1)信息熵

  • 定義:信息熵衡量隨機變量?X?的不確定性,定義為:

????????H(X)=-\sum_{x\in X}^{}P(x)logP(x)

? ? ? ? 單位:以2為底的對數單位為比特(bits),以自然對數?ln?ln?為單位為奈特(nats)

????????直觀解釋:熵越大,不確定性越高。例如,均勻分布的熵最大

  • 示例:拋一枚公平硬幣,P(正面) = P(反面) = 0.5,熵為:

????????H(X)=-0.5log0.5-0.5log0.5=1\:bit

? ? ? ? 若硬幣不均勻(如P(正面) = 0.9),則熵降低為:

????????????????H(X)=-0.9log0.9-0.1log0.1\approx 0.469 \:bit

(2)交叉熵

  • 定義:衡量用分布?Q?近似真實分布?P?的額外成本:

????????H(P,Q)=-\sum_{x}^{}P(x)logQ(x)

  • 應用:

????????分類任務的損失函數(如交叉熵損失)

????????語言模型訓練中,最小化預測分布與真實分布的交叉熵

(3)KL散度

  • 定義:衡量分布?P?與?Q?的差異:

????????D_{KL}(P||Q)=\sum_{x}^{}P(x)log\frac{(P(x))}{Q(x)}=H(P,Q)-H(P)

? ? ? ? 性質: 非負性?D_{KL}(P||Q)\geq 0,非對稱性?D_{KL}(P||Q) \neq D_{KL}(Q||P)

  • 應用:

? ? ? ? 變分推斷中,最小化?D_{KL}(Q||P)?以近似后驗分布

? ? ? ? 模型蒸餾中,讓學生模型分布逼近教師模型

(4)互信息

  • 定義:衡量兩個隨機變量?X?和?Y的相關性:

????????I(X;Y)=H(X)-H(X||Y)=H(Y)-H(Y||X)=D_{KL}(P(X,Y)||P(X)P(Y))

  • 應用:

? ? ? ??特征選擇:選擇與目標變量互信息高的特征

????????多路徑生成:篩選與問題相關性高的推理路徑

2.編碼理論

(1)壓縮編碼基礎

  • 霍夫曼編碼(Huffman Coding)

? ? ? ??原理:為高頻符號分配短碼,低頻符號分配長碼,構建最優前綴碼

????????數學形式:最小化平均碼長?L=\sum_{x}^{}P(x)l(x),其中?l(x)?是符號?x?的碼長

  • 算術編碼(Arithmetic Coding)

? ? ? ? 原理:將整個輸入序列映射到一個區間?[0,1),用區間長度編碼概率

????????優勢:接近香農熵極限,尤其適合高階統計依賴的數據

(2)BPE算法的數學原理:從理論到實踐:字節對編碼(BPE)算法-CSDN博客

3.應用

(1)注意力機制中的信息瓶頸:從理論到實踐:Pytorch實現注意力機制到Triton優化-CSDN博客

(2)模型不確定性的量化:從理論到實踐:absmax、zeropoint和LLM.int8()在gpt-2的應用-CSDN博客

(3)多路徑生成的自洽性驗證:從理論到實踐:CoT的多路徑生成與自洽性-CSDN博客

4.核心公式

信息熵:H(X)=-\sum_{x\in X}^{}P(x)logP(x)

交叉熵:H(P,Q)=-\sum_{x}^{}P(x)logQ(x)

KL散度:D_{KL}(P||Q)=\sum_{x}^{}P(x)log\frac{(P(x))}{Q(x)}=H(P,Q)-H(P)

互信息:I(X;Y)=H(X)-H(X||Y)=H(Y)-H(Y||X)=D_{KL}(P(X,Y)||P(X)P(Y))

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/diannao/78742.shtml
繁體地址,請注明出處:http://hk.pswp.cn/diannao/78742.shtml
英文地址,請注明出處:http://en.pswp.cn/diannao/78742.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

構建智能期貨交易策略分析應用:MCP與AI的無縫集成

引言 隨著金融科技的快速發展,數據驅動的交易決策已成為期貨交易領域的重要趨勢。本文將深入探討一個結合了Model Content Protocol (MCP)和AI技術的期貨交易策略分析應用——Futures MCP。該應用不僅提供了豐富的技術分析工具,還通過MCP協議與大型語言…

0x02.Redis 集群的實現原理是什么?

回答重點 Redis 集群(Redis cluster)是通過多個 Redis 實例組成的,每個主節點實例負責存儲部分的數據,并且可以有一個或多個從節點作為備份。 具體是采用哈希槽(Hash Slot)機制來分配數據,將整…

基本的DOS命令

一.打開CMD方式: winR 輸入cmd 開始系統命令提示符 在任意文件夾下,shift+鼠標右擊,在此處打開命令 資源管理器的地址欄前面輸入cmd 以管理員身份打開cmd:選擇以管理員方式運行 二.常用的Dos命令 #盤符切換 盤符…

深度剖析:架構評估的常用方法與應用

架構評估是確保系統架構滿足需求、性能和質量等方面要求的重要環節,以下是一些常見的架構評估方法的詳細介紹: 一、基于調查問卷或檢查表的評估方法 1.方法概述:該方法通過設計一系列針對性的問題或檢查項,形成問卷或檢查表&…

代碼隨想錄算法訓練營第十六天

LeetCode題目: 530. 二叉搜索樹的最小絕對差501. 二叉搜索樹中的眾數236. 二叉樹的最近公共祖先3272. 統計好整數的數目(每日一題) 其他: 今日總結 往期打卡 530. 二叉搜索樹的最小絕對差 跳轉: 530. 二叉搜索樹的最小絕對差 學習: 代碼隨想錄公開講解 問題: 給你一個二叉搜…

基于雙閉環PID控制器的永磁同步電機控制系統匝間故障Simulink仿真

歡迎微?關注“電擊小子程高興的MATLAB小屋”獲取巨額優惠 1.模型簡介 本仿真模型基于MATLAB/Simulink(版本MATLAB 2013Rb)軟件。建議采用matlab2013 Rb及以上版本打開。(若需要其他版本可聯系代為轉換,高于該版本的matlab均可正…

02-libVLC的視頻播放器:播放音視頻文件以及網絡流

libvlc_new(0, nullptr)功能:創建并初始化libVLC的核心實例,是使用所有libVLC功能的前提。 參數:第一個參數:參數數量(通常設為0)第二個參數:參數列表(通常為nullptr,表示使用默認配置)返回值:成功返回libvlc_instance_t*指針,失敗返回nullptr。注意事項:可通過參…

2025藍橋杯省賽C++B組解題思路

由于題面還沒出來,現在先口胡一下思路 填空題直接打表找規律或者亂搞一下就能出,從大題開始說。 1,題意: 給你一個數組,這個數組里有幾個數可以被一個連續遞增的數字區間求和得出 思路:詐騙題,顯…

防止郵件偽造的策略 SPF 介紹

SPF是Sender Policy Framework的縮寫,即發件人策略框架,是一種用于防止電子郵件偽造的技術,用來驗證發件人郵箱域名的真實性。以下是關于它的詳細說明: 1. 定義與作用 SPF是一種電子郵件驗證系統,它通過在域名的DNS記…

JavaScript Symbol與BigInt

目錄 Symbol類型 一、Symbol 的核心特性 1. 唯一性 2. 不可變性 3. 不可枚舉性 二、創建 Symbol 1. 基礎創建 2. 全局 Symbol 注冊表 三、Symbol 作為對象屬性 1. 定義 Symbol 屬性 2. 遍歷 Symbol 屬性 四、內置 Symbol 值 五、實際應用場景 1. 避免屬性名沖突 …

AI Agent工程師認證-學習筆記(3)——【多Agent】MetaGPT

學習鏈接:【多Agent】MetaGPT學習教程 源代碼鏈接(覺得很好,star一下):GitHub - 基于MetaGPT的多智能體入門與開發教程 MetaGPT鏈接:GitHub - MetaGPT 前期準備 1、獲取MetaGPT (1)使用pip獲取MetaGPT pip install metagpt==0.6.6#或者在國內加速安裝鏡像 #pip in…

【leetcode hot 100 416】分割等和子集

解法一:(動態規劃)①定義:dp[i]表示是否可以在nums找到元素之和為i,dp[sum/21] ②初始狀態:dp[0]true;dp[i]false ③狀態轉移方程:dp[i] dp[i] || dp[i - num]; class Solution {public boole…

高中數學聯賽模擬試題精選第2套幾何題(改編)

在 △ A B C \triangle ABC △ABC 中, 點 M M M 是邊 A C AC AC 的中點. 在線段 A M AM AM, C M CM CM 上分別取點 P P P, Q Q Q, 使得 P Q A C / 2 PQAC/2 PQAC/2. 設 △ A B Q \triangle ABQ △ABQ 的外接圓與邊 B C BC BC 相交于點 X X X, △ B C P \triangle …

UWB雙通道隧道人員定位方案

技術基礎:UWB(超寬帶技術) 定義:UWB(Ultra-Wideband)是一種通過納秒級窄脈沖傳輸數據的無線通信技術,占用500MHz以上的超寬頻段。 核心優勢: 高精度定位:時間分辨率極高&…

Linux 入門八:Linux 多進程

一、概述 1.1 什么是進程? 在 Linux 系統中,進程是程序的一次動態執行過程。程序是靜態的可執行文件,而進程是程序運行時的實例,系統會為其分配內存、CPU 時間片等資源。例如,輸入 ls 命令時,系統創建進程…

MTCNN 人臉識別

前言 此處介紹強大的 MTCNN 模塊,給出demo,展示MTCNN 的 OOP, 以及ROS利用 C 節點,命令行調用腳本執行實際工作的思路。 MTCNN Script import argparse import cv2 from mtcnn import MTCNN import osclass MTCNNProcessor:def…

01_核心系統下的技術原理解析

15年前,基本上國內的核心系統被C壟斷,基本上是IBM的那套東西,場景也是比價復雜,這里不再贅述,TPS太過于龐大,技術上確實比較復雜。為此我這里拋磚引玉,說下對應的支付系統: &#x…

Python 實現最小插件框架

文章目錄 Python 實現最小插件框架1. 基礎實現項目結構plugin_base.py - 插件基類plugins/hello.py - 示例插件1plugins/goodbye.py - 示例插件2main.py - 主程序 2. 更高級的特性擴展2.1 插件配置支持2.2 插件依賴管理2.3 插件熱加載 3. 使用 setuptools 的入口點發現插件3.1 …

電感詳解:定義、作用、分類與使用要點

一、電感的基本定義 電感(Inductor) 是由導線繞制而成的儲能元件,其核心特性是阻礙電流變化,將電能轉化為磁能存儲。 基本公式: 自感電動勢: E -L * (di/dt) (L:電感值&#xff0c…

運行一次性任務與定時任務

運行一次性任務與定時任務 文章目錄 運行一次性任務與定時任務[toc]一、使用Job運行一次性任務1.創建一次性任務2.測試一次性任務3.刪除Job 二、使用CronJob運行定時任務1.創建定時任務2.測試定時任務3.刪除CronJob 一、使用Job運行一次性任務 1.創建一次性任務 (…