重讀生成概率模型1----基礎概念

1 KL 散度

KL 散度的作為是描述兩個分布的差異的,首先是度量一個分布,用熵來度量。

1.1 熵

在介紹熵之間,首先要度量單個事件的信息量
I(x)=?logP(x)I(x)=-logP(x)I(x)=?logP(x)
整體的信息量
H(P)=Ex?P[?logP(x)]=?∑P(x)logP(x) \begin{aligned} H(P) &=E_{x~P}[-logP(x)] \\ & = -\sum P(x)logP(x) \end{aligned} H(P)?=Ex?P?[?logP(x)]=?P(x)logP(x)?

1.2 KL 散度

原本數據真實的分布應該是p(x),但是現在搞錯了,搞成q(x)
本來一個信息應該用-logP(x)描述,現在變成了-logq(x),
DKL(P∣∣Q)=Ex?p[logP(x)Q(x)]=∑xP(x)logP(x)Q(x) \begin{aligned} D_{KL}(P||Q)=E_{x~p}[log\frac{P(x)}{Q(x)}]=\sum_xP(x)log\frac{P(x)}{Q(x)} \end{aligned} DKL?(P∣∣Q)=Ex?p?[logQ(x)P(x)?]=x?P(x)logQ(x)P(x)??

1.3 應用

  • softmax分類問題的KL散度
    對于每個樣本來說,正確的類別
    P(xk)=1,Q(xk)=exkex1+ex2+...+exnDKL(P∣∣Q)=?logQ(xk)=?logexkex1+ex2+...+exn \begin{aligned} P(x_k)=1,Q(x_k)=\frac{e^{x_k}}{e^{x_1}+e^{x_2}+...+e^{x_n}} \\ D_{KL}(P||Q)=-logQ(x_k) =-log\frac{e^{x_k}}{e^{x_1}+e^{x_2}+...+e^{x_n}} \end{aligned} P(xk?)=1,Q(xk?)=ex1?+ex2?+...+exn?exk??DKL?(P∣∣Q)=?logQ(xk?)=?logex1?+ex2?+...+exn?exk???
  • 高斯分布問題的KL 散度
    P(x)=12πe?x22logP(x)=?12log(2π)?x22Q(x)=12πσe?(x?μ)22σ2logQ(x)=?12log(2π)?(x?μ)22σ2?log(σ)DKL(P∣∣Q)=Ep[logP(x)?logQ(x)]=Ep[logσ+(x?μ)22σ2?x22]DKL(P∣∣Q)=log(σ)+12σ2Ep[(x?μ)2]?12Ep(x2)DKL(P∣∣Q)=log(σ)+1+μ22σ2?12 \begin{aligned} P(x)=\frac{1}{\sqrt{2\pi}} e^{\frac{-x^2}{2}} \\ logP(x)=-\frac{1}{2}log(2\pi)-\frac{x^2}{2} \\ Q(x)=\frac{1}{\sqrt{2\pi}\sigma} e^{\frac{-(x-\mu)^2}{2\sigma^2}} \\ logQ(x)=-\frac{1}{2}log(2\pi)-\frac{(x-\mu)^2}{2\sigma^2}-log(\sigma) \\ D_{KL}(P||Q)=E_p[logP(x)-logQ(x)]=E_p[log_{\sigma}+\frac{(x-\mu)^2}{2\sigma^2}-\frac{x^2}{2} ]\\ D_{KL}(P||Q)=log(\sigma)+\frac{1}{2\sigma^2}E_p[(x-\mu)^2]-\frac{1}{2}E_p(x^2) \\ D_{KL}(P||Q)=log(\sigma)+\frac{1+\mu^2}{2\sigma^2}-\frac{1}{2} \end{aligned} P(x)=2π?1?e2?x2?logP(x)=?21?log(2π)?2x2?Q(x)=2π?σ1?e2σ2?(x?μ)2?logQ(x)=?21?log(2π)?2σ2(x?μ)2??log(σ)DKL?(P∣∣Q)=Ep?[logP(x)?logQ(x)]=Ep?[logσ?+2σ2(x?μ)2??2x2?]DKL?(P∣∣Q)=log(σ)+2σ21?Ep?[(x?μ)2]?21?Ep?(x2)DKL?(P∣∣Q)=log(σ)+2σ21+μ2??21??

其中,直覺的理解是總平方距離=抖動平方+偏移的平方
Ep[(x?μ)2]=Ep[(x?E(x)+E(x)?μ)2]=Ep[(x?E(x)2)]+2Ep[x?E(x)][E(x)?μ]+Ep[(E(x)?μ)2]=var(x)+μ2 \begin{aligned} E_p[(x-\mu)^2] &=E_p[(x-E(x)+E(x)-\mu)^2] \\ & = E_p[(x-E(x)^2)]+2E_p[x-E(x)][E(x)-\mu]+E_p[(E(x)-\mu)^2] \\ & = var(x)+\mu^2 \end{aligned} Ep?[(x?μ)2]?=Ep?[(x?E(x)+E(x)?μ)2]=Ep?[(x?E(x)2)]+2Ep?[x?E(x)][E(x)?μ]+Ep?[(E(x)?μ)2]=var(x)+μ2?

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/98277.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/98277.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/98277.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

排查解決磁盤占用高問題(容器掛載的磁盤)

最近遇到磁盤占用高的告警,記錄一下解決的思路。 首先是系統觸發告警,通知我們某臺機器磁盤占用高。(或其他途徑得知) 通過XShell登錄該機器。 執行df-h命令查看掛載占用情況找到真正占用高的掛載點掛載點/home目錄占用高&#xf…

流體(1)

流體 Minecraft 中的流體(Fluid),也常被稱為液體(Liquid),是一類能夠自由流動、形成河流、瀑布或湖泊的特殊方塊。它們的行為基于簡化的流體力學,是游戲世界中動態環境的重要組成部分。 ?? 流體是什么? 在 Minecraft 中,流體核心特點包括: 源方塊與流動:每個流…

機器學習-卷積神經網絡(CNN)

全連接層->卷積層 用有一個隱藏層的MLP訓練ImageNet數據集(300*300的圖像,有1000個類別),要有10000個輸出 會有10億個可學習的參數,量太大 全連接:一個輸出是根據所有輸入加權得到在圖片中識別物體&…

Ubuntu 磁盤擴容與擴容失敗問題解決( df -h 與 GParted 顯示空間不一致的問題 -LVM)

在管理 Linux 磁盤時,你是否遇到過這樣的困惑:正常擴容之后,發現GParted 顯示某個分區還有幾十 GiB 可用,但 df -h 卻提示該分區已接近滿額?這種 “空間幻覺” 背后是系統存儲管理的分層設計,本文將從原理到…

PyQt5中QLineEdit控件數值顯示與小數位數控制

在PyQt5應用程序開發中,QLineEdit控件常用于顯示和編輯文本內容。當需要用它來顯示數值并控制小數位數時,開發者需要掌握一些特定的技巧。本文將深入探討幾種實現方法,每種方法都附帶完整獨立的代碼示例。 數值格式化基礎 在Python中&#xf…

LangChain使用方法以OpenAI 的聊天模型GPT-4o為例

以使用 OpenAI 的聊天模型(如 GPT-4)為例,從設置環境、初始化模型、調用模型到處理響應的各個方面進行介紹: 1. 環境設置 安裝 langchain-openai 包。設置環境變量 OPENAI_API_KEY,用于認證(以linux為例&am…

Oracle為數據大表創建索引方案

在日常業務中,避免不了為數據量大表補充創建索引的情況,如果快速、有效地創建索引成了一個至關重要的問題(注意:雖然提供有ONLINE在線執行的方式,理想狀態下不會阻塞DML操作,但ONLINE在開始、結束的兩個時刻…

網站服務相關問題

目錄 HTTP常見的狀態碼 http和https的區別以及使用的端口號 http處理請求的過程 https認證過程 正向代理和反向代理的區別 HTTP常見的狀態碼 HTTP(超文本傳輸協議)定義了一系列的狀態碼,用于表示客戶端請求的處理結果。以下是一些常見的…

Go并發編程實戰:深入理解Goroutine與Channel

Go并發編程實戰:深入理解Goroutine與ChannelGo并發編程實戰:深入理解Goroutine與Channel概述1. 為什么是Go的并發?從“線程”與“協程”說起2. Goroutine:如何使用?3. Channel:Goroutine間的安全通信創建與…

2025服貿會“海淀之夜”,點亮“科技”與“服務”底色

2025年9月12日傍晚,北京頤和園,十七孔橋旁,2025年中國國際服務貿易交易會“海淀之夜”如約而至。在“海淀之夜”,科技機構、金融機構、咨詢服務機構、出海服務企業以及跨國企業和國際友人等,將目光聚焦于此。被第三方機…

qt使用camke時,采用vcpkg工具鏈設置VTK的qt模塊QVTKOpenGLNativeWidget

下載:QVTKOpenGLNativeWidget嵌入qt應用中資源-CSDN下載 1.通過vcpkg安裝VTK,目前的VTK里面默認為qt6,如果需要安裝qt5,需要將端口配置進行修改 筆者的vcpkg的vtk端口路徑:D:\vcpkg\ports\vtk portfile.cmake 修改點: #第一處 #file(READ "${CURRENT_INSTALLED_DIR}/sh…

Axios在鴻蒙應用開發中的使用

目錄一、簡介二、安裝與配置三、axios用法1.axios泛型參數(1).第三個泛型參數-約束data請求參數的類型(2).第二個泛型參數-決定后臺返回數據的類型2.axios攔截器3.請求工具封裝統一處理業務狀態碼錯誤統一處理401或404錯誤一、簡介 Axios 是一個基于 Promise 的網絡請求庫&…

第九周文件上傳

文件上傳漏洞 不同的網站要不同的webshell。我們使用是php開發的網站。 一服務器白名單繞過 服務端白名單(Whitelist)是?種安全機制,它只允許預定義的合法元素通過(只有有限的元素進入),其他所有內容默認被拒絕。相比黑名單&am…

計算機視覺必讀論文:從經典到前沿

計算機視覺必讀論文:從經典到前沿 一、前言 二、經典論文解讀? 2.1 圖像分類? 2.1.1 《ImageNet Classification with Deep Convolutional Neural Networks》(AlexNet)? 2.1.2 《Very Deep Convolutional Networks for Large-Scale Image Recognition》(VGGNet)? 2.1.…

對比PowerBI的字段參數,QuickBI的已選字段還有改進的空間

對比PowerBI的字段參數,QuickBI的已選字段還有改進的空間 之前分享過QuickBI的已選字段 vs PowerBI的字段參數,QuickBI可以在表格中實現PowerBI的字段參數效果,甚至比PowerBI實現的過程和使用方式更絲滑。 但如果應用到圖形中會怎么樣呢&am…

飛算JavaAI:Java開發新時代的破曉之光

免責聲明:此文章的所有內容皆是本人實驗測評,并非廣告推廣,并非抄襲。如有侵權,請聯系,謝謝!【#飛算JavaAl炫技賽】 【#Java開發】摘要:飛算JavaAI作為全球首款聚焦Java的智能開發助手&#xff…

vulntarget-c靶場內網滲透

1. 環境搭建 2.對ubuntu20的滲透 對其進行端口掃描 訪問80端口 發現是laravel框架。版本是v8.78.1 使用 kaili 自帶的msf 進行滲透 search laravel use exploit/multi/php/ignition_laravel_debug_rce執行利用完成檢測 上傳木馬 先將木馬進行base64編碼 <?php eval($_P…

基于大模型多模態的人體體型評估:從“尺碼測量”到“視覺-感受”范式

基于大模型多模態的人體體型評估&#xff1a;從“尺碼測量”到“視覺-感受”范式摘要&#xff1a;傳統體型識別依賴CV骨架/關鍵點與像素量尺&#xff0c;容易受衣物、發型、姿態、光照影響&#xff0c;且“厘米級數值”與穿衣體驗、審美感受之間存在鴻溝。本文提出一種基于大模…

【docker】——docker國內可用的源

不知道哪里來的&#xff0c;但是可以用。1. 解決方案打開配置文件&#xff08;若文件不存在&#xff0c;會自動創建&#xff09; sudo vim /etc/docker/daemon.json將以下內容粘貼進去{"builder": {"gc": {"defaultKeepStorage": "20GB&quo…

【Windows端口管理】快速查看和釋放被系統保留的TCP端口

問題描述在Windows系統開發時&#xff0c;經常遇到端口無法使用的問題。系統會自動保留一系列TCP/UDP端口范圍&#xff0c;導致應用程序無法綁定這些端口。查看所有被保留的端口范圍查看TCP保留端口# 查看所有TCP端口排除范圍 netsh interface ipv4 show excludedportrange pro…