信息量、香農熵、交叉熵、KL散度總結

信息量

對于一個事件而言,它一般具有三個特征:

  • 小概率事件往往具有較大的信息量

  • 大概率事件往往具有較小的信息量

  • 獨立事件的信息量相互可以相加

比如我們在買彩票這個事件中,彩票未中獎的概率往往很高,對我們而言一點也不稀奇,給我們帶來的信息量很小,彩票中大獎的概率往往非常低,中一次大獎則是非常罕見,給我們帶來的信息量很大。

如何描述信息量大小呢?有如下定義:

其中p(x)描述某一事件發生的概率,1/p(x)反映了信息量與發生概率之間成反比,取對數是為了?獨立事件的信息量相互可以相加(第三個特征)。

有如下例子:

拋一枚硬幣,根據正面朝上和反面朝上的概率計算其信息量

其中,當正反概率相等時,信息量對等;當正反概率不等時,概率越小的事件其信息量越大。

當我們對信息量這一概念有一個初步理解后,我們繼續往下看關于熵的定義

?香農熵(Shannon Entropy)

熵:針對一個概率分布所包含的平均信息量

相當于計算一個概率分布中信息量的期望

由于熵這一概念是由科學家香農所提出,故熵又被稱作香農熵(注意這里的熵與物理學中的熵不是同一個意思)。

?對于離散的概率分布,計算香農熵的公式如下所示:

?對于連續的概率分布,計算香農熵的公式如下所示:?

以離散的概率分布為例,我們可以看到,計算香農熵就是將每個事件的概率乘以其對應的信息量并進行向加求得。

我們同樣回到拋硬幣的例子:

計算每種情況的香農熵

?通過以上例子我們不難發現:

在一個概率分布中,當概率密度函數分布比較均勻的時候,隨機事件發生的情況變得更加不確定,相應地,對應的熵更大;當概率密度函數分布比較聚攏的時候,隨機事件發生的情況變得更加確定,相應地,對應的熵更小。

現在我們對熵的概念也有了一個基本的了解,我們繼續往下看交叉熵。

交叉熵(Cross Entropy)

我們先不急著看概念,我們先看一個例子,同樣是拋硬幣的例子:

如果我們事先并不知道每個事件真實的概率p,我們可以先對其進行估計q,并計算在q下的信息量I,那我們可以計算在真實概率分布p下的平均信息量的估計,這個估計就稱作交叉熵。

我們看一下交叉熵的公式(離散概率分布):

連續概率分布交叉熵計算公式如下:

我們利用估計的信息量I^q_i計算在真實概率下P的熵便稱為交叉熵。

根據上面的公式,我們計算一下在不同估計下的交叉熵:

從中我們可以發現,在不同估計下計算的交叉熵要大于香農熵(可以看下在之前在計算不同概率分布下的香農熵)。這是為什么呢?我們接著往下看。

KL散度(Kullback-Leibler Diergence)

一種定量衡量兩個概率分布之間差異的方法:交叉熵與熵之間的差異。

如果理解了之前的熵和交叉熵,KL散度的定義也相對容易理解。

離散概率分布下的KL散度的計算公式如下:

連續概率分布下的KL散度的計算公式如下:

直觀理解KL散度,可以看作在Q表示P所損失的信息量,KL 散度越大,說明 P和 Q的差異越大

KL散度有如下性質:

KL散度永遠大于等于0 ,可通過吉布斯不等式證明。

這也就說明了為什么在不同估計下計算的交叉熵要大于等于香農熵,只有當p和q相等時,交叉熵才等于香農熵。

p和q交換后得出的KL散度不相等,因此KL散度不能看作距離,但可以用來優化模型

在機器學習中,如果想要優化一個模型,KL散度是一個重要的衡量標準,可通過最小化KL散度使模型最優。其中,在優化過程中,我們對其q進行梯度優化,由于p與q無關,故為0,最終梯度優化公式如下:

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/902090.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/902090.shtml
英文地址,請注明出處:http://en.pswp.cn/news/902090.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

使用C語言的cJSON中給JSON字符串添加轉義

在 cJSON 庫中,沒有直接提供 一個函數來專門給 JSON 字符串添加轉義(如將 " 轉義為 \",\n 轉義為 \\n 等)。 但 cJSON 在 序列化(cJSON_Print 或 cJSON_PrintUnformatted) 時會自動處理轉義字符…

宇樹機器狗go2—slam建圖(1)點云格式

0.前言 上一篇番外文章教大家如何在宇樹機器狗go2的gazebo仿真環境中實現簡單的導航運動,本期文章會教大家如何讓宇樹的機器狗go2在仿真環境中進行slam建圖時經常會遇到的一些點云格式,在后續的slam建圖和slam算法解析的時候會經常與這些點云信息打交道…

linux socket編程之udp(實現客戶端和服務端消息的發送和接收)

目錄 一.創建socket套接字(服務器端) 二.bind將prot與端口號進行綁定(服務器端) 2.1填充sockaddr_in結構 2.2bind綁定端口 三.直接通信(服務器端) 3.1接收客戶端發送的消息 3.2給客戶端發送消息 四.客戶端通信 4.1創建socket套接字 4.2客戶端bind問題 4.3直接通信即可…

第1期:Python基礎語法入門

1.1 Python簡介 Python是一種解釋型、面向對象、動態數據類型的高級編程語言。它設計簡潔,易于學習,適合初學者。Python廣泛應用于數據科學、人工智能、Web開發、自動化腳本等領域。它的語法簡潔易懂,強調代碼的可讀性。 1.2 安裝Python與配…

使用EXCEL繪制平滑曲線

播主播主,你都多少天沒更新了!!!泥在干什么?你還做這個賬號麻?!!! 做的做的(哭唧唧),就是最近有些忙,以及…… 前言&…

當算力遇上馬拉松:一場科技與肉身的極限碰撞

目錄 一、從"肉身苦修"到"科技修仙" 二、馬拉松的"新大陸戰爭" 三、肉身會被算法"優化"嗎? 馬拉松的下一站是"人機共生"時代 當AI能預測你的馬拉松成績,算法能規劃最佳補給方案,智能裝備讓訓練效率翻倍——你還會用傳…

MLLMs for TSAD ?

項目鏈接:Multimodal LLMs Advance Time Series Analysis 代碼鏈接:https://github.com/mllm-ts/VisualTimeAnomaly 出處:ICLR 2025 一 文章動機 多模態 LLM (MLLM) 通過 “視覺” 方式處理時序的潛力仍未充分探索; 人類檢測 “時序異常” 的自然方式:可視化、文本描…

開發基于python的商品推薦系統,前端框架和后端框架的選擇比較

開發一個基于Python的商品推薦系統時,前端和后端框架的選擇需要綜合考慮項目需求、開發效率、團隊熟悉度以及系統的可擴展性等因素。 以下是一些推薦的框架和建議: 后端框架 Flask 優點: 輕量級:Flask的核心非常簡潔,…

chili3d調試筆記2+添加web ui按鈕

onclick 查找 打個斷點看看 挺可疑的,打個斷點看看 挺可疑的,打個斷點看看 打到事件監聽上了 加ui了 加入成功 新建彈窗-------------------------------------- 可以模仿這個文件,寫彈窗 然后在這里注冊一下,外部就能調用了 對了…

【重學Android】1.關于@Composer注解的一點知識筆記

最新因為一些原因,開始重新學習Android及kotlin編程,也覺得可以順帶記錄下這個過程中的一些知識點,也可以用作日后自己查找復習。 Composable 注解在 Android 開發中的使用 Composable 是 Jetpack Compose(Android 的現代聲明式…

qt+mingw64+cmake+libqrencode項目編譯和搭建成功記錄

最近要使用高拍儀拍照獲取照片,然后識別照片中的二維碼數據、使用QZxing只能識別出一個條碼、另外一個條碼準備測試用其他的開源項目(如libqrencode-4.1.1)來進行測試,故進行本文的項目環境搭建測試,最后成功。 本機開…

【今日三題】判斷是不是平衡二叉樹(遞歸) / 最大子矩陣(二維前綴和) / 小蔥的01串(滑動窗口)

??個人主頁:小羊 ??所屬專欄:每日兩三題 很榮幸您能閱讀我的文章,誠請評論指點,歡迎歡迎 ~ 目錄 判斷是不是平衡二叉樹(遞歸)最大子矩陣(二維前綴和)小蔥的01串(滑動窗口) 判斷是不是平衡二叉樹(遞歸) 判斷是不是平衡二叉…

【Linux】線程ID、線程管理、與線程互斥

📚 博主的專欄 🐧 Linux | 🖥? C | 📊 數據結構 | 💡C 算法 | 🌐 C 語言 上篇文章: 【Linux】線程:從原理到實戰,全面掌握多線程編程!-CSDN博客 下…

定制一款國密瀏覽器(10):移植SM2算法前,解決錯誤碼的定義問題

上一章中,我給大家介紹了 SM4 在 BoringSSL 上的移植要點,本來計劃本章介紹 SM2 算法的移植要點。在移植 SM2 過程中,遇到了一個攔路虎,所以先掃除這個攔路虎,這就是錯誤碼的定義問題。 在銅鎖中,引入了幾個錯誤碼和錯誤字符串,在文件 sm2_err.c 中: static const ER…

JDOM處理XML:Java程序員的“樂高積木2.0版“

各位代碼建筑師們!今天我們要玩一款比原生DOM更"Java友好"的XML積木套裝——JDOM!它像樂高得寶系列(Duplo)一樣簡單易用,卻能讓你的XML工程穩如霍格沃茨城堡!(溫馨提示:別…

【后端開發】Spring日志

文章目錄 Spring日志日志作用日志測試日志信息日志級別日志配置配置日志級別日志持久化日志文件分割 注解的使用 Spring日志 日志作用 系統監控:可以通過日志記錄這個系統的運行狀態,對數據進行分析,設置不同的規則,超過閾值時進…

探索大語言模型(LLM):Transformer 與 BERT從原理到實踐

Transformer 與 BERT:從原理到實踐 前言一、背景介紹二、核心公式推導1. 注意力機制(Attention Mechanism)2. 多頭注意力機制(Multi-Head Attention)3. Transformer 編碼器(Transformer Encoder&#xff09…

計算機網絡八股——HTTP協議與HTTPS協議

目錄 HTTP1.1簡述與特性 1. 報文清晰易讀 2. 靈活和易于擴展 3. ?狀態 Cookie和Session 4. 明?傳輸、不安全 HTTP協議發展過程 HTTP/1.1的不足 HTTP/2.0 HTTP/3.0 HTTPS協議 HTTP協議和HTTPS協議的區別 HTTPS中的加密方式 HTTPS中建立連接的方式 前言&#xff…

QML中的3D功能--入門開發

Qt Quick 提供了強大的 3D 功能支持,主要通過 Qt 3D 模塊實現。以下是 QML 中開發 3D 應用的全面指南。 1. 基本配置 環境要求 Qt 5.10 或更高版本(推薦 Qt 6.x) 啟用 Qt 3D 模塊 支持 OpenGL 的硬件 項目配置 在 .pro 文件中添加: QT += 3dcore 3drender 3dinput 3dex…

Git合并分支的兩種常用方式`git merge`和`git cherry-pick`

Git合并分支的兩種常用方式git merge和git cherry-pick 寫在前面1. git merge用途工作方式使用git命令方式合并使用idea工具方式合并 2. git cherry-pick用途工作方式使用git命令方式合并使用idea工具方式合并 3. 區別總結 寫在前面 一般我們使用git合并分支常用的就是git mer…