交叉熵與相對熵

熵的本質是香農信息量(log\frac{1}{p})的期望。

?

    現有關于樣本集的2個概率分布p和q,其中p為真實分布,q非真實分布。

    按照真實分布p來衡量識別一個樣本的所需要的編碼長度的期望(即平均編碼長度)為:H(p)=\sum_{i}^{} p(i)*log\frac{1}{p(i)}

    如果使用錯誤分布q來表示來自真實分布p的平均編碼長度,則應該是:H(p,q)=\sum_{i}^{} p(i)*log\frac{1}{q(i)}因為用q來編碼的樣本來自分布p,所以期望H(p,q)中概率是p(i)。H(p,q)我們稱之為“交叉熵”。

?

    比如含有4個字母(A,B,C,D)的數據集中,真實分布p=(1/2, 1/2, 0, 0),即A和B出現的概率均為1/2,C和D出現的概率都為0。計算H(p)為1,即只需要1位編碼即可識別A和B。如果使用分布Q=(1/4, 1/4, 1/4, 1/4)來編碼則得到

H(p,q)=2,即需要2位編碼來識別A和B(當然還有C和D,盡管C和D并不會出現,因為真實分布p中C和D出現的概率為0,這里就欽定概率為0的事件不會發生啦)。

    

    可以看到上例中根據非真實分布q得到的平均編碼長度H(p,q)大于根據真實分布p得到的平均編碼長度H(p)。事實上,根據Gibbs' inequality可知,H(p,q)>=H(p)恒成立,當q為真實分布p時取等號我們將由q得到的平均編碼長度比由p得到的平均編碼長度多出的bit數稱為“相對熵”:D(p||q)=H(p,q)-H(p)=\sum_{i}^{} p(i)*log\frac{p(i)}{q(i)},其又被稱為KL散度(Kullback–Leibler divergence,KLD) Kullback–Leibler divergence。它表示2個函數或概率分布的差異性:差

?

異越大則相對熵越大,差異越小則相對熵越小,特別地,若2者相同則熵為0。注意,KL散度的非對稱性。

?

    比如TD-IDF算法就可以理解為相對熵的應用:詞頻在整個語料庫的分布與詞頻在具體文檔中分布之間的差異性。

?

    交叉熵可在神經網絡(機器學習)中作為損失函數,p表示真實標記的分布,q則為訓練后的模型的預測標記分布,交叉熵損失函數可以衡量p與q的相似性。交叉熵作為損失函數還有一個好處是使用sigmoid函數在梯度下降時能避

?

免均方誤差損失函數學習速率降低的問題,因為學習速率可以被輸出的誤差所控制。

PS:通常“相對熵”也可稱為“交叉熵”,因為真實分布p是固定的,D(p||q)由H(p,q)決定。當然也有特殊情況,彼時2者須區別對待。

轉載于:https://www.cnblogs.com/Libo-Master/p/7597710.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/393922.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/393922.shtml
英文地址,請注明出處:http://en.pswp.cn/news/393922.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

menustrip

在對應菜單上點擊鼠標右鍵,插入,SEPARATOR 就可以了,然后可以選中拖動位置。轉載于:https://www.cnblogs.com/Echo529/p/6382302.html

直接排序

題目:使用直接排序法將下列數組(從小到大排序)思路:第一次:使用索引值為0的元素與其他位置的元素挨個比較一次,如果發現比0號索引值的元素小的,那么交換位置,第一輪下來最小值被放在…

leetcode78. 子集(回溯)

給定一組不含重復元素的整數數組 nums,返回該數組所有可能的子集(冪集)。 說明:解集不能包含重復的子集。 示例: 輸入: nums [1,2,3] 輸出: [ [3], [1], [2], [1,2,3], [1,3], [2,3], [1,2], [] ] 代碼 class Solution {pub…

php字符串綜合作業,0418php字符串的操作

實例字符串函數(一):長度計算$siteName php中文網;//獲取內部字符編碼集$encoding mb_internal_encoding();//1、strlen($str):獲取字節表示的字符串長度//utf8模式下,一個中文字符用三個字節表示echo strlen($siteName),; //12//2、mb_strlen($str,$encoding)&…

如何處理JavaScript中的事件處理(示例和全部)

In this blog, I will try to make clear the fundamentals of the event handling mechanism in JavaScript, without the help of any external library like Jquery/React/Vue.在此博客中,我將嘗試在沒有任何外部庫(例如Jquery / React / Vue)的幫助下闡明JavaSc…

js 圖片預覽

//顯示選擇的圖片縮略圖function showImage(inputId,imageConfirmId,imageConfi){var imagedocument.getElementById(inputId).value.toLowerCase();if(!image){return;}var fileExtendimage.substr(image.lastIndexOf(".", image.length)1);if(!(fileExtend"jp…

什么是copyonwrite容器

2019獨角獸企業重金招聘Python工程師標準>>> CopyOnWrite容器即寫時復制的容器。通俗的理解是當往一個容器添加元素的時候,不直接往當前容器添加,而是先將當前容器進行Copy,復制出一個新的容器,然后新的容器里添加元素…

hystrix 源碼 線程池隔離_Hystrix源碼學習--線程池隔離

分析你的系統你所認識的分布式系統,哪些是可以進行垂直拆分的?拆分之后系統之間的依賴如何梳理?系統異構之后的穩定性調用如何保證?這些都是可能在分布式場景中面臨的問題。說個比較常見的問題,大家都知道秒殺系統&…

P2341 [HAOI2006]受歡迎的牛 強連通

題目背景 本題測試數據已修復。 題目描述 每頭奶牛都夢想成為牛棚里的明星。被所有奶牛喜歡的奶牛就是一頭明星奶牛。所有奶 牛都是自戀狂,每頭奶牛總是喜歡自己的。奶牛之間的“喜歡”是可以傳遞的——如果A喜 歡B,B喜歡C,那么A也喜歡C。牛欄…

oracle em agent,ORACLE?11G?EM?配置命令及問題處理

11g裝好以后,一直未用EM,昨天晚上和今天晚上終于抽時間把EM啟動起來了,還遇到一點小問題,1.EM配置的一些命令創建一個EM資料庫emca -repos create重建一個EM資料庫emca -reposrecreate--------這個很主要,一般第一次不成功創建的時…

leetcode89. 格雷編碼

格雷編碼是一個二進制數字系統,在該系統中,兩個連續的數值僅有一個位數的差異。 給定一個代表編碼總位數的非負整數 n,打印其格雷編碼序列。即使有多個不同答案,你也只需要返回其中一種。 格雷編碼序列必須以 0 開頭。 示例 1:…

注重代碼效率_如何提升質量:注重態度

注重代碼效率by Harshdeep S Jawanda通過Harshdeep S Jawanda 如何提升質量:注重態度 (How to skyrocket quality: focus on attitude) When it comes to discussing quality and how we can improve, the most common things that come to peoples minds are test…

spark mllib推薦算法使用

2019獨角獸企業重金招聘Python工程師標準>>> 一、pom.xml <!-- 機器學習包 --><dependency><groupId>org.apache.spark</groupId><artifactId>spark-mllib_2.10</artifactId><version>${spark.version}</version>&…

Android仿QQ復制昵稱效果2

本文同步自http://javaexception.com/archives/77 背景: 在上一篇文章中&#xff0c;給出了一種復制QQ效果的方案&#xff0c;今天就來講講換一種方式實現。主要依賴的是一個開源項目https://github.com/shangmingchao/PopupList。 解決辦法: PopupList.java的代碼封裝的比較完…

R語言的自定義函數—字符組合

前兩天寫了幾個函數&#xff0c;對里面收獲到的一些東西做一些記錄。 函數str_comb&#xff0c;用于輸入一個字符串或數值向量&#xff0c;返回由向量中元素組成的不重復的長度小于向量長度的所有組合&#xff0c;結果用矩陣形式輸出。 函數使用結果如下&#xff1a; 思路很簡單…

oracle group by 兩項,Oracle中group by 的擴展函數rollup、cube、grouping sets

Oracle的group by除了基本使用方法以外&#xff0c;還有3種擴展使用方法&#xff0c;各自是rollup、cube、grouping sets。分別介紹例如以下&#xff1a;1、rollup對數據庫表emp。如果當中兩個字段名為a&#xff0c;b,c。假設使用group by rollup(a,b)&#xff0c;首先會對(a,b…

leetcode1079. 活字印刷(回溯)

你有一套活字字模 tiles&#xff0c;其中每個字模上都刻有一個字母 tiles[i]。返回你可以印出的非空字母序列的數目。 注意&#xff1a;本題中&#xff0c;每個活字字模只能使用一次。 示例 1&#xff1a; 輸入&#xff1a;“AAB” 輸出&#xff1a;8 解釋&#xff1a;可能的…

什么從什么寫短句_從什么到從什么造句

從什么到從什么造句從什么到從什么怎么來造句呢?以下是小編為大家收集整理的從什么到從什么造句&#xff0c;希望對你有所幫助&#xff01;從什么到從什么造句&#xff1a;從聞到花香到看到花朵,從看到花朵到觸摸到花瓣,真是一種美妙的感覺.從今天到明天&#xff0c;從明天到后…

如何開發一個hexo主題_如何確定一個強烈的主題可以使產品開發更有效

如何開發一個hexo主題by Cameron Jenkinson卡梅倫詹金森(Cameron Jenkinson) 如何確定一個強烈的主題可以使產品開發更有效 (How identifying a strong theme can make product development more effective) MVPs always seem easy to execute and build. The first version i…

機器學習基石13-Hazard of Overfitting

注&#xff1a; 文章中所有的圖片均來自臺灣大學林軒田《機器學習基石》課程。 筆記原作者&#xff1a;紅色石頭 微信公眾號&#xff1a;AI有道 上節課主要介紹了非線性分類模型&#xff0c;通過非線性變換&#xff0c;將非線性模型映射到另一個空間&#xff0c;轉換為線性模型…