metric learning -- 馬氏距離與歐氏距離

一 基本概念

?方差:(variance)是在概率論和統計方差衡量隨機變量或一組數據時離散程度的度量。概率論中方差用來度量隨機變量和其數學期望(即均值)之間的偏離程度。統計中的方差(樣本方差)是每個樣本值與全體樣本值的平均數之差的平方值的平均數。在許多實際問題中,研究方差即偏離程度有著重要意義。

在統計描述中,方差用來計算每一個變量(觀察值)與總體均數之間的差異。為避免出現離均差總和為零,離均差平方和受樣本含量的影響,統計學采用平均離均差平方和來描述變量的變異程度。總體方差計算公式:
為總體方差,為變量,為總體均值,為總體例數。
記住,歐氏距離不是方差,歐氏距離是定義了兩個值之間的距離!!!!!!
同樣,馬氏距離也不是協方差!!!!!!!

協方差:標準差與方差是描述一維數據的,當存在多維數據時,我們通常需要知道每個維數的變量中間是否存在關聯。協方差就是衡量多維數據集中,變量之間相關性的統計量。比如說,一個人的身高與他的體重的關系,這就需要用協方差來衡量。如果兩個變量之間的協方差為正值,則這兩個變量之間存在正相關,若為負值,則為負相關。

在概率論和統計學中,協方差用于衡量兩個變量的總體誤差。而方差是協方差的一種特殊情況,即當兩個變量是相同的情況。
期望值分別為E[X]與E[Y]的兩個實隨機變量XY之間的協方差Cov(X,Y)定義為:
從直觀上來看,協方差表示的是兩個變量總體誤差的期望。
如果兩個變量的變化趨勢一致,也就是說如果其中一個大于自身的期望值時另外一個也大于自身的期望值,那么兩個變量之間的協方差就是正值;如果兩個變量的變化趨勢相反,即其中一個變量大于自身的期望值時另外一個卻小于自身的期望值,那么兩個變量之間的協方差就是負值。
如果XY是統計獨立的,那么二者之間的協方差就是0,因為兩個獨立的隨機變量滿足E[XY]=E[X]E[Y]。

?

二 馬氏距離

馬氏距離是由印度統計學家馬哈拉諾比斯(P. C. Mahalanobis)提出的,表示數據的協方差距離。

協方差矩陣,當變量多了,超過兩個變量了。那么,就用協方差矩陣來衡量這么多變量之間的相關性。假設 X 是以 n 個隨機變數(其中的每個隨機變數是也是一個向量,當然是一個行向量)組成的列向量:

?

?

?

?馬氏距離:它是一種有效的計算兩個未知樣本集的相似度的方法。與歐氏距離不同的是它考慮到各種特性之間的聯系(例如:一條關于身高的信息會帶來一條關于體重的信息,因為兩者是有關聯的)并且是尺度無關的(scale-invariant),即獨立于測量尺度。

?

?

?將馬氏距離用于人臉識別時,x是預測出的數值,μ是期望(標簽)。人臉圖像大小為200*200時,那么x應該是200*200大小的,相應地,協方差矩陣也時一個大矩陣的,而Dm(x)則是標量。

而歐氏距離用于人臉識別,x是預測出的額值,μ是期望(標簽)。人臉圖像大小為200*200時,那么X也是200*200的,但是輸出σ2也是標量。

?

?

knn中,使用馬氏距離比使用歐式距離好,為什么?

knn中,使用馬氏距離,則協方差矩陣是訓練集的協方差矩陣。d=(x-y)‘R^-1(x-y)

使用歐式距離d = (x-y)’(x-y)

不同之處在于馬氏距離,多乘一個R^-1,從而得到的距離必然與歐氏距離不同。而給x分類的關鍵局勢距離的大小,選擇合適的距離度量是大事。

但說到底,都是計算兩個距離,然后使用投票方式,選出x的標簽。

http://blog.csdn.net/zb1165048017/article/details/48579743

?

轉載于:https://www.cnblogs.com/mengmengmiaomiao/p/7597533.html

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/454564.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/454564.shtml
英文地址,請注明出處:http://en.pswp.cn/news/454564.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

深入理解 C# 協變和逆變

msdn 解釋如下: “協變”是指能夠使用與原始指定的派生類型相比,派生程度更大的類型。 “逆變”則是指能夠使用派生程度更小的類型。 解釋的很正確,大致就是這樣,不過不夠直白。 直白的理解: “協變”->”和諧的變”…

華為mate20能用鴻蒙嗎,華為mate20可以用5g網絡嗎

華為mate20不可以用5g網絡,它是4g手機在2018年上市,當時5g并沒有開始流行,因此mate20是不支持5G的。不過在后來的2019年秋季,華為發布了mate20 x的5g版本,這也是mate20系列里唯一支持5G的,除此之外mate20、…

基本農田衛星地圖查詢_#重慶朝天門#谷歌百度騰訊高德“衛星地圖”PK,谷歌更勝一籌...

截圖自便民查詢網,各家衛星地圖PK,各有千秋~谷歌精確度最高:5m,來福士修建中,嘉陵江是綠的,長江是黃的。兩江交匯處有一條分明的界線。谷歌 5m:20ft谷歌 50m:100ft谷歌 200m:500ft谷歌 300m:1000ft谷歌 500…

軟件開發者面試百問答案,老紫竹研究室出品(已經有64個)

當然,全部是我個人的答案,不代表別人。地址 www.laozizhu.com/program.jsp?typeId104 老紫竹研究室,分享軟件開發的快樂與收獲 ‘ 我這里貼上已經寫好的答案連接。 軟件開發者面試百問答案 - 你需要哪些東西幫助你判斷項目是否符合時間要求…

Python 第三方庫之 Celery 分布式任務隊列

一、Celery介紹和使用: Celery 是一個 基于python開發的分布式異步消息任務隊列,通過它可以輕松的實現任務的異步處理, 如果你的業務場景中需要用到異步任務,就可以考慮使用celery, 舉幾個實例場景中可用的例子: 你想…

windows server 2008 (五)web服務器的搭建和部署

Windows server 2008 web服務器的搭建和部署相對于windows server 2003的IIS6來說,windows server 2008推出的IIS7.0為管理員提供了統一的web平臺,為管理員和開發人員提供了一個一致的web解決方案。并針對安全方面做了改進,可以減少利用自定義…

改裝摩托車

摩托車發動機就是將進入氣缸中的燃料混合氣點燃使其燃燒所產生的熱能變為機械能,并由曲軸將動力通過傳動機構傳給摩托車后輪而變為車輛行駛動力的機械。發動機的進排氣量和氣流速是影響高轉速(功率)輸出的關鍵因素之一。 發動機工作時氣流的路…

華為鴻蒙os logo,華為鴻蒙OS Logo曝光:Powered by HarmonyOS

IT之家 9 月 13 日消息 9 月 10 日,鴻蒙 OS 2.0 亮相華為開發者大會的主舞臺上,華為常務董事、消費者業務 CEO 余承東表示,鴻蒙 OS 是首個真正為全場景時代打造的分布式操作系統,鴻蒙 OS 2.0 全面使能全場景生態。現在博主 勇氣數…

python判斷語句_詳解Python判斷語句的使用方法

本篇介紹Python判斷語句的使用,主要討論簡單條件語句、多重條件語句和嵌套條件語句,在講解的每個案例中都配有流程圖和代碼說明。通過本篇的學習,可以達成如下目標。 ● 掌握判斷語句的使用規則 ● 判斷語句流程圖的畫法 前面我們學習了Pytho…

迫在眉睫的職業規劃

對于大多數程序員來說,微軟是一家值得崇敬的公司,能夠加入微軟,也是很多程序員的愿望。在付出足夠的努力后,一旦進入了微軟,也就意味著可以和最先進的技術終日為伍,一直沿著技術這條路線走下去了。對嗎&…

js setTimeout 使用方法

在項目過程中遇到一些異步加載和其他js方法沖突的問題: 如圖初始化的時候會加載“商戶基本信息”,修改商戶名稱字段第二個頁面也需要修改: function setSeqAndName(){var pritab2 $("#allTabs").tabs("getTab", 1).find("ifra…

python中分支結構包括哪些_python中的分支結構

python不提供switch語句,但是python可以通過字典實現switch語句的功能 實現方法分兩步: 首先:定義一個地點 其次:調用字典的get()獲取相應的表達式 原始方法: from __future__ import division #內置函數,解…

機器學習算法之 logistic、Softmax 回歸

邏輯回歸本質是分類問題,而且是二分類問題,不屬于回歸,但是為什么又叫回歸呢。我們可以這樣理解,邏輯回歸就是用回歸的辦法來做分類。它是在線性回歸的基礎上,通過Sigmoid函數進行了非線性轉換,從而具有更強…

html上傳預覽圖片原理,關于html中圖片上傳預覽的實現

functionchange() {varpicdocument.getElementById("preview"),filedocument.getElementById("f");//得到后綴名varextfile.value.substring(file.value.lastIndexOf(".")1).toLowerCase();//gif在IE瀏覽器暫時無法顯示if(ext!png&&ext!…

程序員成功之路

程序員成功之路 ——The road ahead for programmer(演講稿) 一、我很羨慕在座的各位同學,因為你們是中國未來的程序員,而我不是,我一直很遺憾。 比爾蓋茨曾經寫過一本書叫做《未來之路》The road ahead, 那么今天我選…

【溫故知新】——原生js中常用的四種循環方式

一、引言 本文主要是利用一個例子,講一下原生js中常用的四種循環方式的使用與區別: 實現效果: 在網頁中彈出框輸入0 網頁輸出“歡迎下次光臨”在網頁中彈出框輸入1 網頁輸出“查詢中……”在網頁中彈出框輸入2 網頁輸出“取款中……”在…

部署egg需要用到pm2嗎_使用寶塔面板部署校園綜合服務平臺項目

本文檔為校園綜合服務平臺服務端的安裝部署教程,歡迎star小程序端下載地址:https://github.com/landalfYao/help.git后臺服務端下載地址:https://github.com/landalfYao/helpserver.git后臺客戶端下載地址:https://github.com/lan…

機器學習算法之線性回歸

一、什么是回歸算法 回歸算法是一種有監督算法 回歸算法是一種比較常用的機器學習算法,用來建立“解釋”變量(自變量X)和觀測值(因變量Y)之間的關系;從機器學習的角度來講,用于構建一個算法模型(函數)來做屬性(X)與標簽(Y)之間的映射關系&a…

html中怎么寫多選框,如何在HTML中實現“選擇所有”復選框?

checkboxes document.getElementsByName(foo);for(var checkbox in checkboxes)checkbox.checked source.checked;} Toggle AllBar 1 Bar 2Bar 3 Bar 4最新情況:這個for each...in構造在Safari 5或Chrome 5中似乎不起作用,至少在本例中是這樣的。這段代…

Console-算法[for]-國王與老人的六十四格

ylbtech-Arithmetic:Console-算法[for]-國王與老人的六十四格1.A,案例-- -- ylb:算法-- Type:算法[for]-- munu:國王與老人的六十四格-- 20:32 2012/3/16-- 案例:印度有個國王,他擁有超人的權力和巨大的財富。但權力和財富最終讓他…