數學模型:十大距離

十大距離

文章目錄

  • 十大距離
    • 定義
      • 1. 歐氏距離(Euclidean Distance)
      • 2. 曼哈頓距離(Manhattan Distance)
      • 3. 切比雪夫距離(Chebyshev Distance)
      • 4. 閔可夫斯基距離(Minkowski Distance)
      • 5. 標準化歐氏距離(Standardized Euclidean Distance)
      • 6. 馬氏距離(Mahalanobis Distance)
      • 7. 余弦距離(Cosine Distance)
      • 8. 漢明距離(Hamming Distance)
      • 9. 杰卡德距離(Jaccard Distance)
      • 10. 相關距離(Correlation Distance)
    • 應用范圍
      • 歐氏距離
      • 曼哈頓距離
      • 切比雪夫距離
      • 閔可夫斯基距離
      • 標準化歐氏距離
      • 馬氏距離
      • 余弦距離
      • 漢明距離
      • 杰卡德距離
      • 相關距離

定義

1. 歐氏距離(Euclidean Distance)

歐氏距離是最常用的距離度量方法之一,它衡量的是多維空間中兩點之間的直線距離。

  • 原理:對于二維平面上的兩點 a=(x1,y1)a = (x_1, y_1)a=(x1?,y1?)b=(x2,y2)b = (x_2, y_2)b=(x2?,y2?),歐氏距離定義為:

d=(x1?x2)2+(y1?y2)2d = \sqrt{(x_1 - x_2)^2 + (y_1 - y_2)^2}d=(x1??x2?)2+(y1??y2?)2?

2. 曼哈頓距離(Manhattan Distance)

曼哈頓距離也稱為城市街區距離,它計算的是沿坐標軸方向的距離總和。

  • 原理:對于二維平面上兩點 a=(x1,y1)a = (x_1, y_1)a=(x1?,y1?)b=(x2,y2)b = (x_2, y_2)b=(x2?,y2?),曼哈頓距離通常定義為
    d=∣x1?x2∣+∣y1?y2∣d = |x_1 - x_2| + |y_1 - y_2|d=x1??x2?+y1??y2?

3. 切比雪夫距離(Chebyshev Distance)

切比雪夫距離也稱為棋盤距離,它衡量的是兩點之間的最大坐標差。

  • 原理:對于二維平面上的兩點 a=(x1,y1)a = (x_1, y_1)a=(x1?,y1?)b=(x2,y2)b = (x_2, y_2)b=(x2?,y2?),切比雪夫距離定義為:
    d=max?(∣x1?x2∣,∣y1?y2∣)d = \max(|x_1 - x_2|, |y_1 - y_2|) d=max(x1??x2?,y1??y2?)

4. 閔可夫斯基距離(Minkowski Distance)

閔可夫斯基距離是歐氏距離、曼哈頓距離和切比雪夫距離的一般化形式。

  • 原理:對于二維平面上的兩點 a=(x1,y1)a = (x_1, y_1)a=(x1?,y1?)b=(x2,y2)b = (x_2, y_2)b=(x2?,y2?),閔可夫斯基距離定義為:
    d=(∣x1?x2∣p+∣y1?y2∣p)1pd = (|x_1 - x_2|^p + |y_1 - y_2|^p)^{\frac{1}{p}}d=(x1??x2?p+y1??y2?p)p1?

其中 ppp 是參數,當 p=1p = 1p=1 時,它等同于曼哈頓距離;當p=2p = 2p=2 時,它等同于歐氏距離;當 p→∞p \to \inftyp時,它等同于切比雪夫距離。

5. 標準化歐氏距離(Standardized Euclidean Distance)

標準化歐氏距離考慮了各個特征的尺度差異,通過標準差進行歸一化。

  • 原理:對于二維平面上的兩點 a=(x1,y1)a = (x_1, y_1)a=(x1?,y1?)b=(x2,y2)b = (x_2, y_2)b=(x2?,y2?),標準化歐氏距離定義為:
    d=(x1?x2)2sx2+(y1?y2)2sy2d = \sqrt{\frac{(x_1 - x_2)^2}{s_x^2} + \frac{(y_1 - y_2)^2}{s_y^2}}d=sx2?(x1??x2?)2?+sy2?(y1??y2?)2??

其中 sxs_xsx?sys_ysy? 分別是 xxxyyy維度的標準差。

6. 馬氏距離(Mahalanobis Distance)

馬氏距離考慮了特征之間的相關性,是標準化歐氏距離的進一步推廣。

  • 原理:對于二維向量 a\mathbf{a}ab\mathbf{b}b,馬氏距離定義為:
    d=(a?b)TS?1(a?b)d = \sqrt{(\mathbf{a} - \mathbf{b})^T \mathbf{S}^{-1} (\mathbf{a} - \mathbf{b})}d=(a?b)TS?1(a?b)?
    其中 S\mathbf{S}S 是樣本協方差矩陣。

7. 余弦距離(Cosine Distance)

余弦距離衡量的是兩個向量之間的夾角,常用于文本分析和推薦系統。

  • 原理:對于兩個向量 a\mathbf{a}ab\mathbf{b}b,余弦相似度定義為:
    cos?(θ)=a?b∥a∥∥b∥\cos(\theta) = \frac{\mathbf{a} \cdot \mathbf{b}}{\|\mathbf{a}\| \|\mathbf{b}\|}cos(θ)=a∥∥ba?b?
    余弦距離則定義為:
    d=1?cos?(θ)d = 1 - \cos(\theta)d=1?cos(θ)

8. 漢明距離(Hamming Distance)

漢明距離用于衡量兩個等長字符串之間對應位置的不同字符的個數,雖然它通常用于字符串,但我們可以用二維平面上的二進制網格來可視化它。

  • 原理:對于兩個等長字符串(或二進制向量)a\mathbf{a}a 和 ( \mathbf{b} ),漢明距離定義為:
    d=∑i=1n[ai≠bi]d = \sum_{i=1}^{n} [a_i \neq b_i]d=i=1n?[ai?=bi?]
    其中 [ai≠bi][a_i \neq b_i][ai?=bi?] 是指示函數,當 ai≠bia_i \neq b_iai?=bi? 時為 1,否則為 0 。

9. 杰卡德距離(Jaccard Distance)

杰卡德距離用于衡量兩個集合的相似度。

  • 原理:對于兩個集合 AAABBB,杰卡德相似系數定義為:
    J(A,B)=∣A∩B∣∣A∪B∣J(A, B) = \frac{|A \cap B|}{|A \cup B|}J(A,B)=ABAB?
    杰卡德距離則定義為:
    d=1?J(A,B)d = 1 - J(A, B)d=1?J(A,B)

10. 相關距離(Correlation Distance)

相關距離基于皮爾遜相關系數,用于衡量兩個變量之間的線性關系。

  • 原理:對于兩個變量 XXXYYY,皮爾遜相關系數定義為:
    ρ=Cov(X,Y)σXσY\rho = \frac{\text{Cov}(X, Y)}{\sigma_X \sigma_Y}ρ=σX?σY?Cov(X,Y)?

相關距離則定義為:
d=1?∣ρ∣d = 1 - |\rho|d=1?ρ

應用范圍

歐氏距離

  • 數據挖掘與機器學習:在聚類算法(如K-Means聚類)中,用于衡量樣本點之間的相似性,以確定樣本的歸屬類別 。
  • 計算機圖形學:計算圖形中頂點之間的距離,判斷圖形的形狀和位置關系,例如在三維模型的變形和對齊操作中。
  • 地理信息系統(GIS):計算地圖上兩點之間的實際距離,輔助路徑規劃、位置分析等。

曼哈頓距離

  • 城市規劃與交通領域:模擬城市街區中兩點之間的實際通行距離,在路徑規劃、物流配送路線計算等方面有應用 ,例如計算快遞員在城市街區中的送貨路線長度。
  • 網格系統與棋盤游戲:在一些基于網格的游戲(如國際象棋等)中,衡量棋子移動的步數距離 ,或者在二維網格地圖中計算兩點間的最短移動距離。

切比雪夫距離

  • 棋盤類游戲算法:在國際象棋、圍棋等棋盤游戲的AI算法中,用于評估棋子之間的威脅程度或距離,例如判斷一個棋子在多步內能夠到達的范圍 。
  • 圖像處理與計算機視覺:在圖像中判斷像素點之間的最大位移距離,用于圖像分割、目標跟蹤等場景。

閔可夫斯基距離

  • 數據的泛化距離度量:作為歐氏距離、曼哈頓距離等的一般化形式,可根據不同的參數 ( p ) 靈活調整距離度量方式,適用于多種需要自定義距離度量的場景,如在不同特征分布的數據集中尋找合適的距離度量方式 。
  • 機器學習模型評估:在評估模型預測結果與真實值之間的差異時,通過調整 ( p ) 值來關注不同類型的誤差,例如 ( p = 1 ) 時更關注絕對誤差,( p = 2 ) 時更關注平方誤差 。

標準化歐氏距離

  • 多特征數據的距離度量:當數據集中不同特征的尺度差異較大時,如在分析身高(厘米級)和體重(千克級)對個體分類的影響時,標準化歐氏距離能夠消除特征尺度的影響,準確衡量樣本之間的相似性 。
  • 模式識別與分類:在手寫數字識別、圖像分類等模式識別任務中,對不同維度特征進行標準化后再計算距離,提高分類的準確性 。

馬氏距離

  • 考慮特征相關性的數據處理:在金融風險評估中,多個財務指標之間往往存在相關性,馬氏距離可以考慮這些相關性,更準確地評估不同投資組合之間的相似性或風險程度 。
  • 異常檢測:通過考慮數據的協方差結構,能夠更有效地檢測出數據集中的異常點,例如在網絡流量監測中識別異常的流量模式 。

余弦距離

  • 文本挖掘與信息檢索:用于計算文本之間的相似度,在搜索引擎中,判斷搜索關鍵詞與文檔內容的相關性,或者在文本分類中衡量文本之間的相似程度 。
  • 推薦系統:基于用戶對不同物品的評分向量,計算用戶之間或物品之間的相似度,為用戶提供個性化推薦,如電影推薦、音樂推薦等 。

漢明距離

  • 編碼與通信領域:用于檢測和糾正數據傳輸過程中的錯誤,衡量編碼之間的差異程度,例如在糾錯碼(如漢明碼)中判斷編碼的正確性 。
  • 生物信息學:比較DNA序列、蛋白質序列之間的差異,研究生物進化關系或物種間的親緣關系 。

杰卡德距離

  • 集合數據分析:在社交網絡分析中,計算用戶興趣集合的相似度,用于推薦相似興趣的用戶,或者在文本分析中,衡量兩個文本中關鍵詞集合的相似性 。
  • 圖像識別與目標檢測:判斷圖像中目標物體的重疊程度,在多目標檢測算法中,評估檢測結果與真實目標之間的相似度 。

相關距離

  • 統計學與數據分析:在研究變量之間的線性關系時,通過相關距離判斷變量之間的關聯程度,例如在經濟學中分析不同經濟指標之間的相關性 。
  • 機器學習中的特征選擇:評估特征之間的相關性,去除高度相關的冗余特征,提高模型的訓練效率和泛化能力 。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/88257.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/88257.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/88257.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

流水線(Jenkins)打包拉取依賴的時候提示無法拉取,需要登錄私倉的解決辦法

在日常工作中,遇到了Jenkins拉取部門內部組件庫失敗的情況,原因是組件庫后面放到了阿里云私倉,并且是沒有公開的,所以就會有如下提示的,一開始我實在.npmrc文件寫死阿里云提供的接入token,后面發現可能是因…

操作系統王道考研習題

1.1.4本節習題精選 一、單項選擇題 01.操作系統是對()進行管理的軟件。 A.軟件 B.硬件 C.計算機資源 D.應用程序 01.c 操作系統管理計算機的硬件和軟件資源,這些資源統稱為計算機資源。注意,操作系統不僅管理處理機、存儲器等硬件…

C語言extern的用法(非常詳細,通俗易懂)

以往我們都是將所有的代碼寫到一個源文件里面,對于小程序,代碼不過幾百行,這或許無可厚非,但當程序膨脹代碼到幾千行甚至上萬行后,就應該考慮將代碼分散到多個文件中,否則代碼的閱讀和維護將成為一件痛苦的…

Git【開源分布式版本控制工具】安裝-配置-常用指令-Git遠程倉庫-IDEA使用Git

參考博客:Git(分布式版本控制工具)_為什么嗶哩嗶哩有些視頻沒有字幕-CSDN博客 Git就是一個類似于百度云盤的倉庫;重點是要掌握使用idea操作Git,企業用的最多,一般不會去使用命令 Git通過不斷階段保存文件…

JavaScript數組鍵值去重方法

使用 filter 和 Map 根據鍵值去重我來詳細解釋方法2,這是一種高效且簡潔的數組去重方法,特別適合根據對象中的某個鍵值進行去重操作。完整代碼function uniqueByKey(arr, key) {return [...new Map(arr.map(item > [item[key], item])).values()]; }分…

【機器學習筆記Ⅰ】9 特征縮放

特征縮放(Feature Scaling)詳解 特征縮放是機器學習數據預處理的關鍵步驟,旨在將不同特征的數值范圍統一到相近的尺度,從而加速模型訓練、提升性能并避免某些特征主導模型。1. 為什么需要特征縮放? (1) 問題背景 量綱不…

10.9 大模型訓練數據優化實戰:3步讓準確率從68%飆升至79%

大模型訓練過程分析與數據優化 一、訓練過程關鍵指標分析 (插入mermaid流程圖:訓練過程監控與優化閉環) #mermaid-svg-Gni031LkHA93fQYM {font-family:"trebuchet ms",verdana,arial,sans-serif;font-size:16px;fill:#333;}#mermaid-svg-Gni031LkHA93fQYM .erro…

深度學習模型在C++平臺的部署

一、概述深度學習模型能夠在各種生產場景中發揮重要的作用,而深度學習模型往往在Python環境下完成訓練,因而訓練好的模型如何在生產環境下實現穩定可靠的部署,便是一個重要內容。C開發平臺廣泛存在于各種復雜的生產環境,隨著業務效…

若以部署在linux,nginx反向代理,登錄404,刷新404問題

history模式在router下面的index.js文件的最下面history: createWebHistory(import.meta.env.VITE_APP_CONTEXT_PATH),這兩個配置文件都加上然后nginx里面的配置是這個位置按照實際情況,我的是用docker掛載的,所以在/usr/share/nginx/html/lw-clothing為…

SQL Server通過存儲過程實現HTML頁面生成

引言在現代企業應用中,數據可視化是提升決策效率的關鍵。SQL Server作為核心數據庫管理系統,不僅處理數據存儲和查詢,還具備強大的擴展能力。通過存儲過程直接生成HTML頁面,企業能減少對中間層(如Web服務器或應用程序&…

qt繪制餅狀圖并實現點擊即放大點擊部分

做得比較low #ifndef TEST_POWER_H #define TEST_POWER_H#include <QWidget> #include <QtMath> #include <QPainter> #include <QPushButton> #include <QVector> #include <cmath>namespace Ui { class test_power; } struct PieData {Q…

HashMap的put、get方法詳解(附源碼)

put方法 HashMap 只提供了 put 用于添加元素&#xff0c;putVal 方法只是給 put 方法調用的一個方法&#xff0c;并沒有提供給用戶使用。 對 putVal 方法添加元素的分析如下&#xff1a;如果定位到的數組位置沒有元素 就直接插入。如果定位到的數組位置有元素就和要插入的 key …

雙立柱式帶鋸床cad【1張總圖】+設計說明書+絳重

雙立柱式帶鋸床 摘 要 隨著機械制造技術的進步&#xff0c;制造業對于切割設備的精度、效率和穩定性要求越來越高。雙立柱式帶鋸床作為一種重要的切割設備&#xff0c;必須能夠滿足工業生產對于高精度、高效率的需求。 雙立柱式帶鋸床是一種重要的工業切割設備&#xff0c;其結…

在線JS解密加密配合ECC保護

在線JS解密加密配合ECC保護 1. ECC加密簡介 定義 ECC&#xff08;Elliptic Curve Cryptography&#xff09;是一種基于橢圓曲線數學的公鑰加密技術&#xff0c;利用橢圓曲線離散對數問題&#xff08;ECDLP&#xff09;實現高安全性。 背景 1985年&#xff1a;Koblitz&#xff0…

使用 Docker Compose 簡化 INFINI Console 與 Easysearch 環境搭建

前言回顧 在上一篇文章《搭建持久化的 INFINI Console 與 Easysearch 容器環境》中&#xff0c;我們詳細介紹了如何使用基礎的 docker run 命令&#xff0c;手動啟動和配置 INFINI Console (1.29.6) 和 INFINI Easysearch (1.13.0) 容器&#xff0c;并實現了關鍵數據的持久化&…

Word 怎么讓段落對齊,行與行之間寬一點?

我們來分兩步解決&#xff1a;段落對齊 和 調整行距。 這兩個功能都集中在Word頂部的【開始】選項卡里的【段落】區域。 第一步&#xff1a;讓段落對齊 “對齊”指的是段落的左右邊緣如何排列。通常有四種方式。 操作方法&#xff1a;將鼠標光標點在你想修改的那個段落里的任意…

Attention機制完全解析:從原理到ChatGPT實戰

一、Attention的本質與計算步驟 1.1 核心思想 動態聚焦&#xff1a;Attention是一種信息分配機制&#xff0c;讓模型在處理輸入時動態關注最重要的部分。類比&#xff1a;像人類閱讀時用熒光筆標記關鍵句子。 1.2 計算三步曲&#xff08;以"吃蘋果"為例&#xff09; …

2025年3月青少年電子學會等級考試 中小學生python編程等級考試三級真題答案解析(判斷題)

博主推薦 所有考級比賽學習相關資料合集【推薦收藏】1、Python比賽 信息素養大賽Python編程挑戰賽 藍橋杯python選拔賽真題詳解

HTML5 新特性詳解:從語義化到多媒體的全面升級

很多小伙伴本都好奇&#xff1a;HTML5有什么功能是以前的HTML沒有的&#xff1f; 今天就給大家說道說道 HTML5 作為 HTML 語言的新一代標準&#xff0c;帶來了諸多革命性的新特性。這些特性不僅簡化了前端開發流程&#xff0c;還大幅提升了網頁的用戶體驗和功能性。本文將深入…

mac安裝docker

1、下載docker-desktop https://www.docker.com/products/docker-desktop/2、安裝&#xff0c;雙擊安裝 3、優化docker配置 默認配置 cat ~/Library/Group\ Containers/group.com.docker/settings-store.json {"AutoStart": false,"DockerAppLaunchPath": …