Angular Loss論文理解

Angular Loss論文理解

  • 一、相較于Triplet loss
  • 二、Angular loss的意義
  • 三、Angular loss的優點
  • 四、Angular Loss
  • 五、實施細節
  • 六、訓練細節
  • 七、未來構想

一、相較于Triplet loss

Triplet loss在訓練時,收斂較難

  1. 每個三元組需要三次抽樣,然而將某個數據集中所有三元組羅列出來是不實際的,因此需要高效取樣策略。
  2. 目標是將inter-class間的距離推遠到margin m以上,然而使用全局統一margin m是不合理的,因為現實世界中,intra-class的距離有很大變化
  3. 從函數的梯度運算公式來看,每個sample的梯度只考慮兩個點之間的關聯,不會考慮第三個點。
    在這里插入圖片描述在這里插入圖片描述
    在這里插入圖片描述

二、Angular loss的意義

在這里插入圖片描述
因為anchor和positive samples屬于同一個類別,因此可以對稱地推導出
在這里插入圖片描述

由于an邊和pn邊的距離都應該大于ap邊,根據余弦定理,最短的變ap對應的角∠n ≤ min(∠a, ∠p)
又因為,三角形內角和=180度,因此∠n 應該小于60度,因此得到一個upper bound:
在這里插入圖片描述

三、Angular loss的優點

  1. Angle是一個similarity transform invariant(相似變換不變量) metric,與三角形邊的相對關系成比例。用一個固定的α ,能夠適用與feature map的任意縮放
  2. 相較于Triplet loss,只考慮兩個邊。∠n的計算需要同時考慮三個邊,提升優化的魯棒性和高效性
  3. Margin m的選取沒有有意義的參考,而 α 的設置有具體且可解釋的幾何學意義

四、Angular Loss

如圖Fig3(a),當∠a大于90度時,減小∠n可能會使negative 靠近anchor,出現不穩定case
因此,通過外界圓C,和垂直于nc邊的超平面P,產生兩個新的點,圓心Xc 和相交點Xm。通過變換Xa到Xc,和變換Xp到Xm,得到一個新的三角形。
目標變成:減小∠n′ -> 減小 tan∠n′
在這里插入圖片描述
在這里插入圖片描述
在這里插入圖片描述
對應的梯度計算:
在這里插入圖片描述

五、實施細節

  1. 取樣策略:采用N-pair loss論文中的取樣邏輯,取N/2個classes,每個class隨機取2個samples,構成N個tuplets——由同class的2個samples構成anchor和positive,N-1個negatives取自其他不同classes
  2. 平滑loss函數:
    1. 基于以下不等式
      在這里插入圖片描述

    2. 假設feature為單元長度:||x|| = 1
      得到:
      在這里插入圖片描述
      在這里插入圖片描述

    3. 結合N-pair Loss:λ = 2
      在這里插入圖片描述

六、訓練細節

  1. 對于類目數量多的數據集,使用0.0001的LR;對于類目較少的數據集,使用0.00001的LR
  2. α的選擇對訓練結果會有影響,不同的數據集,最佳α不同,一般固定在36度~55度最佳
  3. 單獨使用AL時,根據α的選擇,效果和NL不相上下,NL&AL的效果最好

七、未來構想

三元組再往上,形成四元組,構成一個triangular pyramid(三角錐體),關注一個點到另外三個點構成平面的距離關系

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/896757.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/896757.shtml
英文地址,請注明出處:http://en.pswp.cn/news/896757.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

加入二極管的NE555 PWM 電路

只用電阻、電容構成的一般定時電路的占空比無法低于50%,如下圖: 電容的充電路徑上串聯了R1 和R2,而放電路徑上只有R2,所以放電的時間不可能比充電長。加入二極管就能解決這個問題,用二極管把充電和放電路徑分離開&…

本地部署大語言模型-DeepSeek

DeepSeek 是國內頂尖 AI 團隊「深度求索」開發的多模態大模型,具備數學推理、代碼生成等深度能力,堪稱"AI界的六邊形戰士"。 Hostease AMD 9950X/96G/3.84T NVMe/1G/5IP/RTX4090 GPU服務器提供多種計費模式。 DeepSeek-R1-32B配置 配置項 規…

[AI機器人] Web-AI-Robot機器人前瞻版--比奇堡海之霸凱倫

文章目錄 簡述開源Web-AI-Robot 項目-比奇堡-海之霸-凱倫 技術架構效果預覽 簡述 本項目配合前端項目bikini_bottom_karen_ui運行,來源于柒杉工作室(截止2025.2,目前我自己)。 打造一個只需要在瀏覽器上運行的AI智能機器人&#…

250302-綠聯NAS通過Docker配置SearXNG及適配Open-WebUI的yaml配置

A. 配置Docker中的代理 綠聯NAS簡單解決docker無法獲取鏡像-不用軟路由 - 嗶哩嗶哩 B. 下載官網對應的鏡像 群暉NAS用docker搭建SearXNG元搜索引擎_嗶哩嗶哩_bilibili C. 修改默認省略的參數,只配置Base_URL,刪除其它默認的空缺項 searxng-docker/REA…

java容器 LIst、set、Map

Java容器中的List、Set、Map是核心數據結構,各自適用于不同的場景 一、List(有序、可重復) List接口代表有序集合,允許元素重復和通過索引訪問,主要實現類包括: ArrayList 底層結構:動態數組…

3471. 找出最大的幾近缺失整數

3471. 找出最大的幾近缺失整數 class Solution:# 輔助方法,判斷第三種情況,只有首位兩個元素有可能為最大幾近缺失數def f(self,nums,x):return -1 if x in nums else xdef largestInteger(self, nums: List[int], k: int) -> int:n len(nums)if k …

【異常錯誤】No module named ‘taming.modules.vqvae‘

錯誤&#xff1a; File "/mnt/d/Pycharm_workspace/text2image/OmniGen-version/OmniGen/latentDiffusion/ldm/models/autoencoder.py", line 6, in <module> from taming.modules.vqvae.quantize import VectorQuantizer2 as VectorQuantizer ModuleNotF…

快檢查達夢庫怎么了

扁鵲的弟弟來了 要求5分鐘定位達夢數據庫問題 #!/bin/bash## content 實例個數 告警日志 實例狀態 用戶連接 活動會話 鎖 集群狀態 服務狀態 磁盤空間 cpu mem 偵聽及日志 ## scope 單機、DW、DSC Linux 多實例 ## example 將腳本保存為d.sh&#xff0c;用root用執行&#…

C++20中`constexpr`的顯著增強

文章目錄 1. **更多標準庫函數支持constexpr**2. **支持動態內存分配**3. **支持虛函數和多態**4. **支持try-catch異常處理**5. **更靈活的控制流**6. **支持std::initializer_list**7. **支持修改union活躍成員**8. **允許更多類型的非類型模板參數**總結 C20對 constexpr進…

Tomcat 亂碼問題徹底解決

1. 終端亂碼問題 找到 tomcat 安裝目錄下的 conf —> logging.properties .修改ConsoleHandler.endcoding GBK &#xff08;如果在idea中設置了UTF-8字符集&#xff0c;這里就不需要修改&#xff09; 2. CMD命令窗口設置編碼 參考&#xff1a;WIN10的cmd查看編碼方式&…

以太坊測試網

文章目錄 什么是測試網如何使用測試網獲取測試以太幣 什么是測試網 測試網&#xff08;Testnet&#xff09;是一個模擬以太坊主網&#xff08;Mainnet&#xff09;行為的區塊鏈網絡。它允許開發人員和用戶在不使用真實資金的情況下測試智能合約和應用程序。雖然測試網上的代幣…

算法隨筆_62: 買賣股票的最佳時機

上一篇:算法隨筆_61:二進制求和-CSDN博客 題目描述如下: 給定一個數組 prices &#xff0c;它的第 i 個元素 prices[i] 表示一支給定股票第 i 天的價格。 你只能選擇 某一天 買入這只股票&#xff0c;并選擇在 未來的某一個不同的日子 賣出該股票。設計一個算法來計算你所能獲…

騰訊混元文生圖大模型(Hunyuan-DiT)與Stable Diffusion(SD)對比分析

騰訊混元文生圖大模型&#xff08;Hunyuan-DiT&#xff09;與Stable Diffusion&#xff08;SD&#xff09;對比分析 騰訊混元文生圖大模型&#xff08;Hunyuan-DiT&#xff09;與Stable Diffusion&#xff08;SD&#xff09;作為當前文生圖領域的兩大代表模型&#xff0c;各自…

【HTML—前端快速入門】HTML 基礎

準備工作 vscode下載 百度網盤 Subline Text 下載 Sublime Text下載 百度網盤 vscode 下載 Sublime Text 是一款輕量好用的文本編輯器&#xff0c;我們在寫前端代碼時&#xff0c;使用 Sublime Text 打開比使用記事本打開&#xff0c;得到的代碼體驗更好&#xff0c;比 vscode…

基于單片機的GPS定位系統設計

1 系統硬件 1.1單片機模塊 單片機的種類和型號可以說是有成百上千種&#xff0c;很多大的公司和企業都生產開發自己的單片機芯片&#xff0c;并且廣泛應用于各種產品。Intel、 philips、 摩托羅拉、凌陽、宏晶等等種類繁多。大體上可以分為51系列單片機和非51系列單片機。 其…

對大模型輸出的 logits 進行處理,從而控制文本的生成

對大模型輸出的 logits 進行處理&#xff0c;從而控制文本的生成 flyfish 在文本生成任務中&#xff0c;模型輸出的 logits 代表了每個詞被選為下一個生成詞的未歸一化概率得分。通過對 logits 進行處理&#xff0c;可以精確地控制文本的生成 基本原理 在每一步生成過程中&…

Reids緩存穿透、緩存雪崩和緩存擊穿

Redis緩存中常見的三個問題&#xff1a;緩存穿透、緩存雪崩和緩存擊穿。這些問題在使用Redis作為緩存時經常遇到&#xff0c;但通過合理的策略可以有效解決。我會用簡單易懂的方式來講解&#xff0c;幫助你理解這些問題的原理和解決方案。 1. 緩存穿透 1.1 什么是緩存穿透&…

附錄-Python — 包下載緩慢,配置下載鏡像

1??命令行配置 pip config set global.index-url http://mirrors.aliyun.com/pypi/simple/ pip config set install.trusted-host mirrors.aliyun.com 2??配置文件配置 1、打開文件夾&#xff0c;輸入 %APPDATA% 回車 2、打開 %APPDATA% 路徑&#xff0c;并在此路徑下新建…

VS 2019 免費版 下載與安裝 教程說明

推薦大家直接轉到第13步&#xff0c;點擊鏈接即可下載VS2019版本 1.VS官網 2.登錄賬號 3.在搜索欄輸入“2019” 4.點擊2019這個標題 5.點擊“下載” 6.選擇合適的版本下載 7.打開下載文件&#xff08;若下載過程總是轉圈圈&#xff0c;則換個網絡下載即可&#xff09; 8.安…

介紹 torch-mlir 從 pytorch 生態到 mlir 生態

一、引言 The Torch-MLIR project provides core infrastructure for bridging the PyTorch ecosystem and the MLIR ecosystem. For example, Torch-MLIR enables PyTorch models to be lowered to a few different MLIR dialects. Torch-MLIR does not attempt to provide a…