DECOUPLING REPRESENTATION AND CLASSIFIER FOR LONG-TAILED RECOGNITION

摘要

在本文中,我們將學習過程解耦為表征學習和分類,系統地探究不同的平衡策略如何對長尾識別產生影響。研究結果令人驚訝:(1)數據不平衡在學習高質量表征時可能并非問題;(2)通過最簡單的實例平衡(自然)采樣學習得到的表征,僅通過調整分類器也有可能實現強大的長尾識別能力。我們進行了大量實驗,并在常見的長尾基準測試(如ImageNet-LT、Places-LT和iNaturalist)上創造了新的最先進性能,表明通過使用一種將表示與分類解耦的簡單方法,有可能超越精心設計的損失函數、采樣策略,甚至是帶有記憶的復雜模塊。

引言

大多數方法都是將用于識別的分類器與數據表示聯合學習。然而,這種聯合學習方案使得長尾識別能力是如何實現的變得不明確——它是來自于學習更好的表示,還是通過移動分類器決策邊界更好地處理數據不平衡問題呢?為了回答這個問題,我們退一步,將長尾識別解耦為表征學習和分類。
具體來說,我們首先訓練模型,使用不同的采樣策略來學習表征,包括標準的基于實例的采樣、類別平衡采樣以及兩者的混合。接下來,我們研究三種不同的基本方法,以便在所學表征的基礎上,獲得具有平衡決策邊界的分類器。
1、以類別平衡的方式對參數化線性分類器進行重新訓練
2、非參數最近類均值分類器,它根據數據與訓練集中特定類別的最近均值表示來對數據進行分類。
3、對分類器權重進行歸一化,這直接調整權重大小以使其更加平衡,并引入一個溫度參數來調節歸一化過程。

我們進行了大量實驗,將上述解耦學習方案的實例與同時訓練分類器和表征的傳統方案進行比較。

貢獻
1、我們發現,將表征學習與分類解耦會產生驚人的結果,這對長尾識別的常見觀點提出了挑戰:實例均衡采樣能夠學習到最佳且最具泛化性的表征。
Instance-balanced sampling 是指在訓練過程中 每一個樣本(instance)被采樣的概率是均等的,而不管其所屬類別的頻率如何。
2、 在長尾識別中,在表征學習過程中重新調整聯合學習的分類器所指定的決策邊界是有利的:我們的實驗表明,這可以通過使用類別平衡采樣重新訓練分類器來實現,或者通過一種簡單但有效的分類器權重歸一化方法來實現,該方法只有一個控制“溫度”的超參數,并且不需要額外的訓練。
3、通過將解耦學習方案應用于標準網絡(如ResNeXt),我們在多個長尾識別基準數據集(包括ImageNet-LT、Places-LT和iNaturalist)上,取得了比成熟的最先進方法(不同的采樣策略、新的損失設計和其他復雜模塊)顯著更高的準確率。

Learning representations for long-tailed recognition

對于長尾識別問題,訓練集在類別上遵循長尾分布。由于在訓練過程中,我們對于出現頻率較低的類別數據較少,因此使用不平衡數據集訓練的模型往往在少樣本類別上表現出欠擬合的情況。 但在實際應用中,我們感興趣的是獲得能夠很好地識別所有類別的模型。

在本節中,我們考慮在長尾識別中將表征與分類解耦。我們提出了一些學習分類器的方法,旨在通過采用不同的采樣策略進行微調,或通過諸如最近類均值分類器等其他非參數方法,來修正頭部類別和尾部類別的決策邊界。

Classifier Re-training

一種直接的方法是使用類別平衡采樣重新訓練分類器。也就是說,在保持特征表示不變的情況下,我們隨機重新初始化并使用類別平衡采樣在少量輪次內優化分類器權重W和b。
最近,類似的方法也在(Zhang等人,2019年)中用于長尾視頻數據集上的動作識別。

Nearest Class Mean classifier

另一種常用的方法是,首先在訓練集上計算每個類別的平均特征表示,然后使用余弦相似度或在L2歸一化平均特征上計算的歐幾里得距離來執行最近鄰搜索。盡管它很簡單,但這是一個強大的基線(參見第5節中的實驗評估);余弦相似度通過其固有的歸一化緩解了權重不平衡問題。

τ -normalized classifier (τ -normalized).

我們研究了一種高效地重新平衡分類器決策邊界的方法。每個分類器權重wj的范數和該類別的樣本數量nj呈明顯關系:
1、哪個類的樣本多,它的分類器權重就大,這就會導致softmax層中該類擁有更強的競爭力,容易被模型預測為這個類。
然而,如果我們在特征提取部分固定之后,對分類器進行微調,且微調過程中使用class-balanced sampling,即每類樣本等量訓練,那么各類別的分類器權重范數就會趨于一致。
再訓練一遍分類頭部,樣本均衡采樣,每類“發言權”相同,
? 所以每類分類器權重就不會因為樣本多寡而出現偏差;
? 從而修正原本偏向頭部類的決策邊界。
受上述觀察結果的啟發,我們考慮通過以下τ歸一化過程直接調整分類器權重范數,來糾正決策邊界的不平衡問題。

在這里插入圖片描述

實驗

在這里插入圖片描述
無論是整體性能,還是中樣本和少樣本類別,趨勢都是一致的,漸進平衡采樣的效果最佳。正如預期,實例平衡采樣在多樣本類別上表現最佳。這是可以預料到的,因為最終得到的模型嚴重偏向于多樣本類別。我們在聯合訓練中對不同采樣策略的研究結果,驗證了相關工作中嘗試設計更好的數據采樣方法的有效性。

聯合學習還是解耦學習?對于圖1中展示的大多數情況,就整體性能以及除多示例情況外的所有類別劃分而言,使用解耦方法的性能明顯更好。即使是非參數的最近類均值(NCM)方法在大多數情況下也極具競爭力,而對比關系變換(cRT)和τ歸一化方法在很大程度上優于聯合訓練的基線(即比聯合學習的分類器高出5%),甚至在整體準確率上比采用漸進平衡采樣的最佳聯合訓練設置還要高出2%。對于中示例和少示例類別,提升幅度甚至更高,分別達到5%和11%。

為了進一步證明我們關于解耦特征表示與分類器是有益的這一觀點,我們進行了將主干網絡(ResNeXt - 50)與線性分類器聯合微調的實驗。在表1中,我們展示了使用標準學習率或較小(0.1倍)學習率對整個網絡進行微調、僅微調主干網絡的最后一個模塊,或者僅重新訓練線性分類器并固定特征表示時的結果。對整個網絡進行微調會產生最差的性能(46.3%和48.8%),而保持特征表示固定的性能最佳(49.5%)。對于中/少樣本類別,這種趨勢更加明顯。該結果表明,對于長尾識別而言,解耦特征表示與分類器是可取的。
在這里插入圖片描述
實例平衡采樣能給出最具泛化性的表征。在所有解耦方法中,就整體性能以及除了多示例類之外的所有劃分而言,我們發現實例平衡采樣能給出最佳結果。這一點尤為有趣,因為這意味著在學習高質量表征時,數據不平衡可能并非問題。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/bicheng/85118.shtml
繁體地址,請注明出處:http://hk.pswp.cn/bicheng/85118.shtml
英文地址,請注明出處:http://en.pswp.cn/bicheng/85118.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

如何使用joomla5緩存來加速網頁加載速度

Joomla 有多種緩存“內容”的方式。我們將以兩個角色來介紹和使用緩存,在這篇將以普通管理員的視角來概述——緩存什么、在哪里緩存以及何時緩存。 什么是Joomla 緩存cacha 作為管理員,Joomla 為您提供了緩存網站內容的能力。您可以選擇緩存整個網頁或…

《我們的十年》電影聯合品宣品牌白碧美:自然與科技共融

破界新生,定義東方美膚高度 湖南白碧美生物科技有限公司,扎根中國創新活力之都——星城長沙,是以“科技賦能美膚”為核心的高端輕奢護膚品牌。秉承“自然與科技共融”的品牌哲學,白碧美將千年東方草本植萃智慧與現代尖端生物科技…

B樹與B+樹:數據庫索引背后的秘密

B-tree(B樹)和Btree(B樹)是兩種高效的多叉樹數據結構,專為磁盤存儲系統優化設計,廣泛應用于數據庫和文件系統的索引。以下是兩者的核心特點及區別: ?? 一、B-tree(B樹)…

歐洲宇航局如何為航天員提供虛擬現實訓練內容

通過身臨其境的模擬,宇航員可以完善他們在太空行走中執行的每一個動作,以確保更好地準備前往國際空間站、月球和其他地方執行任務。 VR/XR技術在宇航員訓練中的優勢: 提高安全性:復雜或危險程序的無風險實踐 成本和資源節約:減少對實體模型、…

打卡Day53

知識點: 1.對抗生成網絡的思想:關注損失從何而來 2.生成器、判別器 3.nn.sequential容器:適合于按順序運算的情況,簡化前向傳播寫法 4.leakyReLU介紹:避免relu的神經元失活現象 ps:如果你學有余力&#xf…

【Three.js】機器人管線包模擬

機器人管線包模擬 背景技術選型效果視頻效果截圖 最近在工業數字化項目中嘗試用Three.js實現了一個機器人管線包的3D可視化模擬系統,記錄一下開發過程和技術要點,希望能給同樣在探索Web3D技術的同學一些靈感。 背景 管線包(Dress Pack&…

微軟將開始使用 Copilot Vision 監控 Windows 10 和 11 用戶的螢幕

這對於提供幫助是必要的,美國用戶已經可以欣賞這項創新。 微軟為其AI助理Copilot添加了新的Vision功能,使其能夠即時分析用戶螢幕上發生的事情並幫助解決當前的問題。 根據該公司介紹,Copilot Vision 能夠捕捉使用者所見內容,並可…

多模態大語言模型arxiv論文略讀(123)

Enhancing Advanced Visual Reasoning Ability of Large Language Models ?? 論文標題:Enhancing Advanced Visual Reasoning Ability of Large Language Models ?? 論文作者:Zhiyuan Li, Dongnan Liu, Chaoyi Zhang, Heng Wang, Tengfei Xue, Weid…

【linux】Linux vs Android

文章目錄 1、聯系2、區別3、核心差異4、應用場景對比5、未來發展趨勢6、參考附錄——GNU 都說Android就是個裝了UI的Linux,可到底和Linux有什么關系呢? 1、聯系 內核基礎 共享Linux內核:安卓基于Linux內核構建,繼承了Linux的進程…

臺積電(TSMC)工藝庫命名規則

以標準單元庫tcb_n12ffcll_bwp_6t_20_p96_cpd_lvt_tt0p8v25c_hm_lvf_p_ccs舉例說明臺積電工藝庫命名規則。 文件名分段解析 字段含義補充說明tcbTSMC標準單元庫(TCBN = TSMC Cell Library, Base Node)通常用于標識基礎標準單元庫,區別于IO庫(tciobn)或模擬庫(tcap)。n1…

飛算 JavaAI 模塊化生成:重構效率與體驗的雙重升級

在 Java 老項目重構場景中,代碼生成的顆粒度與可控性直接影響開發效率。飛算 JavaAI 創新推出的模塊化智能生成機制,支持按接口、按模塊粒度觸發源碼生成,通過任務拆解與漸進式交付模式,為開發者提供更靈活的重構節奏控制&#xf…

硬件-DAY02(按鍵、中斷、定時器、蜂鳴器)

補充:1.變量前加code,從RAM區變成ROM區 2.三極管的原理就是PN結 3.裸機程序是單線程的,display時不能delay 一、獨立按鍵 1.高電平沒按,低電平按了 按鍵原理:輪詢方式(poll)-->以消耗大量CP…

前端頁面html開發案例入門實踐、超鏈接標簽、圖片標簽、常用站點

前端頁面html開發案例入門實踐 <!DOCTYPE html> <html lang"en"> <head><meta charset"UTF-8"><title>html案例</title> </head> <body><h1>web前端開發</h1><h2>HTML</h2><…

策略模式和模板方法模式的區別【面試題】

策略模式和模板方法模式的區別【面試題】 摘要&#xff1a; 策略模式和模板方法模式均屬于行為設計模式&#xff0c;但核心差異顯著。策略模式通過組合實現&#xff0c;支持運行時動態切換完整算法&#xff08;如支付方式切換&#xff09;&#xff0c;變化維度大&#xff1b;模…

從零打造前沿Web聊天室:消息系統

消息存儲系統 聊天室設計&#xff0c;消息存儲系統非常關鍵&#xff0c;因為一開始設計時使用MongoDB&#xff0c;所以后續使用schemma方式存儲。 后端架構&#xff1a;express MongoDB 消息插入策略 在 MongoDB 中設計聊天消息存儲時&#xff0c;插入策略的選擇會影響性能…

[7-01-03].第03節:環境搭建 - 集群架構

RabbitMQ學習大綱 一、使用集群的原因 1.基于以下原因&#xff0c;需要搭建一個 RabbitMQ 集群來解決實際問題 單機版的&#xff0c;無法滿足目前真實應用的要求。如果 RabbitMQ 服務器遇到內存崩潰、機器掉電或者主板故障等情況&#xff0c;會導致rabbitMQ無法提供服務單臺 R…

【vivado】時序分析之Latch pins with no clock

問題&#xff1a; vivado打開時序報告&#xff0c;如下圖 表示存在鎖存器Latch 解決方法&#xff1a; 查看代碼中是否存在狀態機的狀態沒有寫全&#xff0c;或者default中直接寫了null。

如何將 MX Linux 的垂直任務欄面板移到底部

MX Linux 因其速度和較低的資源消耗&#xff0c;比同類其他 Linux 系統更快地獲得了人氣。它默認帶有 Xfce 桌面環境&#xff0c;但任務欄在左側且是垂直的&#xff0c;這對一部分人來說真的非常不舒服且令人煩惱。如果你也有同感&#xff0c;并且也想將 MX Linux 的任務欄自定…

python debug 監控雙下劃線的變量顯示沒有此變量

名稱改寫&#xff08;Name Mangling&#xff09; 在Python中&#xff0c;如果你在類中定義一個屬性或方法時以雙下劃線開頭&#xff08;例如__attribute&#xff09;&#xff0c;Python會自動對其進行名稱改寫。名稱改寫實際上是在屬性或方法名前加上類名&#xff0c;以避免子…

list使用及模擬

01. list介紹 list是支持常數時間內任意位置插入刪除的序列容器,具備雙向迭代能力。其底層為雙向鏈表結構,各元素存于獨立節點,通過指針指向前后元素。與forward_list的主要區別:后者是單鏈表,僅支持單向迭代,結構更簡單高效。相比array、vector、deque等序列容器,list在…