I2CKD : INTRA- AND INTER-CLASS KNOWLEDGE DISTILLATION FOR SEMANTIC SEGMENTATION

摘要

本文提出了一種新的針對圖像語義分割的知識蒸餾方法,稱為類內和類間知識蒸餾(I2CKD)。該方法的重點是在教師(繁瑣模型)和學生(緊湊模型)的中間層之間捕獲和傳遞知識。對于知識提取,我們利用從特征圖派生的類原型。為了促進知識轉移,我們**采用了三重損失來最小化類內的差異,最大化教師和學生原型之間的類間差異。**因此,I2CKD使學生能夠更好地模仿每個類的教師的特征表示,從而提高緊湊網絡的分割性能。

介紹

一般來說,教師和學生之間的知識質量是使用均方誤差(MSE)等幾個指標以密集的兩兩方式計算的,而不考慮類內和類間的特征關系。

在本文中,我們提出了一種針對語義分割的新型知識蒸餾方法,稱為類內和類間知識蒸餾(I2CKD)。首先,我們使用特征映射和ground truth(mask)計算每個類的教師原型(質心)。我們工作背后的假設是,教師的良好表現得益于他們合適的制作原型。因此,我們建議將這些知識傳授給學生。為此,正如方法的名稱所暗示的那樣,我們通過最小化/最大化他們之間的類內和類間距離來強迫每個類的學生原型模仿老師原型(見圖1)。作為這種約束的一種復雜損失,我們利用了三重損失

image-20240513143413598

相關工作

面向語義分割的知識蒸餾

[9]中,提取率0階和1階兩類知識。0階計算像素類概率之間的差。1階考慮中心像素與其8個領域之間的差異。[12]專注于匹配教師和學生的特征圖大小,并提出應用自編碼器。然后,計算兩兩關聯圖來量化教師和學生知識之間的關系。[10]提出了一個結構化蒸餾(SKD)方案,該方案考慮了使用圖的特征圖之間的中間蒸餾。分數圖之間的像素蒸餾以及通過對抗學習的整體蒸餾。Wang等開發了一種名為Intra-class Feature Variation Distillation(IFVD)的新方法,學習學生模仿教師的Intra-class關系。為了傳遞IFV知識,使用了余弦距離。Shu等人開發了一種稱為通道知識蒸餾(CWD)的方法,該方法的通道維度計算教師和學生激活通道映射的softmax之間的KLD。在我們之前的工作中,我們利用教師特征圖之間的相互依賴性作為知識蒸餾。這些知識使用自注意機制捕獲,并使用MSE轉移。

在獲得滿意的性能的同時,這些方法忽略了特征圖(原型)中每個類的有意義的知識。這些知識可以有效地用于測量教師和學生網絡之間的類內和類間相似性。這就是我們方法I2CKD的目的

方法

總體

如圖2所示,我們的方法I2CKD將知識從訓練有素的教師網絡中提煉出來,傳遞給學生。對于學生網絡的每個訓練階段。我們都凍結了教師網絡。學生網絡通過三個損失來更新其權重,分別捕獲得分圖和特征圖級別的學生/ground truth差異和教師/學生差異。貢獻的核心在于特征映射級別,我們建議利用教師和學生之間的類內和類間關系。為此,我們計算了教師和學生類原型之間的三元組損失。

image-20240513145451227

類內和類間的知識蒸餾
類原型計算

對于給定通道的特征映射image-20240513145714338,類c的原型表示為:

image-20240513145720007

其中image-20240513145832008表示ground truth(掩碼)。image-20240513145913222是一個指示函數,如果參數為真,則等于1,否則等于0。對于教師和學生網絡,我們在特征映射上計算所有類的原型得到矩陣大小為image-20240513150014299,其中C和K分別表示類和通道的數量。

三重損失

我們蒸餾方案的最終目標是最小化類內的差異,最大化教師和學生網絡之間的類間差異。具體來說,我們的目標是執行以下約束:

image-20240513150200266

這里d(*)是一個距離函數,m代表一個恒定的邊界。image-20240513150652530是從教師和學生網絡中提取出的類原型。image-20240513150741254表示與C不同的類的原型,m是給定的余量。

這一約束的執行允許將學生和教師類原型之間的損失表述如下:

image-20240513150837994

image-20240513150914993表示函數image-20240513150922579image-20240513150928148image-20240513150933891范數,

學生訓練的總損失

語義切分的總體學生訓練損失如下:

image-20240513151025979

image-20240513151127173是平衡所考慮的損失的超參數。

image-20240513151407377是教師分數圖image-20240513151416774與學生分數圖image-20240513151423458之間的KLD。

image-20240513151429461

image-20240513151448172是softmax函數

image-20240513151453690

image-20240513151543529是ground truth與分割后的圖像之間的損失,在我們的工作中,我們使用交叉熵損失。

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/web/11397.shtml
繁體地址,請注明出處:http://hk.pswp.cn/web/11397.shtml
英文地址,請注明出處:http://en.pswp.cn/web/11397.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

12個乒乓球,有一個次品,不知輕重,用一臺無砝碼天平稱三次,找出次品,告知輕重?

前言 B站上看到個視頻:為什么有人不認可清北的學生大多是智商高的? 然后試了下,發現我真菜 自己的思路(失敗) 三次稱重要獲取到12個乒乓球中那個是次品,我想著將12個小球編號,分為四組,每組…

yo!這里是socket網絡編程相關介紹

目錄 前言 基本概念 源ip&&目的ip 源端口號&&目的端口號 udp&&tcp初識 socket編程 網絡字節序 socket常見接口 socket bind listen accept connect 地址轉換函數 字符串轉in_addr in_addr轉字符串 套接字讀寫函數 recvfrom&&a…

Java入門基礎學習筆記2——JDK的選擇下載安裝

搭建Java的開發環境: Java的產品叫JDK(Java Development Kit: Java開發者工具包),必須安裝JDK才能使用Java。 JDK的發展史: LTS:Long-term Support:長期支持版。指的Java會對這些版…

pycharm報錯Process finished with exit code -1073740791 (0xC0000409)

pycharm報錯Process finished with exit code -1073740791 (0xC0000409) 各種垃圾文章(包括chatgpt產生的垃圾文章),沒有給出具體的解決辦法。 解決辦法就是把具體報錯信息顯示出來,然后再去查。 勾選 然后再運行就能把錯誤顯示…

MetaRTC-play拉流客戶端代碼分析

渲染使用opengl,音頻播放使用alsa。 當點擊播放按鈕后,以此調用的類如下,開始建立rtc連接,AV解碼,音頻渲染,視頻渲染。 如果想去除QT,改為cmake工程管理,去掉渲染部分即可。 下方是…

VUE+PrintJS打印-邊距設置問題(提供解決方案)

VUE打印我們一般用printJS,雖然它也提供了邊距設置,但不管怎么調,感覺都不對,也換其他組件試過,沒啥區別,并不能解決問題。 今天又發來個需求,要求設置打印頁面的上、下、左、右邊距&#xff0…

Linux---vim編輯器(續寫)

5. vim正常模式命令集 插入模式 按「i」切換進入插入模式「insert mode」, 按“i”進入插入模式后是從光標當前位置開始輸入文件; 按「a」進入插入模式后,是從目前光標所在位置的下一個位置開始輸入文字; 按「o」進入插入模式…

從頭開始學Spring—01Spring介紹和IOC容器思想

目錄 1.Spring介紹 1.1Spring概述 1.2特性 1.3五大功能模塊 2.IOC容器 2.1IOC思想 ①獲取資源的傳統方式 ②反轉控制方式獲取資源 ③DI 2.2IOC容器在Spring中的實現 ①BeanFactory ②ApplicationContext ③ApplicationContext的主要實現類 1.Spring介紹 1.1Sprin…

Linux系統一步一腳印式學習

Linux操作系統具有許多特點和優勢。首先,它是開放源代碼的,也就意味著任何人都可以對源代碼進行查看和修改。其次,可以同時支持多個用戶且可以同時執行多個任務,此外,Linux操作系統也非常穩定和安全。相對于其他操作系…

銀川崗位外包有邦芒 讓崗位空缺不再成為難題

銀川邦芒人力崗位外包服務,專為企業量身定制,涵蓋從崗位人員招聘到勞動關系終止的全方位、無風險外包解決方案。借助我們的崗位外包,企業可以在確保用工穩定的同時,將更多資源聚焦于核心業務的發展與創新。 我們提供全面、高效的外…

安全測試|常見SQL注入攻擊方式、影響及預防

SQL注入 什么是SQL注入? SQL注入是比較常見的網絡攻擊方式之一,主要攻擊對象是數據庫,針對程序員編寫時的疏忽,通過SQL語句,實現無賬號登錄,篡改數據庫。 SQL注入簡單來說就是通過在表單中填寫包含SQL關鍵…

SSD-60S施耐德電機保護器EOCR-SSD

EOCR主要產品有電子式電動機保護繼電器,電子式過電流繼電器,電子式欠電流繼電器,電子式欠電壓繼電器,其它保護裝置,電流互感器。EOCR-SSD 10-60A電機保護器 系列型號: EOCRSSD-05SEOCRssD-30s EOCRSSD-60SEOCRSSD-0…

Linux文件管理(超詳細講解)

Linux文件管理 一、管理文件1.目錄和路徑2.目錄操作命令3.文件操作命令4.文件內容操作命令 一、管理文件 1.目錄和路徑 文件與目錄簡介 文件是Linux操作系統用來存儲信息的基本結構,是一組信息的集合。目錄是一種特殊的文件,用來保存文件及其相關信息。…

開源即時通訊IM框架 MobileIMSDK v6.5 發布

一、更新內容簡介 本次更新為次要版本更新,進行了bug修復和優化升級(更新歷史詳見:碼云 Release Notes、Github Release Notes)。 MobileIMSDK 可能是市面上唯一同時支持 UDPTCPWebSocket 三種協議的同類開源IM框架。輕量級、高…

8種常見的CMD命令

1.怎么打開CMD窗口 步驟1:winr 步驟2:在彈出的窗口輸入cmd,然后點擊確認,就會出現一個cmd的窗口 2.CMD的8種常見命令 2.1盤符名稱冒號 說明:切換盤的路徑 打開CMD窗口這里默認的是C盤的Users的27823路徑底下&#xf…

基于微信小程序+JAVA Springboot 實現的【網上商城小程序】app+后臺管理系統 (內附設計LW + PPT+ 源碼+ 演示視頻 下載)

項目名稱 項目名稱: 基于微信小程序的網上商城 項目技術棧 該項目采用了以下核心技術棧: 后端框架/庫: Java, SSM框架數據庫: MySQL前端技術: 微信開發者工具,微信小程序框架 項目展示 5.1 管理員服務…

Mat: Unknown HPROF Version

問題:Mat 加載 android studio 導出的 hprof 文件失敗 原因:android hprof 文件不是標準的 java hprof 文件 解決辦法: 使用 android sdk 自帶的命令將 hprof 轉換成標準的 java hprof

瞬息全宇宙——穿越之旅終極教程,手把手教你做出百萬點贊視頻

最近一種叫“瞬息全宇宙”的視頻火了,抖音一期視頻百萬贊,各個博主視頻都在帶瞬息全宇宙這個標簽,于是就有很多朋友催我出教程了,在琢磨了幾天之后,終于整出來了 教程包含了插件的安裝,界面的講解&#xff…

生產制造行業推拉式生產的復合應用

一、案例分析(汽配行業) 重點: 1. MTO/MTS 與 PUSH/PULL 有關系但是不是充分關系 2. MTO/MTS 是公司經營策略,更多是對市場需求的經營策略,體現在生產時機上的不同,一個是等客戶需求,一個是填…

HTML4(三):表單

文章目錄 表單1. 基本結構2. 常用表單控件2.1 文本輸入框2.2 密碼輸入框2.3 單選框2.4 復選框2.5 隱藏域2.6 提交按鈕2.7 重置按鈕2.8 普通按鈕2.9 文本域2.10 下拉框2.11 示例 3. 禁用表單控件4. lable標簽5. fieldset與legend標簽6. 總結 表單 概念:一種包含交互…