【知識蒸餾】deeplabv3 logit-based 知識蒸餾實戰，對剪枝的模型進行蒸餾訓練

本文將對【模型剪枝】基于DepGraph(依賴圖)完成復雜模型的一鍵剪枝文章中剪枝的模型進行蒸餾訓練

一、邏輯蒸餾步驟

加載教師模型
定義蒸餾loss
計算蒸餾loss
正常訓練

二、代碼

1、加載教師模型

教師模型使用未進行剪枝，并且已經訓練好的原始模型。

teacher_model = torch.load('./logs/before_prune.pth', map_location=device)

2、定義蒸餾loss

分割和分類的loss，都是用的softmax。

import torch.nn.functional as F
import torch.nn as nn
# 蒸餾溫度
Tempature = 2
def KD_loss(teacher_pred, student_pred):t_p = F.softmax(teacher_pred / Tempature, dim=1)s_p = F.log_softmax(student_pred / Tempature, dim=1)return nn.KLDivLoss(reduction='mean')(s_p, t_p) * (Tempature ** 2)

3、計算蒸餾loss

teacher_outputs = t_model(imgs)
# 蒸餾loss
soft_loss = KD_loss(teacher_outputs, outputs)
# 總loss = 蒸餾loss*alpha + 原學生模型loss*(1-alpha)
alpha = 0.9
all_loss = loss * (1 - alpha) + soft_loss * alpha

4、正常訓練

all_loss.backward()

用剪枝前訓練好的模型對剪枝后模型進行蒸餾訓練，訓練后測試效果如下：
在這里插入圖片描述

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/14680.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/14680.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/14680.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！