Pytorch實用教程：多分類任務中使用的交叉熵損失函數nn.CrossEntropyLoss

nn.CrossEntropyLoss 在 PyTorch 中是處理多分類問題的常用損失函數，它是兩個函數 nn.LogSoftmax 和 nn.NLLLoss（Negative Log Likelihood Loss）的組合。使用這個損失函數可以直接從模型得到原始的輸出分數（logits），而不需要單獨對輸出進行 Softmax 處理。下面詳細介紹這個損失函數的關鍵特點、工作原理和使用方式。

工作原理

nn.CrossEntropyLoss 首先對網絡的輸出應用 LogSoftmax。這意味著網絡輸出的 logits（原始預測值）被轉換成概率的對數形式。然后，它使用這些對數概率和真實標簽計算 NLLLoss。

具體來說，公式可以表示為：

[ \text{Loss}(x, \text{class}) = -\log\left(\frac{\exp(x[\text{class}])}{\sum_j \exp(x[j])}\right) ]
[ \text{Loss}(x, \text{class}) = -x[\text{class}] + \log\left(\sum_j \exp(x[j])\right) ]

其中：

( x ) 是模型輸出的 logits。
( \text{class} ) 是真實的類別標簽（非 one-hot 編碼）。

參數詳解

weight (Tensor, optional): 手動指定每個類的權重。如果給定，必須是一個長度為 C 的 Te

本文來自互聯網用戶投稿，該文觀點僅代表作者本人，不代表本站立場。本站僅提供信息存儲空間服務，不擁有所有權，不承擔相關法律責任。
如若轉載，請注明出處：http://www.pswp.cn/bicheng/18399.shtml
繁體地址，請注明出處：http://hk.pswp.cn/bicheng/18399.shtml
英文地址，請注明出處：http://en.pswp.cn/bicheng/18399.shtml

如若內容造成侵權/違法違規/事實不符，請聯系多彩編程網進行投訴反饋email:809451989@qq.com，一經查實，立即刪除！