Day49 Python打卡訓練營

知識點回顧:
1.通道注意力模塊復習
2.空間注意力模塊
3.CBAM的定義

cbam模塊介紹

cbam注意力

之前我們介紹了se通道注意力,我們說所有的模塊本質上只是對特征進一步提取,今天進一步介紹cbam注意力

CBAM 是一種能夠集成到任何卷積神經網絡架構中的注意力模塊。它的核心目標是通過學習的方式,自動獲取特征圖在通道和空間維度上的重要性,進而對特征圖進行自適應調整,增強重要特征,抑制不重要特征,提升模型的特征表達能力和性能。簡單來說,它就像是給模型裝上了 “智能眼鏡”,讓模型能夠更精準地看到圖像中關鍵的部分

CBAM 由兩個主要部分組成:通道注意力模塊(Channel Attention Module)和空間注意力模塊(Spatial Attention Module)。這兩個模塊順序連接,共同作用于輸入的特征圖。

SE 通道注意力的局限:僅關注 “哪些通道重要”,未考慮 “重要信息在空間中的位置”。 CBAM 的突破: 通道注意力(Channel Attention):分析 “哪些通道的特征更關鍵”(如圖像中的顏色、紋理通道)。 空間注意力(Spatial Attention):定位 “關鍵特征在圖像中的具體位置”(如物體所在區域)。 二者結合:讓模型同時學會 “關注什么” 和 “關注哪里”,提升特征表達能力。

輸入特征圖 → 通道注意力模塊 → 空間注意力模塊 → 輸出增強后的特征圖

輕量級設計:僅增加少量計算量(全局池化 + 簡單卷積),適合嵌入各種 CNN 架構(如 ResNet、YOLO)。 即插即用:無需修改原有模型主體結構,直接作為模塊插入卷積層之間。 雙重優化:同時提升通道和空間維度的特征質量,尤其適合復雜場景(如小目標檢測、語義分割)。

這些模塊相較于cnn都屬于即插即用

import torch
import torch.nn as nn# 定義通道注意力
class ChannelAttention(nn.Module):def __init__(self, in_channels, ratio=16):"""通道注意力機制初始化參數:in_channels: 輸入特征圖的通道數ratio: 降維比例,用于減少參數量,默認為16"""super().__init__()# 全局平均池化,將每個通道的特征圖壓縮為1x1,保留通道間的平均值信息self.avg_pool = nn.AdaptiveAvgPool2d(1)# 全局最大池化,將每個通道的特征圖壓縮為1x1,保留通道間的最顯著特征self.max_pool = nn.AdaptiveMaxPool2d(1)# 共享全連接層,用于學習通道間的關系# 先降維(除以ratio),再通過ReLU激活,最后升維回原始通道數self.fc = nn.Sequential(nn.Linear(in_channels, in_channels // ratio, bias=False),  # 降維層nn.ReLU(),  # 非線性激活函數nn.Linear(in_channels // ratio, in_channels, bias=False)   # 升維層)# Sigmoid函數將輸出映射到0-1之間,作為各通道的權重self.sigmoid = nn.Sigmoid()def forward(self, x):"""前向傳播函數參數:x: 輸入特征圖,形狀為 [batch_size, channels, height, width]返回:調整后的特征圖,通道權重已應用"""# 獲取輸入特征圖的維度信息,這是一種元組的解包寫法b, c, h, w = x.shape# 對平均池化結果進行處理:展平后通過全連接網絡avg_out = self.fc(self.avg_pool(x).view(b, c))# 對最大池化結果進行處理:展平后通過全連接網絡max_out = self.fc(self.max_pool(x).view(b, c))# 將平均池化和最大池化的結果相加并通過sigmoid函數得到通道權重attention = self.sigmoid(avg_out + max_out).view(b, c, 1, 1)# 將注意力權重與原始特征相乘,增強重要通道,抑制不重要通道return x * attention #這個運算是pytorch的廣播機制
## 空間注意力模塊
class SpatialAttention(nn.Module):def __init__(self, kernel_size=7):super().__init__()self.conv = nn.Conv2d(2, 1, kernel_size, padding=kernel_size//2, bias=False)self.sigmoid = nn.Sigmoid()def forward(self, x):# 通道維度池化avg_out = torch.mean(x, dim=1, keepdim=True)  # 平均池化:(B,1,H,W)max_out, _ = torch.max(x, dim=1, keepdim=True)  # 最大池化:(B,1,H,W)pool_out = torch.cat([avg_out, max_out], dim=1)  # 拼接:(B,2,H,W)attention = self.conv(pool_out)  # 卷積提取空間特征return x * self.sigmoid(attention)  # 特征與空間權重相乘
## CBAM模塊
class CBAM(nn.Module):def __init__(self, in_channels, ratio=16, kernel_size=7):super().__init__()self.channel_attn = ChannelAttention(in_channels, ratio)self.spatial_attn = SpatialAttention(kernel_size)def forward(self, x):x = self.channel_attn(x)x = self.spatial_attn(x)return x
# 測試下通過CBAM模塊的維度變化
# 輸入卷積的尺寸為
# 假設輸入特征圖:batch=2,通道=512,尺寸=26x26
x = torch.randn(2, 512, 26, 26) 
cbam = CBAM(in_channels=512)
output = cbam(x)  # 輸出形狀不變:(2, 512, 26, 26)
print(f"Output shape: {output.shape}")  # 驗證輸出維度
Output shape: torch.Size([2, 512, 26, 26])

cnn+cbam訓練

import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import datasets, transforms
from torch.utils.data import DataLoader
import matplotlib.pyplot as plt
import numpy as np# 設置中文字體支持
plt.rcParams["font.family"] = ["SimHei"]
plt.rcParams['axes.unicode_minus'] = False  # 解決負號顯示問題# 檢查GPU是否可用
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print(f"使用設備: {device}")# 數據預處理(與原代碼一致)
train_transform = transforms.Compose([transforms.RandomCrop(32, padding=4),transforms.RandomHorizontalFlip(),transforms.ColorJitter(brightness=0.2, contrast=0.2, saturation=0.2, hue=0.1),transforms.RandomRotation(15),transforms.ToTensor(),transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010))
])test_transform = transforms.Compose([transforms.ToTensor(),transforms.Normalize((0.4914, 0.4822, 0.4465), (0.2023, 0.1994, 0.2010))
])# 加載數據集(與原代碼一致)
train_dataset = datasets.CIFAR10(root='./data', train=True, download=True, transform=train_transform)
test_dataset = datasets.CIFAR10(root='./data', train=False, transform=test_transform)
train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True)
test_loader = DataLoader(test_dataset, batch_size=64, shuffle=False)

使用設備: cuda

Files already downloaded and verified

# 定義帶有CBAM的CNN模型
class CBAM_CNN(nn.Module):def __init__(self):super(CBAM_CNN, self).__init__()# ---------------------- 第一個卷積塊(帶CBAM) ----------------------self.conv1 = nn.Conv2d(3, 32, kernel_size=3, padding=1)self.bn1 = nn.BatchNorm2d(32) # 批歸一化self.relu1 = nn.ReLU()self.pool1 = nn.MaxPool2d(kernel_size=2)self.cbam1 = CBAM(in_channels=32)  # 在第一個卷積塊后添加CBAM# ---------------------- 第二個卷積塊(帶CBAM) ----------------------self.conv2 = nn.Conv2d(32, 64, kernel_size=3, padding=1)self.bn2 = nn.BatchNorm2d(64)self.relu2 = nn.ReLU()self.pool2 = nn.MaxPool2d(kernel_size=2)self.cbam2 = CBAM(in_channels=64)  # 在第二個卷積塊后添加CBAM# ---------------------- 第三個卷積塊(帶CBAM) ----------------------self.conv3 = nn.Conv2d(64, 128, kernel_size=3, padding=1)self.bn3 = nn.BatchNorm2d(128)self.relu3 = nn.ReLU()self.pool3 = nn.MaxPool2d(kernel_size=2)self.cbam3 = CBAM(in_channels=128)  # 在第三個卷積塊后添加CBAM# ---------------------- 全連接層 ----------------------self.fc1 = nn.Linear(128 * 4 * 4, 512)self.dropout = nn.Dropout(p=0.5)self.fc2 = nn.Linear(512, 10)def forward(self, x):# 第一個卷積塊x = self.conv1(x)x = self.bn1(x)x = self.relu1(x)x = self.pool1(x)x = self.cbam1(x)  # 應用CBAM# 第二個卷積塊x = self.conv2(x)x = self.bn2(x)x = self.relu2(x)x = self.pool2(x)x = self.cbam2(x)  # 應用CBAM# 第三個卷積塊x = self.conv3(x)x = self.bn3(x)x = self.relu3(x)x = self.pool3(x)x = self.cbam3(x)  # 應用CBAM# 全連接層x = x.view(-1, 128 * 4 * 4)x = self.fc1(x)x = self.relu3(x)x = self.dropout(x)x = self.fc2(x)return x# 初始化模型并移至設備
model = CBAM_CNN().to(device)
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)
scheduler = optim.lr_scheduler.ReduceLROnPlateau(optimizer, mode='min', patience=3, factor=0.5)
# 訓練函數
def train(model, train_loader, test_loader, criterion, optimizer, scheduler, device, epochs):model.train()all_iter_losses = []iter_indices = []train_acc_history = []test_acc_history = []train_loss_history = []test_loss_history = []for epoch in range(epochs):running_loss = 0.0correct = 0total = 0for batch_idx, (data, target) in enumerate(train_loader):data, target = data.to(device), target.to(device)optimizer.zero_grad()output = model(data)loss = criterion(output, target)loss.backward()optimizer.step()iter_loss = loss.item()all_iter_losses.append(iter_loss)iter_indices.append(epoch * len(train_loader) + batch_idx + 1)running_loss += iter_loss_, predicted = output.max(1)total += target.size(0)correct += predicted.eq(target).sum().item()if (batch_idx + 1) % 100 == 0:print(f'Epoch: {epoch+1}/{epochs} | Batch: {batch_idx+1}/{len(train_loader)} 'f'| 單Batch損失: {iter_loss:.4f} | 累計平均損失: {running_loss/(batch_idx+1):.4f}')epoch_train_loss = running_loss / len(train_loader)epoch_train_acc = 100. * correct / totaltrain_acc_history.append(epoch_train_acc)train_loss_history.append(epoch_train_loss)# 測試階段model.eval()test_loss = 0correct_test = 0total_test = 0with torch.no_grad():for data, target in test_loader:data, target = data.to(device), target.to(device)output = model(data)test_loss += criterion(output, target).item()_, predicted = output.max(1)total_test += target.size(0)correct_test += predicted.eq(target).sum().item()epoch_test_loss = test_loss / len(test_loader)epoch_test_acc = 100. * correct_test / total_testtest_acc_history.append(epoch_test_acc)test_loss_history.append(epoch_test_loss)scheduler.step(epoch_test_loss)print(f'Epoch {epoch+1}/{epochs} 完成 | 訓練準確率: {epoch_train_acc:.2f}% | 測試準確率: {epoch_test_acc:.2f}%')plot_iter_losses(all_iter_losses, iter_indices)plot_epoch_metrics(train_acc_history, test_acc_history, train_loss_history, test_loss_history)return epoch_test_acc# 繪圖函數
def plot_iter_losses(losses, indices):plt.figure(figsize=(10, 4))plt.plot(indices, losses, 'b-', alpha=0.7, label='Iteration Loss')plt.xlabel('Iteration(Batch序號)')plt.ylabel('損失值')plt.title('每個 Iteration 的訓練損失')plt.legend()plt.grid(True)plt.tight_layout()plt.show()def plot_epoch_metrics(train_acc, test_acc, train_loss, test_loss):epochs = range(1, len(train_acc) + 1)plt.figure(figsize=(12, 4))plt.subplot(1, 2, 1)plt.plot(epochs, train_acc, 'b-', label='訓練準確率')plt.plot(epochs, test_acc, 'r-', label='測試準確率')plt.xlabel('Epoch')plt.ylabel('準確率 (%)')plt.title('訓練和測試準確率')plt.legend()plt.grid(True)plt.subplot(1, 2, 2)plt.plot(epochs, train_loss, 'b-', label='訓練損失')plt.plot(epochs, test_loss, 'r-', label='測試損失')plt.xlabel('Epoch')plt.ylabel('損失值')plt.title('訓練和測試損失')plt.legend()plt.grid(True)plt.tight_layout()plt.show()# 執行訓練
epochs = 50
print("開始使用帶CBAM的CNN訓練模型...")
final_accuracy = train(model, train_loader, test_loader, criterion, optimizer, scheduler, device, epochs)
print(f"訓練完成!最終測試準確率: {final_accuracy:.2f}%")# # 保存模型
# torch.save(model.state_dict(), 'cifar10_cbam_cnn_model.pth')
# print("模型已保存為: cifar10_cbam_cnn_model.pth")
開始使用帶CBAM的CNN訓練模型...
Epoch: 1/50 | Batch: 100/782 | 單Batch損失: 1.8068 | 累計平均損失: 1.9504
Epoch: 1/50 | Batch: 200/782 | 單Batch損失: 1.6703 | 累計平均損失: 1.8310
Epoch: 1/50 | Batch: 300/782 | 單Batch損失: 1.7282 | 累計平均損失: 1.7603
Epoch: 1/50 | Batch: 400/782 | 單Batch損失: 1.4028 | 累計平均損失: 1.7050
Epoch: 1/50 | Batch: 500/782 | 單Batch損失: 1.2384 | 累計平均損失: 1.6675
Epoch: 1/50 | Batch: 600/782 | 單Batch損失: 1.3262 | 累計平均損失: 1.6308
Epoch: 1/50 | Batch: 700/782 | 單Batch損失: 1.2315 | 累計平均損失: 1.5930
Epoch 1/50 完成 | 訓練準確率: 42.49% | 測試準確率: 58.60%
Epoch: 2/50 | Batch: 100/782 | 單Batch損失: 1.1333 | 累計平均損失: 1.3602
Epoch: 2/50 | Batch: 200/782 | 單Batch損失: 1.2330 | 累計平均損失: 1.3296
Epoch: 2/50 | Batch: 300/782 | 單Batch損失: 0.9225 | 累計平均損失: 1.2934
Epoch: 2/50 | Batch: 400/782 | 單Batch損失: 0.9983 | 累計平均損失: 1.2701
Epoch: 2/50 | Batch: 500/782 | 單Batch損失: 1.0356 | 累計平均損失: 1.2461
Epoch: 2/50 | Batch: 600/782 | 單Batch損失: 1.0236 | 累計平均損失: 1.2341
Epoch: 2/50 | Batch: 700/782 | 單Batch損失: 1.2743 | 累計平均損失: 1.2210
Epoch 2/50 完成 | 訓練準確率: 56.67% | 測試準確率: 67.22%
Epoch: 3/50 | Batch: 100/782 | 單Batch損失: 1.2205 | 累計平均損失: 1.0597
Epoch: 3/50 | Batch: 200/782 | 單Batch損失: 1.1222 | 累計平均損失: 1.0563
Epoch: 3/50 | Batch: 300/782 | 單Batch損失: 1.0490 | 累計平均損失: 1.0634
Epoch: 3/50 | Batch: 400/782 | 單Batch損失: 0.9543 | 累計平均損失: 1.0599
Epoch: 3/50 | Batch: 500/782 | 單Batch損失: 0.9437 | 累計平均損失: 1.0528
Epoch: 3/50 | Batch: 600/782 | 單Batch損失: 1.2708 | 累計平均損失: 1.0465
Epoch: 3/50 | Batch: 700/782 | 單Batch損失: 0.8789 | 累計平均損失: 1.0448
Epoch 3/50 完成 | 訓練準確率: 62.97% | 測試準確率: 70.30%
Epoch: 4/50 | Batch: 100/782 | 單Batch損失: 0.9047 | 累計平均損失: 0.9669
Epoch: 4/50 | Batch: 200/782 | 單Batch損失: 0.8886 | 累計平均損失: 0.9593
Epoch: 4/50 | Batch: 300/782 | 單Batch損失: 0.8078 | 累計平均損失: 0.9465
Epoch: 4/50 | Batch: 400/782 | 單Batch損失: 0.7879 | 累計平均損失: 0.9358
Epoch: 4/50 | Batch: 500/782 | 單Batch損失: 0.7902 | 累計平均損失: 0.9366
Epoch: 4/50 | Batch: 600/782 | 單Batch損失: 0.8576 | 累計平均損失: 0.9326
Epoch: 4/50 | Batch: 700/782 | 單Batch損失: 1.3249 | 累計平均損失: 0.9338
Epoch 4/50 完成 | 訓練準確率: 66.91% | 測試準確率: 73.43%
Epoch: 5/50 | Batch: 100/782 | 單Batch損失: 0.8714 | 累計平均損失: 0.8887
Epoch: 5/50 | Batch: 200/782 | 單Batch損失: 0.8037 | 累計平均損失: 0.8927
Epoch: 5/50 | Batch: 300/782 | 單Batch損失: 0.7800 | 累計平均損失: 0.8819
Epoch: 5/50 | Batch: 400/782 | 單Batch損失: 1.1443 | 累計平均損失: 0.8738
Epoch: 5/50 | Batch: 500/782 | 單Batch損失: 0.8283 | 累計平均損失: 0.8736
Epoch: 5/50 | Batch: 600/782 | 單Batch損失: 0.8296 | 累計平均損失: 0.8714
Epoch: 5/50 | Batch: 700/782 | 單Batch損失: 0.7007 | 累計平均損失: 0.8718
Epoch 5/50 完成 | 訓練準確率: 69.43% | 測試準確率: 74.02%
Epoch: 6/50 | Batch: 100/782 | 單Batch損失: 0.7123 | 累計平均損失: 0.8264
Epoch: 6/50 | Batch: 200/782 | 單Batch損失: 0.6168 | 累計平均損失: 0.8334
Epoch: 6/50 | Batch: 300/782 | 單Batch損失: 0.7244 | 累計平均損失: 0.8301
Epoch: 6/50 | Batch: 400/782 | 單Batch損失: 0.8604 | 累計平均損失: 0.8263
Epoch: 6/50 | Batch: 500/782 | 單Batch損失: 1.0281 | 累計平均損失: 0.8277
Epoch: 6/50 | Batch: 600/782 | 單Batch損失: 0.8731 | 累計平均損失: 0.8222
Epoch: 6/50 | Batch: 700/782 | 單Batch損失: 0.7084 | 累計平均損失: 0.8228
Epoch 6/50 完成 | 訓練準確率: 71.06% | 測試準確率: 77.10%
Epoch: 7/50 | Batch: 100/782 | 單Batch損失: 0.9166 | 累計平均損失: 0.7944
Epoch: 7/50 | Batch: 200/782 | 單Batch損失: 0.6985 | 累計平均損失: 0.7973
Epoch: 7/50 | Batch: 300/782 | 單Batch損失: 0.8930 | 累計平均損失: 0.7911
Epoch: 7/50 | Batch: 400/782 | 單Batch損失: 0.7999 | 累計平均損失: 0.7938
Epoch: 7/50 | Batch: 500/782 | 單Batch損失: 0.6559 | 累計平均損失: 0.7925
Epoch: 7/50 | Batch: 600/782 | 單Batch損失: 0.7200 | 累計平均損失: 0.7903
Epoch: 7/50 | Batch: 700/782 | 單Batch損失: 0.8668 | 累計平均損失: 0.7900
Epoch 7/50 完成 | 訓練準確率: 72.44% | 測試準確率: 75.70%
Epoch: 8/50 | Batch: 100/782 | 單Batch損失: 0.7175 | 累計平均損失: 0.7552
Epoch: 8/50 | Batch: 200/782 | 單Batch損失: 0.6332 | 累計平均損失: 0.7645
Epoch: 8/50 | Batch: 300/782 | 單Batch損失: 0.5731 | 累計平均損失: 0.7526
Epoch: 8/50 | Batch: 400/782 | 單Batch損失: 0.7617 | 累計平均損失: 0.7517
Epoch: 8/50 | Batch: 500/782 | 單Batch損失: 0.6892 | 累計平均損失: 0.7515
Epoch: 8/50 | Batch: 600/782 | 單Batch損失: 0.7312 | 累計平均損失: 0.7549
Epoch: 8/50 | Batch: 700/782 | 單Batch損失: 0.8937 | 累計平均損失: 0.7541
Epoch 8/50 完成 | 訓練準確率: 73.56% | 測試準確率: 77.37%
Epoch: 9/50 | Batch: 100/782 | 單Batch損失: 0.8760 | 累計平均損失: 0.7398
Epoch: 9/50 | Batch: 200/782 | 單Batch損失: 0.5123 | 累計平均損失: 0.7349
Epoch: 9/50 | Batch: 300/782 | 單Batch損失: 0.7036 | 累計平均損失: 0.7311
Epoch: 9/50 | Batch: 400/782 | 單Batch損失: 0.6847 | 累計平均損失: 0.7306
Epoch: 9/50 | Batch: 500/782 | 單Batch損失: 0.8799 | 累計平均損失: 0.7301
Epoch: 9/50 | Batch: 600/782 | 單Batch損失: 0.8324 | 累計平均損失: 0.7331
Epoch: 9/50 | Batch: 700/782 | 單Batch損失: 0.7336 | 累計平均損失: 0.7303
Epoch 9/50 完成 | 訓練準確率: 74.65% | 測試準確率: 77.73%
Epoch: 10/50 | Batch: 100/782 | 單Batch損失: 0.7165 | 累計平均損失: 0.6921
Epoch: 10/50 | Batch: 200/782 | 單Batch損失: 0.6091 | 累計平均損失: 0.7094
Epoch: 10/50 | Batch: 300/782 | 單Batch損失: 0.7060 | 累計平均損失: 0.7076
Epoch: 10/50 | Batch: 400/782 | 單Batch損失: 0.5803 | 累計平均損失: 0.7094
Epoch: 10/50 | Batch: 500/782 | 單Batch損失: 0.5968 | 累計平均損失: 0.7075
Epoch: 10/50 | Batch: 600/782 | 單Batch損失: 0.6240 | 累計平均損失: 0.7096
Epoch: 10/50 | Batch: 700/782 | 單Batch損失: 0.8921 | 累計平均損失: 0.7061
Epoch 10/50 完成 | 訓練準確率: 75.23% | 測試準確率: 78.84%
Epoch: 11/50 | Batch: 100/782 | 單Batch損失: 0.8392 | 累計平均損失: 0.6906
Epoch: 11/50 | Batch: 200/782 | 單Batch損失: 0.4255 | 累計平均損失: 0.6749
Epoch: 11/50 | Batch: 300/782 | 單Batch損失: 0.8817 | 累計平均損失: 0.6839
Epoch: 11/50 | Batch: 400/782 | 單Batch損失: 0.9127 | 累計平均損失: 0.6882
Epoch: 11/50 | Batch: 500/782 | 單Batch損失: 0.5295 | 累計平均損失: 0.6912
Epoch: 11/50 | Batch: 600/782 | 單Batch損失: 0.7363 | 累計平均損失: 0.6908
Epoch: 11/50 | Batch: 700/782 | 單Batch損失: 0.5202 | 累計平均損失: 0.6884
Epoch 11/50 完成 | 訓練準確率: 76.27% | 測試準確率: 79.65%
Epoch: 12/50 | Batch: 100/782 | 單Batch損失: 0.5777 | 累計平均損失: 0.6737
Epoch: 12/50 | Batch: 200/782 | 單Batch損失: 0.5878 | 累計平均損失: 0.6811
Epoch: 12/50 | Batch: 300/782 | 單Batch損失: 0.6180 | 累計平均損失: 0.6728
Epoch: 12/50 | Batch: 400/782 | 單Batch損失: 0.7010 | 累計平均損失: 0.6668
Epoch: 12/50 | Batch: 500/782 | 單Batch損失: 0.6033 | 累計平均損失: 0.6715
Epoch: 12/50 | Batch: 600/782 | 單Batch損失: 0.6178 | 累計平均損失: 0.6699
Epoch: 12/50 | Batch: 700/782 | 單Batch損失: 0.8882 | 累計平均損失: 0.6699
Epoch 12/50 完成 | 訓練準確率: 76.49% | 測試準確率: 79.79%
Epoch: 13/50 | Batch: 100/782 | 單Batch損失: 0.4695 | 累計平均損失: 0.6513
Epoch: 13/50 | Batch: 200/782 | 單Batch損失: 0.7189 | 累計平均損失: 0.6444
Epoch: 13/50 | Batch: 300/782 | 單Batch損失: 0.5062 | 累計平均損失: 0.6449
Epoch: 13/50 | Batch: 400/782 | 單Batch損失: 0.5209 | 累計平均損失: 0.6505
Epoch: 13/50 | Batch: 500/782 | 單Batch損失: 0.6702 | 累計平均損失: 0.6469
Epoch: 13/50 | Batch: 600/782 | 單Batch損失: 0.6283 | 累計平均損失: 0.6486
Epoch: 13/50 | Batch: 700/782 | 單Batch損失: 0.7709 | 累計平均損失: 0.6489
Epoch 13/50 完成 | 訓練準確率: 77.41% | 測試準確率: 78.36%
Epoch: 14/50 | Batch: 100/782 | 單Batch損失: 0.5958 | 累計平均損失: 0.6527
Epoch: 14/50 | Batch: 200/782 | 單Batch損失: 0.6085 | 累計平均損失: 0.6396
Epoch: 14/50 | Batch: 300/782 | 單Batch損失: 0.5621 | 累計平均損失: 0.6339
Epoch: 14/50 | Batch: 400/782 | 單Batch損失: 0.3217 | 累計平均損失: 0.6383
Epoch: 14/50 | Batch: 500/782 | 單Batch損失: 0.5894 | 累計平均損失: 0.6377
Epoch: 14/50 | Batch: 600/782 | 單Batch損失: 0.6295 | 累計平均損失: 0.6393
Epoch: 14/50 | Batch: 700/782 | 單Batch損失: 0.5119 | 累計平均損失: 0.6411
Epoch 14/50 完成 | 訓練準確率: 77.57% | 測試準確率: 80.82%
Epoch: 15/50 | Batch: 100/782 | 單Batch損失: 0.7048 | 累計平均損失: 0.6209
Epoch: 15/50 | Batch: 200/782 | 單Batch損失: 0.4222 | 累計平均損失: 0.6307
Epoch: 15/50 | Batch: 300/782 | 單Batch損失: 0.5744 | 累計平均損失: 0.6302
Epoch: 15/50 | Batch: 400/782 | 單Batch損失: 0.5282 | 累計平均損失: 0.6266
Epoch: 15/50 | Batch: 500/782 | 單Batch損失: 0.7231 | 累計平均損失: 0.6227
Epoch: 15/50 | Batch: 600/782 | 單Batch損失: 0.6799 | 累計平均損失: 0.6259
Epoch: 15/50 | Batch: 700/782 | 單Batch損失: 0.6691 | 累計平均損失: 0.6288
Epoch 15/50 完成 | 訓練準確率: 78.14% | 測試準確率: 81.26%
Epoch: 16/50 | Batch: 100/782 | 單Batch損失: 0.5496 | 累計平均損失: 0.6028
Epoch: 16/50 | Batch: 200/782 | 單Batch損失: 0.7343 | 累計平均損失: 0.6084
Epoch: 16/50 | Batch: 300/782 | 單Batch損失: 0.4796 | 累計平均損失: 0.6088
Epoch: 16/50 | Batch: 400/782 | 單Batch損失: 0.6605 | 累計平均損失: 0.6051
Epoch: 16/50 | Batch: 500/782 | 單Batch損失: 0.4469 | 累計平均損失: 0.6081
Epoch: 16/50 | Batch: 600/782 | 單Batch損失: 0.5591 | 累計平均損失: 0.6098
Epoch: 16/50 | Batch: 700/782 | 單Batch損失: 0.4150 | 累計平均損失: 0.6122
Epoch 16/50 完成 | 訓練準確率: 78.38% | 測試準確率: 81.24%
Epoch: 17/50 | Batch: 100/782 | 單Batch損失: 0.7903 | 累計平均損失: 0.6028
Epoch: 17/50 | Batch: 200/782 | 單Batch損失: 0.6390 | 累計平均損失: 0.5975
Epoch: 17/50 | Batch: 300/782 | 單Batch損失: 0.5029 | 累計平均損失: 0.5954
Epoch: 17/50 | Batch: 400/782 | 單Batch損失: 0.6530 | 累計平均損失: 0.5988
Epoch: 17/50 | Batch: 500/782 | 單Batch損失: 0.6598 | 累計平均損失: 0.5976
Epoch: 17/50 | Batch: 600/782 | 單Batch損失: 0.4620 | 累計平均損失: 0.5987
Epoch: 17/50 | Batch: 700/782 | 單Batch損失: 0.4572 | 累計平均損失: 0.5989
Epoch 17/50 完成 | 訓練準確率: 79.11% | 測試準確率: 81.95%
Epoch: 18/50 | Batch: 100/782 | 單Batch損失: 0.8232 | 累計平均損失: 0.5920
Epoch: 18/50 | Batch: 200/782 | 單Batch損失: 0.4122 | 累計平均損失: 0.5796
Epoch: 18/50 | Batch: 300/782 | 單Batch損失: 0.7608 | 累計平均損失: 0.5941
Epoch: 18/50 | Batch: 400/782 | 單Batch損失: 0.4806 | 累計平均損失: 0.5960
Epoch: 18/50 | Batch: 500/782 | 單Batch損失: 0.4139 | 累計平均損失: 0.5960
Epoch: 18/50 | Batch: 600/782 | 單Batch損失: 0.4981 | 累計平均損失: 0.5947
Epoch: 18/50 | Batch: 700/782 | 單Batch損失: 0.5214 | 累計平均損失: 0.5906
Epoch 18/50 完成 | 訓練準確率: 79.40% | 測試準確率: 81.29%
Epoch: 19/50 | Batch: 100/782 | 單Batch損失: 0.5081 | 累計平均損失: 0.5887
Epoch: 19/50 | Batch: 200/782 | 單Batch損失: 0.5368 | 累計平均損失: 0.5874
Epoch: 19/50 | Batch: 300/782 | 單Batch損失: 0.5433 | 累計平均損失: 0.5830
Epoch: 19/50 | Batch: 400/782 | 單Batch損失: 0.5979 | 累計平均損失: 0.5804
Epoch: 19/50 | Batch: 500/782 | 單Batch損失: 0.5381 | 累計平均損失: 0.5762
Epoch: 19/50 | Batch: 600/782 | 單Batch損失: 0.4585 | 累計平均損失: 0.5801
Epoch: 19/50 | Batch: 700/782 | 單Batch損失: 0.6012 | 累計平均損失: 0.5794
Epoch 19/50 完成 | 訓練準確率: 79.64% | 測試準確率: 81.75%
Epoch: 20/50 | Batch: 100/782 | 單Batch損失: 0.5562 | 累計平均損失: 0.5775
Epoch: 20/50 | Batch: 200/782 | 單Batch損失: 0.5135 | 累計平均損失: 0.5794
Epoch: 20/50 | Batch: 300/782 | 單Batch損失: 0.5336 | 累計平均損失: 0.5776
Epoch: 20/50 | Batch: 400/782 | 單Batch損失: 0.5229 | 累計平均損失: 0.5761
Epoch: 20/50 | Batch: 500/782 | 單Batch損失: 0.4623 | 累計平均損失: 0.5713
Epoch: 20/50 | Batch: 600/782 | 單Batch損失: 0.6300 | 累計平均損失: 0.5690
Epoch: 20/50 | Batch: 700/782 | 單Batch損失: 0.6291 | 累計平均損失: 0.5707
Epoch 20/50 完成 | 訓練準確率: 79.99% | 測試準確率: 82.00%
Epoch: 21/50 | Batch: 100/782 | 單Batch損失: 0.4574 | 累計平均損失: 0.5482
Epoch: 21/50 | Batch: 200/782 | 單Batch損失: 0.8479 | 累計平均損失: 0.5593
Epoch: 21/50 | Batch: 300/782 | 單Batch損失: 0.4395 | 累計平均損失: 0.5591
Epoch: 21/50 | Batch: 400/782 | 單Batch損失: 0.5584 | 累計平均損失: 0.5588
Epoch: 21/50 | Batch: 500/782 | 單Batch損失: 0.6799 | 累計平均損失: 0.5591
Epoch: 21/50 | Batch: 600/782 | 單Batch損失: 0.6693 | 累計平均損失: 0.5612
Epoch: 21/50 | Batch: 700/782 | 單Batch損失: 0.6641 | 累計平均損失: 0.5618
Epoch 21/50 完成 | 訓練準確率: 80.17% | 測試準確率: 81.61%
Epoch: 22/50 | Batch: 100/782 | 單Batch損失: 0.5207 | 累計平均損失: 0.5465
Epoch: 22/50 | Batch: 200/782 | 單Batch損失: 0.4003 | 累計平均損失: 0.5554
Epoch: 22/50 | Batch: 300/782 | 單Batch損失: 0.4804 | 累計平均損失: 0.5541
Epoch: 22/50 | Batch: 400/782 | 單Batch損失: 0.6084 | 累計平均損失: 0.5559
Epoch: 22/50 | Batch: 500/782 | 單Batch損失: 0.7097 | 累計平均損失: 0.5515
Epoch: 22/50 | Batch: 600/782 | 單Batch損失: 0.5282 | 累計平均損失: 0.5560
Epoch: 22/50 | Batch: 700/782 | 單Batch損失: 0.5192 | 累計平均損失: 0.5556
Epoch 22/50 完成 | 訓練準確率: 80.47% | 測試準確率: 82.40%
Epoch: 23/50 | Batch: 100/782 | 單Batch損失: 0.4791 | 累計平均損失: 0.5384
Epoch: 23/50 | Batch: 200/782 | 單Batch損失: 0.7563 | 累計平均損失: 0.5305
Epoch: 23/50 | Batch: 300/782 | 單Batch損失: 0.4415 | 累計平均損失: 0.5409
Epoch: 23/50 | Batch: 400/782 | 單Batch損失: 0.4734 | 累計平均損失: 0.5394
Epoch: 23/50 | Batch: 500/782 | 單Batch損失: 0.6719 | 累計平均損失: 0.5417
Epoch: 23/50 | Batch: 600/782 | 單Batch損失: 0.5048 | 累計平均損失: 0.5423
Epoch: 23/50 | Batch: 700/782 | 單Batch損失: 0.4834 | 累計平均損失: 0.5444
Epoch 23/50 完成 | 訓練準確率: 80.91% | 測試準確率: 82.99%
Epoch: 24/50 | Batch: 100/782 | 單Batch損失: 0.7115 | 累計平均損失: 0.5322
Epoch: 24/50 | Batch: 200/782 | 單Batch損失: 0.4290 | 累計平均損失: 0.5369
Epoch: 24/50 | Batch: 300/782 | 單Batch損失: 0.5661 | 累計平均損失: 0.5322
Epoch: 24/50 | Batch: 400/782 | 單Batch損失: 0.4407 | 累計平均損失: 0.5312
Epoch: 24/50 | Batch: 500/782 | 單Batch損失: 0.8303 | 累計平均損失: 0.5351
Epoch: 24/50 | Batch: 600/782 | 單Batch損失: 0.6202 | 累計平均損失: 0.5353
Epoch: 24/50 | Batch: 700/782 | 單Batch損失: 0.5813 | 累計平均損失: 0.5361
Epoch 24/50 完成 | 訓練準確率: 81.04% | 測試準確率: 82.97%
Epoch: 25/50 | Batch: 100/782 | 單Batch損失: 0.5002 | 累計平均損失: 0.5237
Epoch: 25/50 | Batch: 200/782 | 單Batch損失: 0.4924 | 累計平均損失: 0.5197
Epoch: 25/50 | Batch: 300/782 | 單Batch損失: 0.3069 | 累計平均損失: 0.5273
Epoch: 25/50 | Batch: 400/782 | 單Batch損失: 0.3876 | 累計平均損失: 0.5339
Epoch: 25/50 | Batch: 500/782 | 單Batch損失: 0.5452 | 累計平均損失: 0.5333
Epoch: 25/50 | Batch: 600/782 | 單Batch損失: 0.6578 | 累計平均損失: 0.5331
Epoch: 25/50 | Batch: 700/782 | 單Batch損失: 0.3714 | 累計平均損失: 0.5341
Epoch 25/50 完成 | 訓練準確率: 81.28% | 測試準確率: 83.27%
Epoch: 26/50 | Batch: 100/782 | 單Batch損失: 0.5367 | 累計平均損失: 0.5102
Epoch: 26/50 | Batch: 200/782 | 單Batch損失: 0.6369 | 累計平均損失: 0.5312
Epoch: 26/50 | Batch: 300/782 | 單Batch損失: 0.3903 | 累計平均損失: 0.5211
Epoch: 26/50 | Batch: 400/782 | 單Batch損失: 0.4560 | 累計平均損失: 0.5179
Epoch: 26/50 | Batch: 500/782 | 單Batch損失: 0.3716 | 累計平均損失: 0.5237
Epoch: 26/50 | Batch: 600/782 | 單Batch損失: 0.4940 | 累計平均損失: 0.5226
Epoch: 26/50 | Batch: 700/782 | 單Batch損失: 0.5624 | 累計平均損失: 0.5259
Epoch 26/50 完成 | 訓練準確率: 81.70% | 測試準確率: 82.83%
Epoch: 27/50 | Batch: 100/782 | 單Batch損失: 0.5966 | 累計平均損失: 0.5204
Epoch: 27/50 | Batch: 200/782 | 單Batch損失: 0.4850 | 累計平均損失: 0.5068
Epoch: 27/50 | Batch: 300/782 | 單Batch損失: 0.5526 | 累計平均損失: 0.5133
Epoch: 27/50 | Batch: 400/782 | 單Batch損失: 0.4366 | 累計平均損失: 0.5158
Epoch: 27/50 | Batch: 500/782 | 單Batch損失: 0.4077 | 累計平均損失: 0.5175
Epoch: 27/50 | Batch: 600/782 | 單Batch損失: 0.5512 | 累計平均損失: 0.5163
Epoch: 27/50 | Batch: 700/782 | 單Batch損失: 0.4778 | 累計平均損失: 0.5162
Epoch 27/50 完成 | 訓練準確率: 81.96% | 測試準確率: 83.36%
Epoch: 28/50 | Batch: 100/782 | 單Batch損失: 0.4616 | 累計平均損失: 0.5081
Epoch: 28/50 | Batch: 200/782 | 單Batch損失: 0.6436 | 累計平均損失: 0.5113
Epoch: 28/50 | Batch: 300/782 | 單Batch損失: 0.4535 | 累計平均損失: 0.5094
Epoch: 28/50 | Batch: 400/782 | 單Batch損失: 0.6412 | 累計平均損失: 0.5094
Epoch: 28/50 | Batch: 500/782 | 單Batch損失: 0.4172 | 累計平均損失: 0.5070
Epoch: 28/50 | Batch: 600/782 | 單Batch損失: 0.5729 | 累計平均損失: 0.5084
Epoch: 28/50 | Batch: 700/782 | 單Batch損失: 0.7177 | 累計平均損失: 0.5097
Epoch 28/50 完成 | 訓練準確率: 82.04% | 測試準確率: 82.38%
Epoch: 29/50 | Batch: 100/782 | 單Batch損失: 0.3307 | 累計平均損失: 0.4994
Epoch: 29/50 | Batch: 200/782 | 單Batch損失: 0.4438 | 累計平均損失: 0.5039
Epoch: 29/50 | Batch: 300/782 | 單Batch損失: 0.3884 | 累計平均損失: 0.5038
Epoch: 29/50 | Batch: 400/782 | 單Batch損失: 0.5149 | 累計平均損失: 0.5124
Epoch: 29/50 | Batch: 500/782 | 單Batch損失: 0.6244 | 累計平均損失: 0.5074
Epoch: 29/50 | Batch: 600/782 | 單Batch損失: 0.6589 | 累計平均損失: 0.5084
Epoch: 29/50 | Batch: 700/782 | 單Batch損失: 0.4801 | 累計平均損失: 0.5089
Epoch 29/50 完成 | 訓練準確率: 82.02% | 測試準確率: 83.30%
Epoch: 30/50 | Batch: 100/782 | 單Batch損失: 0.3495 | 累計平均損失: 0.4854
Epoch: 30/50 | Batch: 200/782 | 單Batch損失: 0.5006 | 累計平均損失: 0.4877
Epoch: 30/50 | Batch: 300/782 | 單Batch損失: 0.4388 | 累計平均損失: 0.4916
Epoch: 30/50 | Batch: 400/782 | 單Batch損失: 0.5631 | 累計平均損失: 0.4933
Epoch: 30/50 | Batch: 500/782 | 單Batch損失: 0.4836 | 累計平均損失: 0.4984
Epoch: 30/50 | Batch: 600/782 | 單Batch損失: 0.3281 | 累計平均損失: 0.4989
Epoch: 30/50 | Batch: 700/782 | 單Batch損失: 0.5237 | 累計平均損失: 0.5017
Epoch 30/50 完成 | 訓練準確率: 82.37% | 測試準確率: 83.80%
Epoch: 31/50 | Batch: 100/782 | 單Batch損失: 0.5479 | 累計平均損失: 0.4756
Epoch: 31/50 | Batch: 200/782 | 單Batch損失: 0.6272 | 累計平均損失: 0.4960
Epoch: 31/50 | Batch: 300/782 | 單Batch損失: 0.3122 | 累計平均損失: 0.4965
Epoch: 31/50 | Batch: 400/782 | 單Batch損失: 0.6559 | 累計平均損失: 0.4966
Epoch: 31/50 | Batch: 500/782 | 單Batch損失: 0.5954 | 累計平均損失: 0.4929
Epoch: 31/50 | Batch: 600/782 | 單Batch損失: 0.7424 | 累計平均損失: 0.4918
Epoch: 31/50 | Batch: 700/782 | 單Batch損失: 0.5575 | 累計平均損失: 0.4977
Epoch 31/50 完成 | 訓練準確率: 82.32% | 測試準確率: 83.53%
Epoch: 32/50 | Batch: 100/782 | 單Batch損失: 0.4886 | 累計平均損失: 0.4607
Epoch: 32/50 | Batch: 200/782 | 單Batch損失: 0.3784 | 累計平均損失: 0.4728
Epoch: 32/50 | Batch: 300/782 | 單Batch損失: 0.5617 | 累計平均損失: 0.4766
Epoch: 32/50 | Batch: 400/782 | 單Batch損失: 0.3727 | 累計平均損失: 0.4832
Epoch: 32/50 | Batch: 500/782 | 單Batch損失: 0.3744 | 累計平均損失: 0.4829
Epoch: 32/50 | Batch: 600/782 | 單Batch損失: 0.3707 | 累計平均損失: 0.4861
Epoch: 32/50 | Batch: 700/782 | 單Batch損失: 0.3870 | 累計平均損失: 0.4860
Epoch 32/50 完成 | 訓練準確率: 82.74% | 測試準確率: 83.50%
Epoch: 33/50 | Batch: 100/782 | 單Batch損失: 0.2945 | 累計平均損失: 0.4732
Epoch: 33/50 | Batch: 200/782 | 單Batch損失: 0.5217 | 累計平均損失: 0.4844
Epoch: 33/50 | Batch: 300/782 | 單Batch損失: 0.4208 | 累計平均損失: 0.4836
Epoch: 33/50 | Batch: 400/782 | 單Batch損失: 0.3817 | 累計平均損失: 0.4824
Epoch: 33/50 | Batch: 500/782 | 單Batch損失: 0.4112 | 累計平均損失: 0.4792
Epoch: 33/50 | Batch: 600/782 | 單Batch損失: 0.4080 | 累計平均損失: 0.4812
Epoch: 33/50 | Batch: 700/782 | 單Batch損失: 0.4099 | 累計平均損失: 0.4809
Epoch 33/50 完成 | 訓練準確率: 83.18% | 測試準確率: 83.54%
Epoch: 34/50 | Batch: 100/782 | 單Batch損失: 0.4311 | 累計平均損失: 0.4742
Epoch: 34/50 | Batch: 200/782 | 單Batch損失: 0.4110 | 累計平均損失: 0.4714
Epoch: 34/50 | Batch: 300/782 | 單Batch損失: 0.4747 | 累計平均損失: 0.4745
Epoch: 34/50 | Batch: 400/782 | 單Batch損失: 0.4877 | 累計平均損失: 0.4792
Epoch: 34/50 | Batch: 500/782 | 單Batch損失: 0.4097 | 累計平均損失: 0.4755
Epoch: 34/50 | Batch: 600/782 | 單Batch損失: 0.7281 | 累計平均損失: 0.4755
Epoch: 34/50 | Batch: 700/782 | 單Batch損失: 0.4282 | 累計平均損失: 0.4757
Epoch 34/50 完成 | 訓練準確率: 83.21% | 測試準確率: 83.77%
Epoch: 35/50 | Batch: 100/782 | 單Batch損失: 0.3286 | 累計平均損失: 0.4360
Epoch: 35/50 | Batch: 200/782 | 單Batch損失: 0.4929 | 累計平均損失: 0.4323
Epoch: 35/50 | Batch: 300/782 | 單Batch損失: 0.3762 | 累計平均損失: 0.4275
Epoch: 35/50 | Batch: 400/782 | 單Batch損失: 0.3616 | 累計平均損失: 0.4324
Epoch: 35/50 | Batch: 500/782 | 單Batch損失: 0.4876 | 累計平均損失: 0.4344
Epoch: 35/50 | Batch: 600/782 | 單Batch損失: 0.3452 | 累計平均損失: 0.4303
Epoch: 35/50 | Batch: 700/782 | 單Batch損失: 0.2800 | 累計平均損失: 0.4288
Epoch 35/50 完成 | 訓練準確率: 84.92% | 測試準確率: 84.51%
Epoch: 36/50 | Batch: 100/782 | 單Batch損失: 0.4680 | 累計平均損失: 0.4293
Epoch: 36/50 | Batch: 200/782 | 單Batch損失: 0.5700 | 累計平均損失: 0.4212
Epoch: 36/50 | Batch: 300/782 | 單Batch損失: 0.4390 | 累計平均損失: 0.4204
Epoch: 36/50 | Batch: 400/782 | 單Batch損失: 0.5267 | 累計平均損失: 0.4197
Epoch: 36/50 | Batch: 500/782 | 單Batch損失: 0.3959 | 累計平均損失: 0.4207
Epoch: 36/50 | Batch: 600/782 | 單Batch損失: 0.3113 | 累計平均損失: 0.4203
Epoch: 36/50 | Batch: 700/782 | 單Batch損失: 0.3314 | 累計平均損失: 0.4214
Epoch 36/50 完成 | 訓練準確率: 85.32% | 測試準確率: 84.78%
Epoch: 37/50 | Batch: 100/782 | 單Batch損失: 0.4593 | 累計平均損失: 0.4146
Epoch: 37/50 | Batch: 200/782 | 單Batch損失: 0.5526 | 累計平均損失: 0.4161
Epoch: 37/50 | Batch: 300/782 | 單Batch損失: 0.4811 | 累計平均損失: 0.4187
Epoch: 37/50 | Batch: 400/782 | 單Batch損失: 0.3941 | 累計平均損失: 0.4172
Epoch: 37/50 | Batch: 500/782 | 單Batch損失: 0.4344 | 累計平均損失: 0.4152
Epoch: 37/50 | Batch: 600/782 | 單Batch損失: 0.5488 | 累計平均損失: 0.4134
Epoch: 37/50 | Batch: 700/782 | 單Batch損失: 0.3947 | 累計平均損失: 0.4128
Epoch 37/50 完成 | 訓練準確率: 85.47% | 測試準確率: 85.61%
Epoch: 38/50 | Batch: 100/782 | 單Batch損失: 0.2697 | 累計平均損失: 0.3975
Epoch: 38/50 | Batch: 200/782 | 單Batch損失: 0.3262 | 累計平均損失: 0.3966
Epoch: 38/50 | Batch: 300/782 | 單Batch損失: 0.4658 | 累計平均損失: 0.4038
Epoch: 38/50 | Batch: 400/782 | 單Batch損失: 0.5184 | 累計平均損失: 0.4054
Epoch: 38/50 | Batch: 500/782 | 單Batch損失: 0.4482 | 累計平均損失: 0.4047
Epoch: 38/50 | Batch: 600/782 | 單Batch損失: 0.5497 | 累計平均損失: 0.4031
Epoch: 38/50 | Batch: 700/782 | 單Batch損失: 0.4320 | 累計平均損失: 0.4064
Epoch 38/50 完成 | 訓練準確率: 85.69% | 測試準確率: 84.76%
Epoch: 39/50 | Batch: 100/782 | 單Batch損失: 0.4279 | 累計平均損失: 0.4081
Epoch: 39/50 | Batch: 200/782 | 單Batch損失: 0.4513 | 累計平均損失: 0.3995
Epoch: 39/50 | Batch: 300/782 | 單Batch損失: 0.3423 | 累計平均損失: 0.4055
Epoch: 39/50 | Batch: 400/782 | 單Batch損失: 0.4963 | 累計平均損失: 0.4015
Epoch: 39/50 | Batch: 500/782 | 單Batch損失: 0.3098 | 累計平均損失: 0.4034
Epoch: 39/50 | Batch: 600/782 | 單Batch損失: 0.3668 | 累計平均損失: 0.4039
Epoch: 39/50 | Batch: 700/782 | 單Batch損失: 0.4422 | 累計平均損失: 0.4057
Epoch 39/50 完成 | 訓練準確率: 85.60% | 測試準確率: 85.38%
Epoch: 40/50 | Batch: 100/782 | 單Batch損失: 0.3657 | 累計平均損失: 0.3879
Epoch: 40/50 | Batch: 200/782 | 單Batch損失: 0.4267 | 累計平均損失: 0.3892
Epoch: 40/50 | Batch: 300/782 | 單Batch損失: 0.5641 | 累計平均損失: 0.3889
Epoch: 40/50 | Batch: 400/782 | 單Batch損失: 0.2898 | 累計平均損失: 0.3903
Epoch: 40/50 | Batch: 500/782 | 單Batch損失: 0.4153 | 累計平均損失: 0.3906
Epoch: 40/50 | Batch: 600/782 | 單Batch損失: 0.4488 | 累計平均損失: 0.3950
Epoch: 40/50 | Batch: 700/782 | 單Batch損失: 0.3801 | 累計平均損失: 0.3975
Epoch 40/50 完成 | 訓練準確率: 86.04% | 測試準確率: 85.02%
Epoch: 41/50 | Batch: 100/782 | 單Batch損失: 0.3915 | 累計平均損失: 0.4067
Epoch: 41/50 | Batch: 200/782 | 單Batch損失: 0.2563 | 累計平均損失: 0.3886
Epoch: 41/50 | Batch: 300/782 | 單Batch損失: 0.5302 | 累計平均損失: 0.3866
Epoch: 41/50 | Batch: 400/782 | 單Batch損失: 0.4611 | 累計平均損失: 0.3909
Epoch: 41/50 | Batch: 500/782 | 單Batch損失: 0.3508 | 累計平均損失: 0.3875
Epoch: 41/50 | Batch: 600/782 | 單Batch損失: 0.5400 | 累計平均損失: 0.3878
Epoch: 41/50 | Batch: 700/782 | 單Batch損失: 0.5500 | 累計平均損失: 0.3903
Epoch 41/50 完成 | 訓練準確率: 86.14% | 測試準確率: 84.89%
Epoch: 42/50 | Batch: 100/782 | 單Batch損失: 0.4661 | 累計平均損失: 0.3924
Epoch: 42/50 | Batch: 200/782 | 單Batch損失: 0.6080 | 累計平均損失: 0.3919
Epoch: 42/50 | Batch: 300/782 | 單Batch損失: 0.4949 | 累計平均損失: 0.3922
Epoch: 42/50 | Batch: 400/782 | 單Batch損失: 0.2592 | 累計平均損失: 0.3908
Epoch: 42/50 | Batch: 500/782 | 單Batch損失: 0.4580 | 累計平均損失: 0.3893
Epoch: 42/50 | Batch: 600/782 | 單Batch損失: 0.4937 | 累計平均損失: 0.3917
Epoch: 42/50 | Batch: 700/782 | 單Batch損失: 0.3789 | 累計平均損失: 0.3921
Epoch 42/50 完成 | 訓練準確率: 86.00% | 測試準確率: 84.80%
Epoch: 43/50 | Batch: 100/782 | 單Batch損失: 0.5154 | 累計平均損失: 0.3723
Epoch: 43/50 | Batch: 200/782 | 單Batch損失: 0.1457 | 累計平均損失: 0.3755
Epoch: 43/50 | Batch: 300/782 | 單Batch損失: 0.6064 | 累計平均損失: 0.3785
Epoch: 43/50 | Batch: 400/782 | 單Batch損失: 0.3559 | 累計平均損失: 0.3803
Epoch: 43/50 | Batch: 500/782 | 單Batch損失: 0.2650 | 累計平均損失: 0.3808
Epoch: 43/50 | Batch: 600/782 | 單Batch損失: 0.4246 | 累計平均損失: 0.3837
Epoch: 43/50 | Batch: 700/782 | 單Batch損失: 0.6159 | 累計平均損失: 0.3826
Epoch 43/50 完成 | 訓練準確率: 86.57% | 測試準確率: 84.80%
Epoch: 44/50 | Batch: 100/782 | 單Batch損失: 0.3769 | 累計平均損失: 0.3547
Epoch: 44/50 | Batch: 200/782 | 單Batch損失: 0.2535 | 累計平均損失: 0.3590
Epoch: 44/50 | Batch: 300/782 | 單Batch損失: 0.3264 | 累計平均損失: 0.3602
Epoch: 44/50 | Batch: 400/782 | 單Batch損失: 0.4237 | 累計平均損失: 0.3610
Epoch: 44/50 | Batch: 500/782 | 單Batch損失: 0.3469 | 累計平均損失: 0.3632
Epoch: 44/50 | Batch: 600/782 | 單Batch損失: 0.2249 | 累計平均損失: 0.3644
Epoch: 44/50 | Batch: 700/782 | 單Batch損失: 0.2896 | 累計平均損失: 0.3650
Epoch 44/50 完成 | 訓練準確率: 87.16% | 測試準確率: 85.56%
Epoch: 45/50 | Batch: 100/782 | 單Batch損失: 0.4033 | 累計平均損失: 0.3474
Epoch: 45/50 | Batch: 200/782 | 單Batch損失: 0.3802 | 累計平均損失: 0.3482
Epoch: 45/50 | Batch: 300/782 | 單Batch損失: 0.3963 | 累計平均損失: 0.3419
Epoch: 45/50 | Batch: 400/782 | 單Batch損失: 0.4769 | 累計平均損失: 0.3499
Epoch: 45/50 | Batch: 500/782 | 單Batch損失: 0.1733 | 累計平均損失: 0.3510
Epoch: 45/50 | Batch: 600/782 | 單Batch損失: 0.4369 | 累計平均損失: 0.3486
Epoch: 45/50 | Batch: 700/782 | 單Batch損失: 0.3665 | 累計平均損失: 0.3510
Epoch 45/50 完成 | 訓練準確率: 87.50% | 測試準確率: 85.40%
Epoch: 46/50 | Batch: 100/782 | 單Batch損失: 0.2379 | 累計平均損失: 0.3568
Epoch: 46/50 | Batch: 200/782 | 單Batch損失: 0.5482 | 累計平均損失: 0.3484
Epoch: 46/50 | Batch: 300/782 | 單Batch損失: 0.4037 | 累計平均損失: 0.3515
Epoch: 46/50 | Batch: 400/782 | 單Batch損失: 0.4300 | 累計平均損失: 0.3531
Epoch: 46/50 | Batch: 500/782 | 單Batch損失: 0.3944 | 累計平均損失: 0.3531
Epoch: 46/50 | Batch: 600/782 | 單Batch損失: 0.2426 | 累計平均損失: 0.3552
Epoch: 46/50 | Batch: 700/782 | 單Batch損失: 0.2979 | 累計平均損失: 0.3543
Epoch 46/50 完成 | 訓練準確率: 87.45% | 測試準確率: 86.02%
Epoch: 47/50 | Batch: 100/782 | 單Batch損失: 0.3793 | 累計平均損失: 0.3436
Epoch: 47/50 | Batch: 200/782 | 單Batch損失: 0.3787 | 累計平均損失: 0.3530
Epoch: 47/50 | Batch: 300/782 | 單Batch損失: 0.5298 | 累計平均損失: 0.3537
Epoch: 47/50 | Batch: 400/782 | 單Batch損失: 0.4792 | 累計平均損失: 0.3552
Epoch: 47/50 | Batch: 500/782 | 單Batch損失: 0.4041 | 累計平均損失: 0.3572
Epoch: 47/50 | Batch: 600/782 | 單Batch損失: 0.3475 | 累計平均損失: 0.3522
Epoch: 47/50 | Batch: 700/782 | 單Batch損失: 0.4549 | 累計平均損失: 0.3510
Epoch 47/50 完成 | 訓練準確率: 87.54% | 測試準確率: 85.71%
Epoch: 48/50 | Batch: 100/782 | 單Batch損失: 0.4600 | 累計平均損失: 0.3388
Epoch: 48/50 | Batch: 200/782 | 單Batch損失: 0.5518 | 累計平均損失: 0.3452
Epoch: 48/50 | Batch: 300/782 | 單Batch損失: 0.2917 | 累計平均損失: 0.3358
Epoch: 48/50 | Batch: 400/782 | 單Batch損失: 0.3100 | 累計平均損失: 0.3423
Epoch: 48/50 | Batch: 500/782 | 單Batch損失: 0.7021 | 累計平均損失: 0.3475
Epoch: 48/50 | Batch: 600/782 | 單Batch損失: 0.2287 | 累計平均損失: 0.3485
Epoch: 48/50 | Batch: 700/782 | 單Batch損失: 0.5825 | 累計平均損失: 0.3478
Epoch 48/50 完成 | 訓練準確率: 87.67% | 測試準確率: 85.89%
Epoch: 49/50 | Batch: 100/782 | 單Batch損失: 0.3823 | 累計平均損失: 0.3368
Epoch: 49/50 | Batch: 200/782 | 單Batch損失: 0.3382 | 累計平均損失: 0.3429
Epoch: 49/50 | Batch: 300/782 | 單Batch損失: 0.2413 | 累計平均損失: 0.3414
Epoch: 49/50 | Batch: 400/782 | 單Batch損失: 0.5054 | 累計平均損失: 0.3423
Epoch: 49/50 | Batch: 500/782 | 單Batch損失: 0.3529 | 累計平均損失: 0.3427
Epoch: 49/50 | Batch: 600/782 | 單Batch損失: 0.4574 | 累計平均損失: 0.3423
Epoch: 49/50 | Batch: 700/782 | 單Batch損失: 0.4026 | 累計平均損失: 0.3440
Epoch 49/50 完成 | 訓練準確率: 87.70% | 測試準確率: 85.80%
Epoch: 50/50 | Batch: 100/782 | 單Batch損失: 0.3368 | 累計平均損失: 0.3451
Epoch: 50/50 | Batch: 200/782 | 單Batch損失: 0.5310 | 累計平均損失: 0.3492
Epoch: 50/50 | Batch: 300/782 | 單Batch損失: 0.3280 | 累計平均損失: 0.3482
Epoch: 50/50 | Batch: 400/782 | 單Batch損失: 0.3337 | 累計平均損失: 0.3498
Epoch: 50/50 | Batch: 500/782 | 單Batch損失: 0.5709 | 累計平均損失: 0.3485
Epoch: 50/50 | Batch: 600/782 | 單Batch損失: 0.3742 | 累計平均損失: 0.3505
Epoch: 50/50 | Batch: 700/782 | 單Batch損失: 0.3078 | 累計平均損失: 0.3508
Epoch 50/50 完成 | 訓練準確率: 87.68% | 測試準確率: 85.98%

訓練完成!最終測試準確率: 85.98%

@浙大疏錦行

本文來自互聯網用戶投稿,該文觀點僅代表作者本人,不代表本站立場。本站僅提供信息存儲空間服務,不擁有所有權,不承擔相關法律責任。
如若轉載,請注明出處:http://www.pswp.cn/news/908896.shtml
繁體地址,請注明出處:http://hk.pswp.cn/news/908896.shtml
英文地址,請注明出處:http://en.pswp.cn/news/908896.shtml

如若內容造成侵權/違法違規/事實不符,請聯系多彩編程網進行投訴反饋email:809451989@qq.com,一經查實,立即刪除!

相關文章

MySQL:Cannot remove all partitions, use DROP TABLE instead

目錄 一、 出現場景二、問題原因三、 解決方案 一、 出現場景 在MySQL創建分區之后,要刪除所有分區時,最后一個分區刪除不了。 二、問題原因 這是因為 MySQL 不允許通過 ALTER TABLE … DROP PARTITION 刪除所有分區,因為分區是表的核心結…

深度學習水論文:mamba+圖像增強

🧀當前視覺領域對高效長序列建模需求激增,對Mamba圖像增強這方向的研究自然也逐漸火熱。原因在于其高效長程建模,以及動態計算優勢,在圖像質量提升和細節恢復方面有難以替代的作用。 🧀因此短時間內,就有不…

今天對C語言中static和extern關鍵字的作用認識又深刻了

用了這么久的C語言,之前對于static關鍵字的用法總是一知半解,今天終于搞清楚了,寫個文章簡單記錄一下。 用static修飾的變量,不管是全局變量還是局部變量,其存儲位置都是靜態存儲區,全局變量作用域是當前文…

河北對口計算機高考MySQL筆記(完結版)(2026高考)持續更新~~~~

MySQL 基礎概念 數據(Data):文本,數字,圖片,視頻,音頻等多種表現形式,能夠被計算機存儲和處理。 **數據庫(Data Base—簡稱DB):**存儲數據的倉庫…

vmware ubuntu擴展硬盤(可用)

一、 右鍵需要的虛擬機,選擇設置,調整最大內存 二、安裝gparted軟件 sudo apt-get install gparted 三、搜索應用然后打開 四、右鍵/dev/sda3 五、調整大小 六、勾選確定 點綠色勾:

RoBERTa 和 BERT 的簡介與對比

RoBERTa 和 BERT 是什么 一、BERT(Bidirectional Encoder Representations from Transformers) 提出背景:由谷歌于2019年提出,是自然語言處理領域的里程碑模型,基于Transformer編碼器架構,通過預訓練生成雙向語言表示。 核心特點: 雙向預訓練:通過掩碼語言模型(MLM)…

前端繪制道路魚骨圖

項目背景&#xff1a;需要實現道路情況魚骨圖&#xff0c;根據上下行道路分別顯示對應的道路情況和沿路設施狀況&#xff0c;箭頭根據所示方向平滑移動 1.封裝組件&#xff0c;創建FishboneDiagram.vue文件 <template><div class"fishedOneBox flex items-cente…

selinux firewalld

一、selinux 1.說明 SELinux 是 Security-Enhanced Linux 的縮寫,意思是安全強化的 linux; SELinux 主要由美國國家安全局(NSA)開發,當初開發的目的是為了避免資源的誤用 DAC(Discretionary Access Control)自主訪問控制系統MAC(Mandatory Access Control)強制訪問控…

RSS 2025|從說明書學習復雜機器人操作任務:NUS邵林團隊提出全新機器人裝配技能學習框架Manual2Skill

視覺語言模型&#xff08;Vision-Language Models, VLMs&#xff09;&#xff0c;為真實環境中的機器人操作任務提供了極具潛力的解決方案。 盡管 VLMs 取得了顯著進展&#xff0c;機器人仍難以勝任復雜的長時程任務&#xff08;如家具裝配&#xff09;&#xff0c;主要受限于人…

NPOI Excel用OLE對象的形式插入文件附件以及插入圖片

static void Main(string[] args) {XlsWithObjData();Console.WriteLine("輸出完成"); }static void XlsWithObjData() {// 創建工作簿和單元格,只有HSSFWorkbook,XSSFWorkbook不可以HSSFWorkbook workbook new HSSFWorkbook();HSSFSheet sheet (HSSFSheet)workboo…

企業數字化轉型實戰:某行業研究院如何通過SD-WAN技術優化網絡架構?

一、引言 隨著企業數字化轉型的深入推進&#xff0c;傳統網絡架構在靈活性、可靠性和管理效率方面逐漸暴露不足。SD-WAN&#xff08;軟件定義廣域網&#xff09;技術憑借其智能化、自動化和高效的特點&#xff0c;逐漸成為企業網絡架構優化的首選方案。本文以某研究院數字化基…

數字證書_CA_詳解

目錄 一、數字證書簡介 二、 CA&#xff08;證書頒發機構&#xff09; (一) 證書鏈&#xff08;信任鏈&#xff09; 1. 根證書 2. 中間證書 3. 網站證書 (二) 抓包軟件的證書鏈與信任機制 1. 抓包通信流程 2. 證書鏈偽造與信任驗證流程 (三) 關于移動設備的CA 一、數…

Android協程學習

目錄 Android上的Kotlin協程介紹基本概念與簡單使用示例協程的高級用法 結構化并發線程調度器(Dispatchers)自定義調度器并發:同步 vs 異步 異步并發(async 并行執行)同步順序執行協程取消與超時 取消機制超時控制異步數據流 Flow協程間通信 使用 Channel使用 StateFlow /…

統計學(第8版)——假設檢驗學習筆記(考試用)

一、假設檢驗核心框架 &#xff08;一&#xff09;解決的核心問題 判斷樣本與總體 / 樣本與樣本的差異是由抽樣誤差還是本質差異引起 典型場景&#xff1a; 產品合格率是否達標&#xff08;比例檢驗&#xff09;工藝改進后均值是否顯著變化&#xff08;均值檢驗&#xff09…

Java求職者面試:微服務技術與源碼原理深度解析

Java求職者面試&#xff1a;微服務技術與源碼原理深度解析 第一輪&#xff1a;基礎概念問題 1. 請解釋什么是微服務架構&#xff0c;并說明其優勢和挑戰。 微服務架構是一種將單體應用拆分為多個小型、獨立的服務的軟件開發方法。每個服務都運行在自己的進程中&#xff0c;并…

c# 局部函數 定義、功能與示例

C# 局部函數&#xff1a;定義、功能與示例 1. 定義與功能 局部函數&#xff08;Local Function&#xff09;是嵌套在另一個方法內部的私有方法&#xff0c;僅在包含它的方法內可見。 ? 作用&#xff1a;封裝僅用于當前方法的邏輯&#xff0c;避免污染類作用域&#xff0c;提升…

ava多線程實現HTTP斷點續傳:原理、設計與代碼實現

一、引言 在當今互聯網環境下&#xff0c;大文件下載需求日益增長。傳統單線程下載方式效率低下&#xff0c;且一旦下載中斷&#xff0c;需要重新開始。斷點續傳技術通過將文件分塊并利用多線程并行下載&#xff0c;顯著提升了下載效率&#xff0c;同時支持中斷后繼續下載。本…

vla學習 富

# 基于diffusion # π0 ## 架構 其核心思想是在預訓練好的視覺語言模型&#xff08;VLM&#xff09;基礎上添加一個“動作專家”&#xff08;action expert&#xff09;&#xff0c;通過流匹配&#xff08;flow matching&#xff09;的方式生成連續的高頻控制指令。整個架構可以…

降雨預測系統(機器學習)

這是一個基于Python開發的降雨預測系統,使用機器學習算法對指定月份的降雨概率進行預測。該系統提供了友好的圖形用戶界面(GUI),支持數據可視化和交互式操作。 ## 功能特點 - ?? 生成歷史降雨數據(2015-2024年) - ?? 使用邏輯回歸模型進行降雨預測 - ?? 可視化…

邏輯回歸與Softmax

Softmax函數是一種將一個含任意實數的K維向量轉化為另一個K維向量的函數,這個輸出向量的每個元素都在(0, 1)區間內,并且所有元素之和等于1。 因此,它可以被看作是某種概率分布,常用于多分類問題中作為輸出層的激活函數。這里我們以拓展邏輯回歸解決多分類的角度對Softmax函…