详解利用Pytorch实现ResNet网络_Python

详解利用Pytorch实现ResNet网络

2023-04-20 17:18实力 Python

这篇文章主要为大家介绍了利用Pytorch实现ResNet网络详解，有需要的朋友可以借鉴参考下，希望能够有所帮助，祝大家多多进步，早日升职加薪

正文

每个 batch 前清空梯度，否则会将不同 batch 的梯度累加在一块，导致模型参数错误。

然后我们将输入和目标张量都移动到所需的设备上，并将模型的梯度设置为零。我们调用model(inputs)来计算模型的输出，并使用损失函数（在此处为交叉熵）来计算输出和目标之间的误差。然后我们通过调用loss.backward()来计算梯度，最后调用optimizer.step()来更新模型的参数。

在训练过程中，我们还计算了准确率和平均损失。我们将这些值返回并使用它们来跟踪训练进度。

评估模型

我们还需要一个测试函数，用于评估模型在测试数据集上的性能。

以下是该函数的代码：

				?

									def test(model, criterion, test_loader, device):

									    model.eval()

									    test_loss = 0

									    correct = 0

									    total = 0

									    with torch.no_grad():

									        for batch_idx, (inputs, targets) in enumerate(test_loader):

									            inputs, targets = inputs.to(device), targets.to(device)

									            outputs = model(inputs)

									            loss = criterion(outputs, targets)

									            test_loss += loss.item()

									            _, predicted = outputs.max(1)

									            total += targets.size(0)

									            correct += predicted.eq(targets).sum().item()

									    acc = 100 * correct / total

									    avg_loss = test_loss / len(test_loader)

									    return acc, avg_loss

在测试函数中，我们定义了一个with torch.no_grad()区块。这是因为我们希望在测试集上进行前向传递时不计算梯度，从而加快模型的执行速度并节约内存。

输入和目标也要移动到所需的设备上。我们计算模型的输出，并使用损失函数（在此处为交叉熵）来计算输出和目标之间的误差。我们通过累加损失，然后计算准确率和平均损失来评估模型的性能。

训练 ResNet50 模型

接下来，我们需要训练 ResNet50 模型。将数据加载器传递到训练循环，以及一些其他参数，例如训练周期数和学习率。

以下是完整的训练代码：

				?

									num_epochs = 10

									learning_rate = 0.001

									train_loader = DataLoader(train_set, batch_size=64, shuffle=True, num_workers=2)

									test_loader = DataLoader(test_set, batch_size=64, shuffle=False, num_workers=2)

									device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

									model = ResNet(num_classes=1000).to(device)

									criterion = nn.CrossEntropyLoss()

									optimizer = optim.Adam(model.parameters(), lr=learning_rate)

									for epoch in range(1, num_epochs + 1):

									    train_acc, train_loss = train(model, optimizer, criterion, train_loader, device)

									    test_acc, test_loss = test(model, criterion, test_loader, device)

									    print(f"Epoch {epoch}  Train Accuracy: {train_acc:.2f}%  Train Loss: {train_loss:.5f}  Test Accuracy: {test_acc:.2f}%  Test Loss: {test_loss:.5f}")

									    # 保存模型

									    if epoch == num_epochs or epoch % 5 == 0:

									        torch.save(model.state_dict(), f"resnet-epoch-{epoch}.ckpt")