PyTorch与Weights Biases：使用wandb训练与评估的日志和实操【附代码！】

时间:2025/7/10 9:19:38来源：https://blog.csdn.net/xiaoh_7/article/details/139068306 浏览次数:0次

“PyTorch与Weights & Biases：使用wandb训练与评估的日志和实操”

使用 Weights & Biases (wandb) 来记录 PyTorch 中的损失变化和模型测试指标非常方便。以下是一个简单的示例代码，展示了如何在训练和评估过程中使用 wandb 进行日志记录。

安装 wandb

首先，需要安装 wandb：

pip install wandb

初始化 wandb

在你的脚本或 notebook 中，先导入 wandb 并初始化一个新项目：

import wandb# 初始化 wandb
wandb.init(project="your_project_name", entity="your_wandb_username")

记录训练和验证过程

在训练和验证过程中，可以使用 wandb.log 方法来记录损失和其他指标的变化。以下是一个完整的示例：

import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader, TensorDataset# 示例数据集和模型
x_train = torch.randn(100, 10)
y_train = torch.randn(100, 1)
train_dataset = TensorDataset(x_train, y_train)
train_loader = DataLoader(train_dataset, batch_size=10, shuffle=True)class SimpleModel(nn.Module):def __init__(self):super(SimpleModel, self).__init__()self.fc = nn.Linear(10, 1)def forward(self, x):return self.fc(x)model = SimpleModel()
criterion = nn.MSELoss()
optimizer = optim.Adam(model.parameters(), lr=0.001)# 初始化 wandb
wandb.init(project="your_project_name", entity="your_wandb_username")# 训练和验证循环
for epoch in range(10):  # 假设训练10个epochmodel.train()running_loss = 0.0for i, (inputs, targets) in enumerate(train_loader):optimizer.zero_grad()outputs = model(inputs)loss = criterion(outputs, targets)loss.backward()optimizer.step()running_loss += loss.item()# 平均损失avg_loss = running_loss / len(train_loader)# 记录损失wandb.log({"Train Loss": avg_loss, "Epoch": epoch})# 验证模型（这里使用训练数据作为示例）model.eval()with torch.no_grad():val_outputs = model(x_train)val_loss = criterion(val_outputs, y_train)# 记录验证损失wandb.log({"Validation Loss": val_loss.item(), "Epoch": epoch})print(f"Epoch [{epoch+1}/10], Train Loss: {avg_loss:.4f}, Validation Loss: {val_loss.item():.4f}")# 保存模型
torch.save(model.state_dict(), "model.pth")
wandb.save("model.pth")

记录其他指标

除了损失，还可以记录其他指标，例如精度、召回率等。代码中实现了一个计算准确率的函数，那么接下来就可以在验证步骤中记录准确率：

def calculate_accuracy(outputs, targets):# 假设是二分类任务preds = torch.round(torch.sigmoid(outputs))correct = (preds == targets).sum().float()accuracy = correct / targets.numel()return accuracy# 在验证步骤中
with torch.no_grad():val_outputs = model(x_train)val_loss = criterion(val_outputs, y_train)val_accuracy = calculate_accuracy(val_outputs, y_train)# 记录验证损失和准确率
wandb.log({"Validation Loss": val_loss.item(), "Validation Accuracy": val_accuracy.item(), "Epoch": epoch})

在这里插入图片描述

完整示例

以上代码展示了如何在 PyTorch 训练循环中集成 wandb 以记录训练和验证损失，以及其他可能的评估指标。你可以根据自己的需要进行调整和扩展，例如增加更多的指标或记录更多的信息（如模型超参数、训练时间等）。然后登陆自己的账号就可以在线看到训练过程，值得注意的是，如果报错，有可能是梯子的原因，导致同步出现问题。

关键字：PyTorch与Weights Biases：使用wandb训练与评估的日志和实操【附代码！】

本网仅为发布的内容提供存储空间，不对发表、转载的内容提供任何形式的保证。凡本网注明“来源：XXX网络”的作品，均转载自其它媒体，著作权归作者所有，商业转载请联系作者获得授权，非商业转载请注明出处。

我们尊重并感谢每一位作者，均已注明文章来源和作者。如因作品内容、版权或其它问题，请及时与我们联系，联系邮箱：809451989@qq.com，投稿邮箱：809451989@qq.com

责任编辑：