on_imgs_vae.py

import torch
import numpy as np
import matplotlib.pyplot as plt
from torch.utils.data import DataLoader
import torchvision.transforms as transforms
import torch.optim as optim
from torch.optim import lr_scheduler
from dataloader import ATeX
from models.ae import VAEConv3

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

# mean_std = ([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])
# transforms_list = [transforms.ToTensor(), transforms.Normalize(*mean_std)]
transforms_list = [transforms.ToTensor()]
transforms = transforms.Compose(transforms_list)

dataset = ATeX(split="val", transform=transforms)
atex = DataLoader(dataset, batch_size=256, shuffle=False, drop_last=False)


def final_loss(bce_loss, mu, logvar):
    """
    This function will add the reconstruction loss (BCELoss) and the
    KL-Divergence.
    KL-Divergence = 0.5 * sum(1 + log(sigma^2) - mu^2 - sigma^2)
    :param bce_loss: recontruction loss
    :param mu: the mean from the latent vector
    :param logvar: log variance from the latent vector
    """
    BCE = bce_loss
    KLD = -0.5 * torch.sum(1 + logvar - mu.pow(2) - logvar.exp())
    # KLD = 0.5 * torch.sum(logvar.exp() - logvar - 1 + mu.pow(2))

    return BCE + KLD


def lr_poly(base_lr, iter, max_iter, power):
    return base_lr * ((1 - float(iter) / max_iter) ** (power))


def adjust_learning_rate(optimizer, lr):
    optimizer.param_groups[0]['lr'] = lr
    if len(optimizer.param_groups) > 1:
        optimizer.param_groups[1]['lr'] = lr * 10


base_lr = 1e-3

model = VAEConv3()
criterion = torch.nn.BCELoss(reduction='sum')
optimizer = optim.Adam(model.parameters(), lr=base_lr, weight_decay=1e-5)
model.to(device)


num_epochs = 1000
i_iter = 0
outputs = []
for epoch in range(num_epochs):
    for (img, _, _) in atex:
        i_iter += 256
        img = img.to(device)
        optimizer.zero_grad()
        lr = lr_poly(base_lr, i_iter, num_epochs * len(atex) * 256, 0.9)
        adjust_learning_rate(optimizer, lr)

        # recon = model(img)
        # loss = criterion(recon, img)

        recon, mu, logvar = model(img)
        bce_loss = criterion(recon, img)
        loss = final_loss(bce_loss, mu, logvar)

        loss.backward()
        optimizer.step()

    # scheduler.step()
    print(f"Epoch: {epoch+1:3d}, Loss: {loss.item():.4f}")
    if (epoch % 100) == 0:
        outputs.append((epoch, img, recon))


mean = np.array([0.485, 0.456, 0.406]).reshape(1, 1, 3)
std = np.array([0.229, 0.224, 0.225]).reshape(1, 1, 3)

for k in range(len(outputs)):
    plt.figure()
    imgs = outputs[k][1].detach().cpu().numpy()
    recon = outputs[k][2].detach().cpu().numpy()
    for i, item in enumerate(imgs):
        if i >= 20:
            break
        plt.subplot(2, 20, i + 1)
        item = item.transpose((1, 2, 0))
        # item = std * item + mean
        plt.axis('off')
        plt.imshow(item)
    for i, item in enumerate(recon):
        if i >= 20:
            break
        plt.subplot(2, 20, 20 + i + 1)
        item = item.transpose((1, 2, 0))
        # item = std * item + mean
        plt.axis('off')
        plt.imshow(item)
plt.show()

# num_epochs = 300
# outputs = []
# for epoch in range(num_epochs):
#     for (img, _, _) in atex:

#         img = img.to(device)
#         optimizer.zero_grad()

#         recon, mu, logvar = model(img)
#         bce_loss = criterion(recon, img)
#         loss = final_loss(bce_loss, mu, logvar)

#         loss.backward()
#         optimizer.step()

#     scheduler.step()
#     print(f"Epoch: {epoch+1:3d}, Loss: {loss.item():.4f}")
#     outputs.append((epoch, img, recon))


# for k in range(0, num_epochs, 20):
#     plt.figure()
#     imgs = outputs[k][1].detach().cpu().numpy()
#     recon = outputs[k][2].detach().cpu().numpy()
#     for i, item in enumerate(imgs):
#         if i >= 20:
#             break
#         plt.subplot(2, 20, i + 1)
#         item = item.transpose((1, 2, 0))
#         # item = 0.229 * item + 0.485
#         plt.axis('off')
#         plt.imshow(item)
#     for i, item in enumerate(recon):
#         if i >= 20:
#             break
#         plt.subplot(2, 20, 20 + i + 1)
#         item = item.transpose((1, 2, 0))
#         # item = 0.229 * item + 0.485
#         plt.axis('off')
#         plt.imshow(item)
# plt.show()