ZSKD.py

import os
import tqdm
import numpy as np
import sys

import torch
import torch.nn.functional as F
import torchvision.utils as vutils
from torch.autograd import Variable

from utils import data_info, save_img

class ZSKD():
    def __init__(self, dataset, teacher, num_sample, beta, t, batch_size, lr, iters):
        self.dataset = dataset
        self.cwh, self.num_classes ,self.student = data_info(self.dataset)
        self.teacher = teacher
        self.num_sample = num_sample
        self.beta = beta
        self.t = t
        self.batch_size = batch_size
        self.lr = lr
        self.iters = iters

        self.gen_num=1
    def build(self):

        # lim_0, lim_1 = 2, 2
        file_num=np.zeros((self.num_classes),dtype=int)

        def get_class_similarity():

            # Find last layer
            t_layer = list(self.teacher.children())[-1]
            while 'Sequential' in str(t_layer):
                t_layer = list(t_layer.children())[-1]

            t_weights = list(t_layer.parameters())[0].cuda()  # size(#class number, #weights in final-layer )

            # Compute concentration parameter
            t_weights_norm = F.normalize(t_weights, p=2, dim=1)
            cls_sim = torch.matmul(t_weights_norm, t_weights_norm.T)
            cls_sim_norm = torch.div(cls_sim - torch.min(cls_sim, dim=1).values,
                                     torch.max(cls_sim, dim=1).values - torch.min(cls_sim, dim=1).values)
            return cls_sim_norm

        cls_sim_norm = get_class_similarity()
        
        loss = torch.nn.BCELoss()
        print('\n'+'-'*30+' ZSKD start '+'-'*30)

        # generate synthesized images
        for k in range(self.num_classes):

            for b in self.beta:
                for n in range(self.num_sample // len(self.beta) // self.batch_size // self.num_classes):

                    # sampling target label from Dirichlet distribution
                    dir_dist = torch.distributions.dirichlet.Dirichlet(b * cls_sim_norm[k])
                    y=Variable(dir_dist.rsample((self.batch_size,)),requires_grad=False)

                    # optimization for images
                    inputs = torch.randn((self.batch_size, self.cwh[0], self.cwh[1], self.cwh[2])).cuda()
                    inputs = Variable(inputs ,requires_grad=True)
                    optimizer = torch.optim.Adam([inputs], self.lr)

                    for n_iter in range(self.iters):
                        optimizer.zero_grad()
                        logit = self.teacher(inputs)/20.0
                        output= torch.nn.Softmax(dim=1)(logit)
                        
                        l = loss(output,y.detach())
                        l.backward()
                        optimizer.step()
                        if n_iter % 100 == 0 :
                            print(f'\t[{n_iter}/{self.iters}] Loss: {l} ')
                            
                    # save the synthesized images
                    t_cls = torch.argmax(y, dim=1).detach().cpu().numpy()
                    save_root = './saved_img/'+self.dataset+'/'
                    for m in range(self.batch_size):
                        save_dir = save_root+str(t_cls[m])+'/'
                        if not os.path.exists(save_dir):
                            os.makedirs(save_dir)
                        if self.dataset == 'mnist':
                            vutils.save_image(inputs[m, :, :, :].data.clone(), save_dir + str(file_num[t_cls[m]]) + '.jpg')
                        else:
                            vutils.save_image(inputs[m, :, :, :].data.clone(), save_dir + str(file_num[t_cls[m]]) + '.jpg', normalize=True)

                        file_num[t_cls[m]]+=1
                    print('Generate {} synthesized images [{}/{}]'.format(\
                        self.batch_size,self.batch_size*self.gen_num, self.num_sample ))

                    self.gen_num+=1
        
        print('\n'+'-'*30+' ZSKD end '+'-'*30)

        return self.student, save_root