train.py

from torch.utils.data import Dataset
import torch
import numpy as np
import torch.nn as nn
from torch import optim
import torch.nn.functional as F
class ChessValueDataset(Dataset):
    def __init__(self):
        data=np.load('./processed/dataset_1M.npz')
        self.X=data['arr_0']
        self.Y=data['arr_1']
        print('loaded data shapes= ',self.X.shape,self.Y.shape)


    def __len__(self):
        return self.X.shape[0]

    def __getitem__(self,idx):
        return (self.X[idx],self.Y[idx])
	

class Net(nn.Module):
	def __init__(self):
		super(Net,self).__init__()
		
		self.a1=nn.Conv2d(5,16,kernel_size=3,padding=1)
		self.a2=nn.Conv2d(16,16,kernel_size=3,padding=1)
		self.a3=nn.Conv2d(16,32,kernel_size=3,stride=2)
	
		
		self.b1=nn.Conv2d(32,32,kernel_size=3,padding=1)
		self.b2=nn.Conv2d(32,32,kernel_size=3,padding=1)
		self.b3=nn.Conv2d(32,64,kernel_size=3,stride=2)
		
		self.c1=nn.Conv2d(64,64,kernel_size=2,padding=1)
		self.c2=nn.Conv2d(64,64,kernel_size=2,padding=1)
		self.c3=nn.Conv2d(64,128,kernel_size=2,stride=2)
		
		self.d1=nn.Conv2d(128,128,kernel_size=1)
		self.d2=nn.Conv2d(128,128,kernel_size=1)
		self.d3=nn.Conv2d(128,128,kernel_size=1)
		
		self.last=nn.Linear(128,1)
	def forward(self,x):
		
		x=F.relu(self.a1(x))
		x=F.relu(self.a2(x))
		x=F.relu(self.a3(x))
		#x=F.max_pool2d(x,2)
		
		#4x4
		x=F.relu(self.b1(x))
		x=F.relu(self.b2(x))
		x=F.relu(self.b3(x))
		#x=F.max_pool2d(x,2)
		
		#2x2
		x=F.relu(self.c1(x))
		x=F.relu(self.c2(x))
		x=F.relu(self.c3(x))
		#x=F.max_pool2d(x,2)
		
		x=F.relu(self.d1(x))
		x=F.relu(self.d2(x))
		x=F.relu(self.d3(x))
		x=x.view(-1,128)
		#print(x.shape)
		x=self.last(x)
		
		#value output
		return F.tanh(x)
if __name__=="__main__":		
	chess_dataset=ChessValueDataset()
	train_loader=torch.utils.data.DataLoader(chess_dataset,batch_size=150,shuffle=True)
	model=Net()
	optimizer=optim.Adam(model.parameters())

	model.train()
	device='cpu'
	floss=nn.MSELoss()
	for epoch in range(20):
		all_loss=0
		num=0
		for batch_idx,(data,target) in enumerate(train_loader):
			target=target.unsqueeze(-1)
			data,target=data.to(device),target.to(device)
			data=data.float()
			target=target.float()
			optimizer.zero_grad()
			output=model(data)
			
			loss=floss(output,target)
			loss.backward()
			optimizer.step()
			all_loss+=loss.item()
			num+=1
			if batch_idx%50==0:
				print('batch= ',batch_idx,' loss= ',loss.item())
		print('--------------------------------------')
		print('EPOCH= ',epoch,' loss= ',all_loss/num)
		torch.save(model.state_dict(),'nets/value_1M.pth')