infer.py

import torch
import os
import numpy as np
import torch.nn as nn
import torchvision.models as models
import torchvision.transforms as transforms
import torch.nn.functional as F
from torch import optim
from torch.utils.data import DataLoader
import model
import cross_att_model
import model_image
from utils import *
import matplotlib.pyplot as plt
import logging
import config
from skimage.transform import resize
from sklearn.preprocessing import MinMaxScaler
from tqdm import tqdm
from datetime import datetime
from sklearn.metrics import mean_absolute_error

device = torch.device(config.DEVICE)


def cal_error_metrics(gt, forecasts):
    # Absolute errors
    mae = mean_absolute_error(gt, forecasts)
    wape = 100 * np.sum(np.sum(np.abs(gt - forecasts), axis=-1)) / np.sum(gt)

    return round(mae, 3), round(wape, 3)
    

def print_error_metrics(y_test, y_hat, rescaled_y_test, rescaled_y_hat):
    mae, wape = cal_error_metrics(y_test, y_hat)
    rescaled_mae, rescaled_wape = cal_error_metrics(rescaled_y_test, rescaled_y_hat)
    print(mae, wape, rescaled_mae, rescaled_wape)

dateTimeObj = datetime.now()
timestamp = dateTimeObj.strftime("%d-%m-%Y-%H-%M")

normalization_values = np.load(config.NORMALIZATION_VALUES_PATH)

model_filename = "{}_lr{}_{}_{}_datas_10ago".format(config.model_types[config.MODEL], config.LEARNING_RATE, "tf_05" if config.USE_TEACHERFORCING else "", "exog" if config.USE_EXOG else "")

train_dir_name = model_filename + "_" + timestamp


attention_dim = config.HIDDEN_SIZE
image_feature_size = config.HIDDEN_SIZE
hidden_size = config.HIDDEN_SIZE * 2
gtrends_len = config.EXOG_LEN* config.EXOG_NUM

#Image or Residual
if config.model_types[config.MODEL] == "image": 
   hidden_size = config.HIDDEN_SIZE
   if config.USE_EXOG:
      input_size = config.HIDDEN_SIZE +gtrends_len
   else:
      input_size = config.HIDDEN_SIZE 

elif config.model_types[config.MODEL] == "residual":
   hidden_size = config.HIDDEN_SIZE * 2
   if config.USE_EXOG:
         input_size = config.HIDDEN_SIZE +gtrends_len
   else:
      input_size = config.HIDDEN_SIZE
#Concat or Cross (cross doesn't use these)
else:
   hidden_size = config.HIDDEN_SIZE*2
   if config.USE_EXOG:
      input_size = config.HIDDEN_SIZE*3 +gtrends_len
   else:
      input_size = config.HIDDEN_SIZE*3


# Logger
logging.basicConfig(
   level=logging.INFO,
   format='%(asctime)s - %(levelname)s - %(message)s',
   handlers=[
      logging.FileHandler(model_filename[:-4]+'.log'),
      logging.StreamHandler()
    ])


dataset_path = config.DATASET_PATH


normalize = transforms.Normalize(
mean=[0.485, 0.456, 0.406],
std=[0.229, 0.224, 0.225]
)

ds_trans = transforms.Compose([
                        transforms.ToTensor(),
                        normalize])

train_dataset = CustomImageDataset(config.TRAIN_DATASET, dataset_path, transform=ds_trans)
test_dataset = CustomImageDataset(config.TEST_DATASET, dataset_path, transform=ds_trans)


train_dataloader = DataLoader(train_dataset, batch_size=config.BATCH_SIZE, shuffle=True, num_workers=config.NUM_WORKERS)
test_dataloader = DataLoader(test_dataset, batch_size=config.BATCH_SIZE, shuffle=False, num_workers=config.NUM_WORKERS)

encoder = model.Encoder()

#Image
if config.model_types[config.MODEL] == "image":
   decoder = model_image.DecoderRNN(input_size, hidden_size)
   model = model_image.EncoderDecoder(attention_dim, image_feature_size, hidden_size, encoder, decoder, use_teacher_forcing=config.USE_TEACHERFORCING).to(device)
#Cross
elif config.model_types[config.MODEL] == "cross":
   model = cross_att_model.EncoderDecoder(12, device, use_teacher_forcing=config.USE_TEACHERFORCING).to(device)
#Concat or Residual
else:
   decoder = model.DecoderRNN(input_size, hidden_size)
   model = model.EncoderDecoder(attention_dim, image_feature_size, hidden_size, encoder, decoder, use_teacher_forcing=config.USE_TEACHERFORCING).to(device)


def find_model_file(directory):
  best_model_file = ""
  for file in os.listdir(directory):
      if file.endswith(".bpt"):
          best_model_file = file
  return os.path.join(directory, best_model_file)

def show_attn_map(img, alpha_list):
   img = img.squeeze()
   scaler = MinMaxScaler()
   alpha_list = [v.cpu().tolist()[0] for v in alpha_list]
   scaler.fit(alpha_list)
   normalized_alpha = scaler.transform(alpha_list)

   columns = 5
   rows = 3
   _, ax_array = plt.subplots(rows, columns,squeeze=False)
   print(ax_array)
   k = 0
   for ax_row in ax_array:
      for axes in ax_row:
         
         if k == 12:
            axes.imshow(img)
            axes.set_title("originale")

         if k < 12:
            opacity = resize(normalized_alpha[k], img.shape[:2], order=3)
            opacity = opacity[..., np.newaxis]
            opacity = opacity*0.95+0.05
            vis_im = opacity*img.numpy() + (1-opacity)*255
            vis_im = vis_im.astype(img.numpy().dtype)
            axes.imshow(vis_im)
            axes.set_title("step: " + str(k))
         k=k+1

   #plt.imshow(plot_image)
   plt.show()

def evaluate(model, test_dataloader, show_plots=False):

   criterion = nn.MSELoss()
   criterionL1 = nn.L1Loss()

   mae_mean = []
   wape_mean = []
   model.eval()
   outs, gts, codes_list = [], [], []
   with torch.no_grad():
      for index, elem in enumerate(test_dataloader):
         # Unpacking
         images, trend, categ, color, fabric, _, release_date, temporal_features, img_feature, codes = elem

         images = images.to(device)
         release_date = np.asarray(release_date)
         exogeneous_params = torch.from_numpy(exog_extractor(release_date, categ, color, fabric)).to(device)
         categ = categ.to(device)
         color = color.to(device)
         fabric = fabric.to(device)
         temporal_features = temporal_features.to(device)

         #Image
         if config.model_types[config.MODEL] == "image":
            outputs, _ = model(images, exogeneous_params)
         #Cross
         elif config.model_types[config.MODEL] == "cross":
            outputs = model(images, categ, color, fabric, temporal_features,exogeneous_params)
         #Concat or Residual
         else:
            outputs, _ = model(images, categ, color, fabric, temporal_features, exogeneous_params)

         #show_attn_map(orig_8x8, alphas)
         
         outputs = outputs.cpu()
         
         if config.NORM:
            trend_norm = trend.squeeze() 
            out_norm = outputs 
         else:
            trend_norm = trend.squeeze() * normalization_values
            out_norm = outputs * normalization_values

         outs = outs + [out_norm]
         gts = gts + [trend_norm]
         codes_list = codes_list + list(codes)

         if show_plots:
            p_bar = tqdm(total=len(out_norm), desc='Creating plots', dynamic_ncols=True)
            for ii in range(out_norm.shape[0]):
               res = out_norm[ii]
               gt = trend_norm[ii]
               mae = torch.mean(torch.abs(gt - res), dim=-1)
               wMAPE = 100 * torch.sum(torch.abs(trend - outputs), dim=-1) / torch.sum(gts)
               plt.plot(res)
               plt.plot(gt)
               plt.legend(['Forecasted', 'GT'])
               plt.title("{} -- MAE: {:.3f} - wMAPE: {:.3f}".format(
                     codes[ii],
                     mae,
                     wMAPE))
               plt.savefig(os.path.join(model_filename, 'plots', codes[ii].split('/')[1]))
               plt.close()
               p_bar.update()
            p_bar.close()


      #loss = criterion(outputs.unsqueeze(0), trend)
      outputs = torch.cat(outs, dim=0)#.detach().cpu().numpy()
      trend = torch.cat(gts, dim=0)#.detach().cpu().numpy()

      # print_error_metrics(trend, outputs, trend*1065, outputs*1065)

      mae_mean = criterionL1(outputs.unsqueeze(0), trend).detach().cpu()
      wMAPE = 100 * torch.sum(torch.sum(torch.abs(trend - outputs), dim=-1)) / torch.sum(torch.vstack(gts))
      logging.info("mae_mean: {}".format(mae_mean))
      logging.info("wMAPE_mean: {}".format(wMAPE))

   
   weeks = [12,8,6,4]
   
   for w in weeks:
     outputs_np = np.array([out[0:w] for out in outputs.numpy()])
     trend_np = np.array([tr[0:w] for tr in trend.numpy()])
     codes = [sub[5:-4] for sub in codes_list]
     file = {"results": outputs_np,"gts": trend_np, "codes": codes}
     torch.save(file, model_filename+str(w)+"_dict.pth")

     
   return mae_mean


train_dir_name = os.path.join('AttentionBasedMultiModalRNN','models',model_filename)
logging.info("Evaluating")
best_model_file = find_model_file(train_dir_name)
model.load_state_dict(torch.load(best_model_file, map_location=lambda storage, loc: storage.cuda(0)))
model.eval()
evaluate(model, test_dataloader, show_plots=False)