train_ss.py

from __future__ import division
import os,time,cv2,scipy.io
import tensorflow as tf
import tensorflow.contrib.slim as slim
import numpy as np
import matplotlib.pyplot as plt
from skimage.measure import compare_ssim as ssim
from skimage.measure import compare_psnr as psnr
from networks import *
from utils import *
import scipy.stats as st
import argparse,sys

parser = argparse.ArgumentParser()
parser.add_argument("--task", default="pre-trained", help="path to folder containing the model")
parser.add_argument("--data_dir", default="./ISTD_dataset/train/", help="path to real dataset")
parser.add_argument("--save_model_freq", default=5, type=int, help="frequency to save model")
parser.add_argument("--use_gpu", default=0, type=int, help="frequency to save model")
parser.add_argument("--is_hyper", default=1, type=int, help="use hypercolumn or not")
parser.add_argument("--is_training", default=1, help="training or testing")
parser.add_argument("--continue_training", action="store_true", help="search for checkpoint in the subfolder specified by `task` argument")
ARGS = parser.parse_args()

task='logs/'+ARGS.task
is_training=ARGS.is_training==1
continue_training=ARGS.continue_training
hyper=ARGS.is_hyper==1
current_best = 0
maxepoch=101
EPS = 1e-12
channel = 64 # number of feature channels to build the model, set to 64
vgg_19_path = scipy.io.loadmat('./Models/imagenet-vgg-verydeep-19.mat')

train_w,train_h = 256,256
test_w,test_h = 640,480


if ARGS.use_gpu<0:
    os.environ['CUDA_VISIBLE_DEVICES'] = ''
else:
    os.environ['CUDA_VISIBLE_DEVICES']=str(ARGS.use_gpu)


train_real_root=[ARGS.data_dir]

# set up the model and define the graph
with tf.variable_scope(tf.get_variable_scope()):
    input=tf.placeholder(tf.float32,shape=[None,None,None,3])
    target=tf.placeholder(tf.float32,shape=[None,None,None,3])
    mask = tf.placeholder(tf.float32,shape=[None,None,None,1])

    # build the model
    # I_s = I_ns * I_sm
    shadowed_image = build_shadow_generator(tf.concat([input,mask],axis=3),channel) * input

    # Perceptual Loss
    loss_percep = compute_percep_loss(shadowed_image, target, vgg_19_path=vgg_19_path)
    # Adversarial Loss
    with tf.variable_scope("discriminator"):
        predict_real,pred_real_dict = build_discriminator(input,target)
    with tf.variable_scope("discriminator", reuse=True):
        predict_fake,pred_fake_dict = build_discriminator(input,shadowed_image)

    d_loss=(tf.reduce_mean(-(tf.log(predict_real + EPS) + tf.log(1 - predict_fake + EPS)))) * 0.5
    g_loss=tf.reduce_mean(-tf.log(predict_fake + EPS))

    loss = loss_percep

train_vars = tf.trainable_variables()
d_vars = [var for var in train_vars if 'discriminator' in var.name]
g_vars = [var for var in train_vars if 'g_' in var.name]
g_opt=tf.train.AdamOptimizer(learning_rate=0.0002).minimize(loss*100+g_loss, var_list=g_vars) # optimizer for the generator
d_opt=tf.train.AdamOptimizer(learning_rate=0.0001).minimize(d_loss,var_list=d_vars) # optimizer for the discriminator

for var in tf.trainable_variables():
    print("Listing trainable variables ... ")
    print(var)

saver=tf.train.Saver(max_to_keep=None)

if not os.path.isdir(task):
    os.makedirs(task)

######### Session #########
sess=tf.Session()
sess.run(tf.global_variables_initializer())
ckpt=tf.train.get_checkpoint_state(task)
print("[i] contain checkpoint: ", ckpt)

if ckpt and continue_training:
    saver_restore=tf.train.Saver([var for var in tf.trainable_variables()])
    print('loaded '+ckpt.model_checkpoint_path)
    saver_restore.restore(sess,ckpt.model_checkpoint_path)
# test doesn't need to load discriminator
elif not is_training:
    saver_restore=tf.train.Saver([var for var in tf.trainable_variables() if 'discriminator' not in var.name])
    print('loaded '+ckpt.model_checkpoint_path)
    saver_restore.restore(sess,ckpt.model_checkpoint_path)
sys.stdout.flush()
if is_training:
    # please follow the dataset directory setup in README
    input_images_path=prepare_data(train_real_root,stage=['train_A']) # no reflection ground truth for real images
    print("[i] Total %d training images, first path of real image is %s." % (len(input_images_path), input_images_path[0]))
    
    num_train=len(input_images_path)
    all_l=np.zeros(num_train, dtype=float)
    all_percep=np.zeros(num_train, dtype=float)
    all_grad=np.zeros(num_train, dtype=float)
    all_g=np.zeros(num_train, dtype=float)
    for epoch in range(1,maxepoch):
        input_images_ids,target_images_ids=[None]*num_train,[None]*num_train
        epoch_st = time.time()

        if os.path.isdir("%s/%04d"%(task,epoch)):
            continue
        cnt=0
        for id in np.random.permutation(num_train):
            st=time.time()
            if input_images_ids[id] is None:
                _id=id%len(input_images_path)
                running_idx = (epoch-1)*num_train+cnt

                inputimg = cv2.imread(input_images_path[_id],-1)

                neww=512 # w is the longer width[] 640/
                newh=round((neww/inputimg.shape[1])*inputimg.shape[0])

                iminput,imtarget,maskgt = parpare_image(input_images_path[_id],(neww,newh),da=True,stage=['_M','_C','_B'])

               # alternate training, update discriminator every two iterations
                if cnt%2==0:
                    fetch_list=[d_opt]
                    # update D
                    _=sess.run(fetch_list,feed_dict={input:imtarget,target:iminput,mask:maskgt})

                # update G                
                fetch_list=[g_opt,shadowed_image,d_loss,g_loss,loss,loss_percep]
                _,imoutput,current_d,current_g,current,current_percep=\
                    sess.run(fetch_list,feed_dict={input:imtarget,target:iminput,mask:maskgt})

                all_l[id]=current
                all_percep[id]=current_percep
                all_g[id]=current_g
                g_mean=np.mean(all_g[np.where(all_g)])

                if running_idx% 500==0:
                    print("iter: %d %d || D: %.2f || G: %.2f %.2f || mean all: %.2f || percp: %.2f %.2f || time: %.2f"%
                        (epoch,cnt,current_d,current_g,g_mean,
                            np.mean(all_l[np.where(all_l)]),
                            current_percep, np.mean(all_percep[np.where(all_percep)]),
                            time.time()-st))

                    fileid = os.path.splitext(os.path.basename(input_images_path[_id]))[0]
                    imoutput=decode_image(imoutput)
                    iminput=decode_image(iminput)
                    imtarget=decode_image(imtarget)
                    cv2.imwrite("%s/%s_%s.jpg"%(task, running_idx, fileid),np.concatenate((iminput,imoutput,imtarget),axis=1))

                cnt+=1
                input_images_ids[id]=1.
                target_images_ids[id]=1.

        print('epoch %s use %s'%(epoch,time.time()-epoch_st))

        # save model and images every epoch
        if epoch % ARGS.save_model_freq == 0:
            saver.save(sess,"%s/lasted_model.ckpt"%task)
            sys.stdout.flush()

else:
    subtask=task.replace('/','_') + '_94' # if you want to save different testset separately
    for val_path in prepare_data([ARGS.data_dir],stage=['shadow_free']):
        bacid = os.path.splitext(os.path.basename(val_path))[0]
        mask_dir = os.path.join(ARGS.data_dir,'train_B')
        # 100*80
        all_masks = random.sample([ os.path.join(mask_dir,x) for x in os.listdir(mask_dir) if os.path.isfile(os.path.join(mask_dir,x))],3)
        for mask_path in all_masks:
            iminput,immask = parpare_image_fake_generator(val_path,mask_path,(test_w,test_h))

            immask = immask[:,:,:,0:1]
            
            st=time.time()
            imoutput=sess.run([shadowed_image],feed_dict={input:iminput,mask:immask})
            print("Test time %.3f for image %s"%(time.time()-st, val_path))
            if not os.path.isdir("./results/%s"%(subtask)):
                os.makedirs("./results/%s"%(subtask))

            # shadow free id , mask id 
            maskid = mask_path.split('/')[-1]
            cv2.imwrite("./results/%s/%s_%s"%(subtask,bacid,maskid),decode_image(imoutput))