psuedoAlexNet.py

import math
import random
import time
import os,sys
import numpy as np
import tensorflow as tf
import cv2
import os.path
os.environ['TF_CPP_MIN_LOG_LEVEL'] = '2' 

# Hyperparameters
learning_rate = 1e-4
num_steps = 2000
batch_size = 32

im_size = 400
num_input = im_size*im_size 
im_size_flat = im_size * im_size * 3
num_classes = 10 # 10 classes of prices ranges
dropout_rate = 0.5
classes = [[0,101],[101,196],[196,321],[321,499],[499,760],[760,1202],[1202,2033],[2033,3857],[3857,9643],[9643,60130038]]

def load_data(start,end):
	cwd = os.getcwd()
	im_path = cwd + "/images/"
	X = []
	labels = []
	image_dir = os.listdir( im_path )
	num_item = 0
	count = 0
	for item in image_dir[start:end+1]:
		if os.path.isfile(im_path+item):
			price_label = int(item.split('_')[0])
			im = np.array(cv2.imread(im_path+item,-1))
			if im is not None and im.shape == (im_size,im_size,3):
				X.append(im)
				print(item)
				print(num_item)
				num_item += 1
				for i in range(len(classes)):
					if price_label >= classes[i][0] and price_label < classes[i][1]:
						labels.append(i)
				count += 1
		
	
	X = np.vstack(X)
	num_images  = int(X.shape[0]/im_size)
	X = X.reshape((num_images,im_size_flat))
	# test_indices = np.random.choice(num_images,int(num_images*.1),replace=False)
	# train_indices = np.setdiff1d(range(num_images),test_indices)
	test_indices = np.arange(num_images - int(num_images*.1),num_images)
	train_indices = np.arange(0,int(num_images*.9))

	labels = np.array(labels)
	xtrain = X[train_indices,:]
	labelstrain = labels[train_indices]
	xtest = X[test_indices,:]
	labelstest = labels[test_indices]
	return xtrain,labelstrain,xtest,labelstest

def load_test_data(start,end):
	cwd = os.getcwd()
	im_path = cwd + "/images/"
	X = []
	labels = []
	image_dir = os.listdir( im_path )
	num_item = 0
	count = 0
	for item in image_dir[start:end+1]:
		if os.path.isfile(im_path+item):
			price_label = int(item.split('_')[0])
			im = np.array(cv2.imread(im_path+item,-1))
			if im is not None and im.shape == (im_size,im_size,3):
				X.append(im)
				print(item)
				print(num_item)
				num_item += 1
				for i in range(len(classes)):
					if price_label >= classes[i][0] and price_label < classes[i][1]:
						labels.append(i)
				count += 1

	X = np.vstack(X)
	num_images  = int(X.shape[0]/im_size)
	X = X.reshape((num_images,im_size_flat))
	labels = np.array(labels)
	return X,labels


# Helper Functions
def generate_chunk(data, chunk_size = batch_size):
	x, y = data
	num_images = x.shape[0]
	num_chunks = int(math.ceil(num_images/chunk_size))
	indices = np.arange(num_images)
	chunk_indices = np.array_split(indices,num_chunks)
	return chunk_indices

def onehot_conv(array):
	onehot = np.zeros((10,len(array)))
	for i,el in enumerate(array):
		onehot[el,i] = 1
	return onehot.transpose()

def weight_variable(shape):
	initial = tf.truncated_normal(shape, stddev=0.1)
	return tf.Variable(initial)

def bias_variable(shape):
	initial = tf.constant(0.1, shape=shape)
	return tf.Variable(initial)

def conv2d(x, W, stride = 1):
	return tf.nn.conv2d(x, W, strides=[1, stride, stride, 1], padding='SAME')

def max_pool_3x3(x):
	return tf.nn.max_pool(x, ksize=[1, 3, 3, 1],
												strides=[1, 3, 3, 1], padding='SAME')


sess = tf.InteractiveSession()
sess.run(tf.global_variables_initializer())

x = tf.placeholder(tf.float32, shape=[None, im_size_flat])
y_ = tf.placeholder(tf.float32, shape=[None, 10])

x_image = tf.reshape(x, [-1, im_size, im_size, 3])

W_conv1 = weight_variable([5, 5, 3, 32])
b_conv1 = bias_variable([32])
h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1)
h_pool1 = max_pool_3x3(h_conv1)

W_conv2 = weight_variable([5, 5, 32, 64])
b_conv2 = bias_variable([64])
h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2)
h_pool2 = max_pool_3x3(h_conv2)

W_conv3 = weight_variable([5, 5, 64, 64])
b_conv3 = bias_variable([64])
h_conv3 = tf.nn.relu(conv2d(h_pool2, W_conv3) + b_conv3)

W_conv4 = weight_variable([5, 5, 64, 64])
b_conv4 = bias_variable([64])
h_conv4 = tf.nn.relu(conv2d(h_conv3, W_conv4) + b_conv4)

W_conv5 = weight_variable([5, 5, 64, 32])
b_conv5 = bias_variable([32])
h_conv5 = tf.nn.relu(conv2d(h_conv4, W_conv5) + b_conv5)
h_pool5 = max_pool_3x3(h_conv5)

W_fc1 = weight_variable([15*15*32, 2048])
b_fc1 = bias_variable([2048])

h_pool5_flat = tf.reshape(h_pool5, [-1, 15*15*32])
h_fc1 = tf.nn.relu(tf.matmul(h_pool5_flat, W_fc1) + b_fc1)
keep_prob = tf.placeholder(tf.float32)
h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob)

W_fc2 = weight_variable([2048, 10])
b_fc2 = bias_variable([10])

y_conv = tf.matmul(h_fc1_drop, W_fc2) + b_fc2


cross_entropy = tf.reduce_mean(
		tf.nn.softmax_cross_entropy_with_logits(labels=y_, logits=y_conv))
train_step = tf.train.AdamOptimizer(learning_rate).minimize(cross_entropy)
correct_prediction = tf.equal(tf.argmax(y_conv, 1), tf.argmax(y_, 1))
accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

saver = tf.train.Saver({"W_conv1": W_conv1,"b_conv1": b_conv1,"W_conv2": W_conv2,"b_conv2": b_conv2,"W_conv3": W_conv3,"b_conv3": b_conv3,"W_conv4": W_conv4,"b_conv4": b_conv4,"W_conv5": W_conv5,"b_conv5": b_conv5,"W_fc1": W_fc1,"b_fc1": b_fc1,"W_fc2": W_fc2,"b_fc2": b_fc2})

# number of epochs to run
epoch_count = 30

if os.path.isfile('training_acc.npy') and os.path.isfile('valid_acc.npy'):
	training_acc = np.load('training_acc.npy')
	valid_acc  = np.load('valid_acc.npy')
else:
	training_acc = np.array([])
	valid_acc  = np.array([])

with tf.Session() as sess:
	sess.run(tf.global_variables_initializer())
	if os.path.isfile('trained_variables3.ckpt.data-00000-of-00001'):
		saver.restore(sess, os.path.join(os.getcwd(), 'trained_variables3.ckpt'))
		print("Model restored.")


	# Training Block
	for e in  range(epoch_count):
		for t in [1,2,3]:
			if t == 1:
				#Load our data
				xtrain,labelstrain,xdev,labelsdev = load_data(0,30000)
				data_train = (xtrain,onehot_conv(labelstrain))
				data_dev = (xdev,onehot_conv(labelsdev))
			elif t == 2:
				#Load our data
				xtrain,labelstrain,xdev,labelsdev = load_data(30000,60000)
				data_train = (xtrain,onehot_conv(labelstrain))
				data_dev = (xdev,onehot_conv(labelsdev))
			else:
				#Load our data
				xtrain,labelstrain,xdev,labelsdev = load_data(60000,90000)
				data_train = (xtrain,onehot_conv(labelstrain))
				data_dev = (xdev,onehot_conv(labelsdev))

			chunk_indices = generate_chunk(data_train, chunk_size = batch_size)
			train_acc = 0
			count = 1
			for chunk in chunk_indices:
				print(count)
				chunk_size = len(chunk)
				xtrain_chunk = data_train[0][chunk]
				ytrain_chunk = data_train[1][chunk]
				chunk_train_acc = accuracy.eval(feed_dict={x: xtrain_chunk, y_: ytrain_chunk, keep_prob: 1.0})
				print('chunk train accuracy %g' % chunk_train_acc)
				train_acc += chunk_size*chunk_train_acc
				count += 1
				if count%100 == 0:
					saver.save(sess, os.path.join(os.getcwd(), 'trained_variables3.ckpt'))
				train_step.run(feed_dict={x: xtrain_chunk, y_: ytrain_chunk, keep_prob: dropout_rate})
			num_train_images = chunk_size*len(chunk_indices)
			train_acc = train_acc/num_train_images
			training_acc = np.append(training_acc,float(train_acc))
			np.save('training_acc',training_acc)
			print('training accuracy %g' % train_acc) 
		

			chunk_indices = generate_chunk(data_dev, chunk_size = batch_size)
			dev_acc = 0
			for chunk in chunk_indices:
				chunk_size = len(chunk)
				xdev_chunk = data_dev[0][chunk]
				ydev_chunk = data_dev[1][chunk]
				chunk_dev_acc = accuracy.eval(feed_dict={x: xdev_chunk, y_: ydev_chunk, keep_prob: 1.0})
				print('chunk valid accuracy %g' % chunk_dev_acc)
				dev_acc += chunk_size*chunk_dev_acc
			num_dev_images = chunk_size*len(chunk_indices)
			dev_acc = dev_acc/num_dev_images
			valid_acc = np.append(valid_acc,float(dev_acc))
			np.save('valid_acc',valid_acc)
			print('validation accuracy %g' % dev_acc) 

	# Testing Block
	# Load test data
	xtest,labelstest = load_test_data(90000,100000)
	data_test = (xtest,onehot_conv(labelstest))
	# run test accuracy on batches of test data
	chunk_indices = generate_chunk(data_test, chunk_size = batch_size)
	test_acc = 0
	for chunk in chunk_indices:
		chunk_size = len(chunk)
		xtest_chunk = data_test[0][chunk]
		ytest_chunk = data_test[1][chunk]
		chunk_test_acc = accuracy.eval(feed_dict={x: xtest_chunk, y_: ytest_chunk, keep_prob: 1.0})
		print('chunk test accuracy %g' % chunk_test_acc)
		test_acc += chunk_size*chunk_test_acc
	num_test_images = chunk_size*len(chunk_indices)
	test_acc = test_acc/num_test_images
	print('test accuracy %g' % test_acc)
	np.save('test_acc',np.array([test_acc]))