Introduction

This is a port of the Synthetic Visual Reasoning Test problems to the pytorch framework, with an implementation of two convolutional networks to solve them.

Installation and test

Executing

make -j -k
./test-svrt.py

should generate an image example.png in the current directory.

Note that the image generation does not take advantage of GPUs or multi-core, and can be as fast as 10,000 vignettes per second and as slow as 40 on a 4GHz i7-6700K.

Vignette generation and compression

Vignette sets

The file svrtset.py implements the classes VignetteSet and CompressedVignetteSet both with a constructor

__init__(problem_number, nb_samples, batch_size, cuda = False, logger = None)

and a method

(torch.FloatTensor, torch.LongTensor) get_batch(b)

which returns a pair composed of a 4d 'input' Tensor (i.e. single channel 128x128 images), and a 1d 'target' Tensor (i.e. Boolean labels).

Low-level functions

The main function for generating vignettes is

torch.ByteTensor svrt.generate_vignettes(int problem_number, torch.LongTensor labels)

where

problem_number indicates which of the 23 problem to use
labels indicates the boolean labels of the vignettes to generate

The returned ByteTensor has three dimensions:

Vignette index
Pixel row
Pixel col

The two additional functions

torch.ByteStorage svrt.compress(torch.ByteStorage x)

and

torch.ByteStorage svrt.uncompress(torch.ByteStorage x)

provide a lossless compression scheme adapted to the ByteStorage of the vignette ByteTensor (i.e. expecting a lot of 255s, a few 0s, and no other value).

This compression reduces the memory footprint by a factor ~50, and may be usefull to deal with very large data-sets and avoid re-generating images at every batch. It induces a little overhead for decompression, and moving from CPU to GPU memory.

See vignette_set.py for a class CompressedVignetteSet using it.

Testing convolution networks

The file cnn-svrt.py provides the implementation of two deep networks designed by Afroze Baqapuri during an internship at Idiap, and allows to train them with several millions vignettes on a PC with 16Gb and a GPU with 8Gb.

Name		Name	Last commit message	Last commit date
Latest commit History 196 Commits
svrt		svrt
.gitignore		.gitignore
Makefile		Makefile
README.md		README.md
build.py		build.py
cnn-svrt.py		cnn-svrt.py
example.png		example.png
generate.py		generate.py
generate_all_problems.sh		generate_all_problems.sh
gpl-3.0.txt		gpl-3.0.txt
misc.cc		misc.cc
misc.h		misc.h
parse_h5py.py		parse_h5py.py
random.cc		random.cc
random.h		random.h
shape.cc		shape.cc
shape.h		shape.h
svrt.c		svrt.c
svrt.h		svrt.h
svrt_generator.cc		svrt_generator.cc
svrt_generator.h		svrt_generator.h
svrtset.py		svrtset.py
test-svrt.py		test-svrt.py
test-svrt_all23.py		test-svrt_all23.py
vignette.cc		vignette.cc
vignette.h		vignette.h
vignette_generator.cc		vignette_generator.cc
vignette_generator.h		vignette_generator.h
vision_problem_1.cc		vision_problem_1.cc
vision_problem_1.h		vision_problem_1.h
vision_problem_10.cc		vision_problem_10.cc
vision_problem_10.h		vision_problem_10.h
vision_problem_101.cc		vision_problem_101.cc
vision_problem_101.h		vision_problem_101.h
vision_problem_11.cc		vision_problem_11.cc
vision_problem_11.h		vision_problem_11.h
vision_problem_12.cc		vision_problem_12.cc
vision_problem_12.h		vision_problem_12.h
vision_problem_13.cc		vision_problem_13.cc
vision_problem_13.h		vision_problem_13.h
vision_problem_14.cc		vision_problem_14.cc
vision_problem_14.h		vision_problem_14.h
vision_problem_15.cc		vision_problem_15.cc
vision_problem_15.h		vision_problem_15.h
vision_problem_151.cc		vision_problem_151.cc
vision_problem_151.h		vision_problem_151.h
vision_problem_152.cc		vision_problem_152.cc
vision_problem_152.h		vision_problem_152.h
vision_problem_16.cc		vision_problem_16.cc
vision_problem_16.h		vision_problem_16.h
vision_problem_17.cc		vision_problem_17.cc
vision_problem_17.h		vision_problem_17.h
vision_problem_18.cc		vision_problem_18.cc
vision_problem_18.h		vision_problem_18.h
vision_problem_19.cc		vision_problem_19.cc
vision_problem_19.h		vision_problem_19.h
vision_problem_2.cc		vision_problem_2.cc
vision_problem_2.h		vision_problem_2.h
vision_problem_20.cc		vision_problem_20.cc
vision_problem_20.h		vision_problem_20.h
vision_problem_201.cc		vision_problem_201.cc
vision_problem_201.h		vision_problem_201.h
vision_problem_21.cc		vision_problem_21.cc
vision_problem_21.h		vision_problem_21.h
vision_problem_22.cc		vision_problem_22.cc
vision_problem_22.h		vision_problem_22.h
vision_problem_23.cc		vision_problem_23.cc
vision_problem_23.h		vision_problem_23.h
vision_problem_3.cc		vision_problem_3.cc
vision_problem_3.h		vision_problem_3.h
vision_problem_301.cc		vision_problem_301.cc
vision_problem_301.h		vision_problem_301.h
vision_problem_4.cc		vision_problem_4.cc
vision_problem_4.h		vision_problem_4.h
vision_problem_401.cc		vision_problem_401.cc
vision_problem_401.h		vision_problem_401.h
vision_problem_5.cc		vision_problem_5.cc
vision_problem_5.h		vision_problem_5.h
vision_problem_501.cc		vision_problem_501.cc
vision_problem_501.h		vision_problem_501.h
vision_problem_51.cc		vision_problem_51.cc
vision_problem_51.h		vision_problem_51.h
vision_problem_52.cc		vision_problem_52.cc
vision_problem_52.h		vision_problem_52.h
vision_problem_6.cc		vision_problem_6.cc
vision_problem_6.h		vision_problem_6.h
vision_problem_601.cc		vision_problem_601.cc
vision_problem_601.h		vision_problem_601.h
vision_problem_7.cc		vision_problem_7.cc
vision_problem_7.h		vision_problem_7.h
vision_problem_8.cc		vision_problem_8.cc
vision_problem_8.h		vision_problem_8.h
vision_problem_9.cc		vision_problem_9.cc
vision_problem_9.h		vision_problem_9.h
vision_problem_901.cc		vision_problem_901.cc
vision_problem_901.h		vision_problem_901.h
vision_problem_tools.cc		vision_problem_tools.cc
vision_problem_tools.h		vision_problem_tools.h

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Introduction

Installation and test

Vignette generation and compression

Vignette sets

Low-level functions

Testing convolution networks

About

Releases

Packages

Contributors 3

Languages

yihe-61wu/pySVRT

Folders and files

Latest commit

History

Repository files navigation

Introduction

Installation and test

Vignette generation and compression

Vignette sets

Low-level functions

Testing convolution networks

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages