同样是 Super Resolution
领域的一个经典文章,有了 SRCNN
的一个基础, 这次的论文复现我们更快的选择我们的框架以及快速搭建起我们的内容。
首先我们尝试下先使用比较简单且快捷的 keras
实现的方式,然后最后我们再把它搭建成我们比较常用的 torch
的方式。
我们对论文进行阅读 Accurate Image Super-Resolution Using Very Deep Convolutional Networks
我们总结出我们的论文的重点为:
- 模型具有非常深的层
- 使用了残差学习和自适应梯度裁剪来加速模型的训练
- 将单一倍数的超分模型扩充到多个倍数
与SRCNN一样,都是先将低分辨率输入双三次插值到高分辨率,再来进行模型的预测。 这里包括两个部分,VGG-like的深层网络模型,每一层卷积中均使用带padding的3x3卷积层, 并且随后都会添加一个ReLU来增强模型的非线性,这里与SRCNN、SRCNN-Ex都有着较大的改变。 然后最后使用残差学习来将模型预测到的结果element-wise的形式相加,来得到最终的结果。
之前我们的 SRCNN
使用的是 cifar-10
, 那个数据集不是很好用,因为它的原始数据就是 32 * 32
大小的,
不太适合放大缩小。我们尝试试试其他的数据集看看效果会是怎样。
- Tensorflow > 2.0
也是想着通过这个项目去尝试使用Tensorflow 2.0
然后复现一下超分辨比较经典的论文SRCNN
.
For training, python trains.py
For testing, python trains.py
但是需要注释一些内容
-
因为使用的是
cifar10
的数据集,会出现的问题就是它的图像数据的大小是 32*32 的, 所以没有做一些放大缩小的操作获取对应的 High Resolution Image -> Low Resolution Image 的操作。 -
做的
Keras
和Tensorflow
的训练并没有像Pytorch
一样使用tqdm
模块去做一些操作。 -
pytorch
要非常注意一点就是它的 Tensor 和tensorflow
或者keras
不一样,可能tensorflow
keras
是以Size * H * W * C
而pytorch
是以Size * C * H * W
的方式去计算的,所以使用的数据需要通过torch.permute
的 方式修改数据格式。
做一个 result table
:
Dataset | Epochs | Module | Method | psnr |
---|---|---|---|---|
cifar10 | 500 | SRCNN | tensorflow | 56.0 |
cifar10 | 500 | SRCNN | keras | 25.9 |
cifar10 | 500 | SRCNN | pytorch | 26.49 |
tensorflow
可能是因为数据集的问题导致 psnr
的计算会出现一些小的问题
因为数据集的使用问题,所以模型的训练是没有意义的。
出于对cifar
数据集的一个不了解,它是3232的,但是我将它 bicubic 放大成了 128128 作为 ground true。
然后训练数据 从 3232 resize 到 3232 用邻近插值,然后又 bicubic 放大成 128*128 作为训练数据,这个是无效的训练。
所以训练效果直接爆炸。
后续也不因数据集问题做更多的尝试和改进。整个内容当作对 tensorflow > 2.0
的一个入门尝试。
👇是对markdown
使用的一些了解
This repository is implementation of the "Image Super-Resolution Using Deep Convolutional Networks".
The 91-image, Set5 dataset converted to HDF5 can be downloaded from the links below.
Dataset | Scale | Type | Link |
---|---|---|---|
91-image | 2 | Train | Download |
91-image | 3 | Train | Download |
91-image | 4 | Train | Download |
Set5 | 2 | Eval | Download |
Set5 | 3 | Eval | Download |
Set5 | 4 | Eval | Download |
- liliumao/Tensorflow-srcnn
-
- I referred to this repository which is same implementation using Matlab code and Caffe model.
-