논문리뷰

Fast and Efficient Image Quality Enhancement via Desubpixel Convolutional Neural Networks. (ECCVW 2018)

Park Hyun Kook 2020. 7. 7. 13:05

Fast and Efficient Image Quality Enhancement via Desubpixel Convolutional Neural Networks. (ECCVW 2018)

-Authors:  Thang Vu, Nguyen, Trung X. Pham, Tung M. Luu, and Chang D. Yoo (KAIST)

 

-본 논문에서는 네트워크 초반 layer에서 input resolution이나 feature size 줄일 발생하는 정보의 손실을 해결하고자 De-subpixel convolution 제안한다. 제안하는 De-subpixel convolution Upsampling 사용되는 sup-pixel convolution(pixel shuffle) 역으로 사용한다.  sup-pixel convolution Upsampling 진행할때 하나의 layer interpolation 통해 Up하는 것보다, 여러 layer pixel shuffle하면서 fuse하여 Upsampling하여 성능을 높혔다. 논문에서는 downsampling 진행할 sub-pixel convolution 역으로 진행하여, 모든 뉴런들이 골고루 사용되면 downsampling 진행하여 정보의 손실을 최소화한다.

Figure 1: Subpixel and the proposed de-subpixel

 

Figure 2: Downsampling  기법들과   제안하는   기법의   비교 .

-Figure 2 downsampling 사용되는 기법들을 비교한다. 1번은 3x3 convolution with stride 2, 2번째는 2x2 max pooling, 3번째는 Bilinear, 마지막은 제안하는 de-subpixel convolution이다. 파란색 음영은 뉴런의 filtering 횟수이다.

 

-3x3 Convolution with stride 2,  3x3 convolution 그림과 같이 뉴런이 filter되는 횟수가 1, 2, 4 다양하다. 가장 진한 파란색은 4 filter 것이며, 밝은 파란색은 1 filter 뉴런이다. Stride=2 하면 이러한 불규칙한(non-uniform) 뉴런의 기여(contribution) 발생한다. 중요한 정보를 가진 뉴런에게 적절한 filter 기회가 주어지지 않을 있다.

 

-2x2 Max pooling, 2x2 max pooling 2x2 block내의 4개의 뉴런 1개만 다음 layer 연결된다. 뉴런의 선택은 가장 두드러진(prominent) 뉴런을 선택하지만, 이러한 선택은 reconstruction 정확도를 감소시킨다.

 

-Bilinear, Binear 2x2 뉴런들이 각각의 가중 합으로 represent되며, 이는 어느정도 완화된 max pooling으로 생각될 있다. 더불어 bilinear interpolation 되돌릴 없다. (irreversible)

 

-De-subpixel, 제안하는 De-subpixel 그림과 같이 모든 뉴런에게 동등한 filter 기회가 주어진다.

 

 

https://github.com/thangvubk/FEQE