본문 바로가기
논문리뷰

MoblieNets: Efficient Convolutional Neural Networks for Mobile Vision Application.

by Park Hyun Kook 2020. 6. 1.

MoblieNets: Efficient Convolutional Neural Networks for Mobile Vision Application.

  Authors: A. G. Howard, M. Zhu, B. Chen, D. Kalenichenko, W. Wang, T. Weyand, M. Andreetto, and H. Adam.

 

- 본 논문에서는 depthwise separable convolution 2개의 hyper parameter 통해 네트워크를 가볍게 설계하고, 이를 통해서 모바일이나 vision application 쉽고 적합하게 적용될 있는 mobileNet 제안했다.

 

- 첫번째 기법인 depthwise separable convolution 기존 normal convolution 달리 depthwise conv pointwise conv 2개로 구성된다. Depthwise conv 각각 input channel 별로 single filter 적용하는 역할을 한다. Depthwise conv normal conv보다 훨씬 효과적이지만, input channel filter 적용하기 때문에 새로운 feature 만들어 내지 않는다. 따라서 depth conv 1x1 conv으로 구성된 pointwise conv 연쇄하게 붙이며 새로운 feature 만들어 낼수 있고, 더불어 computational cost 감소시킬 있다. 논문에서는 3x3 depthwise separable conv 적용했으며, standard cov보다 8-9 정도 계산복잡성을 줄였다.

 

좌측  standard convolution으로 모든 channel에 대한 feature를 한번에 뽑아낸다. 우측 depthwise separable convolution은 depthwise conv을 통해 spatial feature를 뽑아내고 pointwise conv을 통해 linear combination하여 전체 channel에 대한 feature를 만들어낸다.

 

- 두번째 기법인 2개의 hyper-parameter α, ρ 이다. α width multiplier parameter이며, input channels= M, output channels=N α 적용하여 αM  , αN 으로 변경된다. α (0<α <1) 이며 주로 1,  0.75,  0.5,  0.25 가지고 1일때는 가장 base MobileNet 그리고 1보다 작게 작아질수록 MobileNet 줄이며 computational cost network parameter 줄일 있다.

 

- 두 번째 hyper-parameter ρ resolution multiplier이며 input resolution 줄이는 역할을 한다.

 

- 결론적으로, MobileNet depthwise separable convolution 적용과 2개의 hyper-parameter 조정하며, computational cost parameter 줄이며 네트워크를 light하게 설계하며, mobile이나, vision application 각각 적합하게 적용되었다.

댓글