네이버 부스트캠프 학습 정리/14~16주차 2

[Semantic Segmentation] After FCN

FCN의 한계 1. 객체의 크기가 크거나 작은 경우 예측을 잘 하지 못한다. 2. Object의 디테일한 모습이 사라지는 문제가 발생한다. Decoder을 개선한 모델 DeconvNet Encoder와 Decoder를 대칭 형태로 만들었으며 backbone으로 VGG16을 사용한다. Encoder의 Conv에서 ReLU, Pooling이 일어나며 Deconvolutional Network는 Unpooling, deconvolution, ReLU로 이루어진다. deconvolution은 FCN에 나왔던 것처럼 tranposed convolution을 통해 진행되며, unpooling은 그림과 같이 pooling의 반대 연산을 수행한다. pooling 연산은 노이즈를 제거하지만 정보가 손실되는 문제가 생긴다..

[Semantic Segmentation] FCN

Overview Semantic Segmentation을 수행하기 위해 image classification을 진행했던 CNN에 대해 이를 변형시킨 네트워크. backbone으로는 (VGG16, GoogLeNet) 등을 사용한다. 기존의 CNN에서 image classification을 진행할 때 FC layer를 통해 정보를 통합해 계산한 class 별 확률을 통한 task 예측을 수행했다. 하지만 semantic segmentation에서는 이 feature map의 위치 정보가 FC layer에서 사라지는 것을 방지하고자 이 부분을 FC layer 대신 CNN을 통해 위치 정보를 유지했고, 이를 통해 segmentation task가 가능하게 했다. 또한 이 방법을 통해 input image의 si..