구현 2

[CV basic] GoogLeNet/ResNet

GoogLeNet GoogLeNet의 전체 구조. 동그라미 친 부분이 Inception module이며, 첫 부분은 Vanilla CNN이다. Inception module (a)는 1x1 conv를 통한 차원 축소를 진행하지 않은 Inception module이며, (b)는 차원 축소를 진행한 모듈이다. Inception module은 1x1, 3x3, 5x5 conv filter 이후 3x3 max pool을 진행한 후 모든 필터를 합쳐서 뱉어낸다. (b)의 차원 축소는 1x1 conv filter의 bottleneck 구조로 이루어진다. 이런 구성으로 이루어진 Inception module을 쌓아서 이루어진 구조이며 그 아래엔 Auxiliary classifiers가 있다. Auxiliary cla..

[CV basic] AlexNet/VGGNet

작년에 왔던 각설이 죽지도 않고 또 온것처럼 CV 얘기에선 정말 빠질 수 없는 근-본모델.. 이제는 도메인 별 기초를 배우기 때문에 심화학습으로 배웠고, 과제로 풀었던 코드까지 살짝 리뷰하며 정리 LeNet 가장 최초의 CNN 모델이라고 볼 수있는 LeNet. Conv - Pool - Conv - Pool - FC - FC 구조로 이루어져 있으며, 5x5 with strde 1 필터를 사용한다. pooling으로는 2x2 max pooling with stride 2 사용. AlexNet 위에서 LeNet을 언급한 것은 비교하기 위함. 단순히만 봐도 Conv - pool - Conv - pool - Conv - Conv - Conv - Pool - FC - FC - FC 로 모델이 훨씬 복잡해졌음. 또한..