[Computer Vision] 5. Convolutional Neural Networks
스탠포드대학에서 발표한 CNN 강의 영상을 듣고 자료를 정리했습니다.
Lecture 5 | Convolutional Neural Networks
CNN의 레이어에 대해 알아보자.
Fully Connected Layer
이미지 사이즈가 32 * 32 * 3 이라면,
- input = 3072 * 1
- weight = 10 * 3072
- activation = 10 * 1
Convolution Layer
이미지 사이즈가 32 * 32 * 3 이라면,
- input = 32 * 32 * 3 (3차원 구조 유지)
- weight = 5 * 5 * 3 filter
- activation map = 28 * 28 * 1
이미지의 depth와 filter의 depth가 같아야한다.
filter가 여러 개 사용하면 층이 생기고, 각자 다른 activation map (28 * 28 * N)을 생성한다.
1. Padding
CNN 연산 수행하기 전에 input 주변을 특정값으로 채워 늘리는 것
- zero-padding
- 목적: input의 가장자리 정보 손실 문제를 막는다.
2. Stride
filter가 이동하는 간격
- stride로 출력 데이터의 크기를 조절할 수 있다.
Pooling Layer
데이터의 공간적 크기를 축소시킨다.
- pooling을 통해 모델의 전체 매개변수의 수를 줄일 수 있다.
- Max-Pooling, Average-Pooling 등이 있다.
댓글남기기