최대 1 분 소요

스탠포드대학에서 발표한 CNN 강의 영상을 듣고 자료를 정리했습니다.

Lecture 5 | Convolutional Neural Networks

CNN의 레이어에 대해 알아보자.

Fully Connected Layer

image

이미지 사이즈가 32 * 32 * 3 이라면,

  • input = 3072 * 1
  • weight = 10 * 3072
  • activation = 10 * 1


Convolution Layer

image

이미지 사이즈가 32 * 32 * 3 이라면,

  • input = 32 * 32 * 3 (3차원 구조 유지)
  • weight = 5 * 5 * 3 filter
  • activation map = 28 * 28 * 1

이미지의 depth와 filter의 depth가 같아야한다.

filter가 여러 개 사용하면 층이 생기고, 각자 다른 activation map (28 * 28 * N)을 생성한다.


1. Padding

image

CNN 연산 수행하기 전에 input 주변을 특정값으로 채워 늘리는 것

  • zero-padding
  • 목적: input의 가장자리 정보 손실 문제를 막는다.


2. Stride

image

filter가 이동하는 간격

  • stride로 출력 데이터의 크기를 조절할 수 있다.



Pooling Layer

image

데이터의 공간적 크기를 축소시킨다.

  • pooling을 통해 모델의 전체 매개변수의 수를 줄일 수 있다.
  • Max-Pooling, Average-Pooling 등이 있다.

댓글남기기