[Computer Vision] 1. Introduction to Convolutional Neural Networks for Visual Recognition

2022-10-01 1 분 소요

스탠포드대학에서 발표한 CNN 강의 영상을 듣고 자료를 정리했습니다.

Lecture 1 | Introduction to Convolutional Neural Networks for Visual Recognition

Computer Vision이란?

컴퓨터 과학의 연구 분야 중 인간이 시각적으로 하는일들을 대행하도록 시스템을 만드는 것이다.

Vision의 역사

생물학적 Vision

빅뱅을 시작으로 생물이 진화하면서 현재 Vision은 동물의 큰 감각 체계가 되었다.

인간의 대뇌 절반 가량의 뉴런이 시각 처리에 관여할 정도로 큰 부분을 차지한다.

인공적 Vision

1600년대 카메라인 Obscura 발명을 시작으로 카메라 기술이 발전하였고,

지금까지 가장 많이 사용하는 센서중 하나이다.

Computer Vision의 역사

1. 포유류의 시각처리방식 연구(Hubel & Wiesel, 1959)

고양이의 뇌에 전기적 신호를 보내고 1차 시각 피질에 다양한 종류의 세포가 있음을 발견했다.

Simple cells

1차 시각 피질에서 가장 중요한 세포이며, 시각처리가 시작되는 곳이다.

특정한 방향으로 이동할 때 oriented edge에 반응한다.

즉, 시각 처리가 단순한 구조로 시작하여 점점 복잡해지는 것을 발견하였다.

2. Block World(Larry Roberts, 1963)

사물의 특징을 얻기 쉽도록 실제 사물을 기하학적인 모양으로 단순화하는 모형을 제시하였다.

3. The Summer Vision Project(MIT, 1966)

4. Hierachical Model(David Marr, 1970s)

우리의 눈에 인식된 이미지를 3D로 표현하기 위한 3단계 과정을 정의하였다.

5. Generalized Cylinder(1979), Pictorial Structure(1973)

모든 물체는 단순한 기하학적 구조로 이루어졌다

6. 이미지 인식을 객체 분할로 시작(1980s)

배경: 실제 세계를 단순화된 구조로 인식하기 어려움

이미지의 픽셀들을 그룹화하여 의미있는 영역으로 분할하는 방식으로 이미지 분류를 하였다.

7. Face Detection(Paul Viola, Michael Jones, 2001)

AdaBoost algorithm 사용 & 카메라 기술 발전 → 실시간 얼굴 인식 가능해짐

8. Shift & Object Recognition(David Lowe, 1999)

같은 객체임에도 불구하고 카메라 각도에 따라서 이미지를 다르게 인식하는 문제가 발생한다.

이에 연구 방향이 객체 분할에서 객체 인식으로 바뀌었다.

객체를 인식하기 위한 중요한 특징을 찾고 → 유사한 객체와 그러한 특징들을 맞춰보며 객체를 인식하는 방식을 사용한다.

ImageNet Project

목적

세상 모든 이미지 분류
기계학습의 Overfitting 문제(고차원 데이터 & 훈련 세트 부족) 극복

2012년 ImageNet 국제대회 ILSVRC 개최에서 CNN(Convolutional Neural Network) 도입으로 기존 28.2%, 25%의 오류율을 16.4%로 오차율이 급격히 감소되었다.

Twitter Facebook LinkedIn

JIBIN SONG