3 분 소요

인공지능의 개념과 트렌드에 대해 알아보자.

1. 인공지능 개요

지도학습

  • 어떤 X를 입력하면 정답 y를 출력하여 추론하는 기계학습니다.
  • 현재까지 (어쩌면 미래에도) 인공지능 분야에서 가장 많이 사용되는 기계학습 분야이다.
  • 단, Label(정답)을 사람이 직접 만들어야한다.

비지도학습

  • 주어진 데이터의 내부에 존재하는 특별한 관계, 패턴, 규칙을 학습한다. 정답을 찾는 것이 목적이 아니기 때문에 정답 데이터를 필요로 하지 않는다.
  • 특별한 관계? 모델에 따라 다르다!
    • ex) 군집분석 - 데이터가 밀집된 좌표를 찾아서 데이터의 그룹 형성
    • ex) 차원 축소 - 데이터가 밀집된 축을 찾아서 데이터를 압축
  • 생성 AI 분야에 사용된다
    • ex) GAN 알고리즘 - 다양한 실제 얼굴 사진을 통해서 내부의 패턴을 학습하여 새로운 사진을 만들어낼 수 있다.

강화학습

image

  • 보상이 큰 행동을 강화하고 보상이 적은 행동은 약화시키는 기계학습이다.
  • 목적: 미래에 받에 되는 보상을 고려하여 전체 보상의 합이 최대가 되는 행동을 강화하는 것이 목적이다.
  • 과정: Agent는 Environment에 Action을 전달한다. Environment는 Agent에 Reward와 State를 전달한다

강화학습과 지도 학습의 차이점

지도학습 강화학습
사람이 정답을 알아야 학습 가능 사람이 정답을 몰라도 학습이 가능
단편적인 예측 수행 순차적 상황에서 미래를 고려한 예측 수행
  • 강화학습은 학습이 매우 불안정하고 생각보다 잘 학습이 안된다. 따라서 지도학습으로 해결이 가능하다면 지도학습을 이용하는 것이 좋다.

공짜 점심 없음 이론

  • 모델을 돌려보기 전까지 한 모델이 다른모델보다 더 잘 맞을 것이라고 보장할 수 있는 근거가 없다.
  • 최근 딥러닝 기반 모델이 많은 각광을 받고 있지만, 상황에 따라서 굉장히 단순한 선형모델이 오히려 더 데이터에 잘 맞을 수 있다. 결국, 어떤 모델이 가장 적합한지 알 수 있는 유일한 방법은 데이터에 잘 맞는 모델을 찾아보며 각각의 모델을 돌려보고 비교해보는 방법밖에는 없다.

2. 딥러닝

인공신경망 (ANN)

생물학적 신경망을 모방하여 만든 모델이다.

  • 모방1 - 여러 뉴런들이 다음 뉴런으로 연결되어 신경전달물질이라는 화학적 신호를 전달한다. ⇒ 선형 결합
  • 모방2 - 뉴런은 충분한 양의 신경전달물질을 받았을 때 자체적인 신호를 발생시킨다. ⇒ 활성 함수

인공신경망 구조

  • 여러 개의 Layer를 쌓아 올린 구조로 되어있다.
    • 심층 신경망 - 여러 개의 Layer로 구성된 인공신경망
    • 딥러닝 - 심층 신경망을 이용한 머신러닝
  • Layer 내부는 여러 개의 유닛의 집합으로 구성된다.
  • 이전 Layer의 unit 값들은 선형결합하여 다음 Layer의 unit으로 들어온다.
  • 선형결합된 값은 activation을 통해 수정되어 Node의 최종 값이 된다.

딥러닝 이슈

A. 블랙박스

선형 또는 의사결정나무와 같은 모델은 직관적이고 해석이 쉽다.

⇒ 모델을 통해 새로운 통찰력을 얻을 수 있고, 결과가 이상할 경우 그 이유를 분석할 수 있다.

하지만 딥러닝은 수많은 파라미터들이 복잡하게 꼬여있는 탓에 결과 해석이 쉽지 않다.

B. 불안정한 기울기

  • 기울기 소실과 폭주
    • 모든 파라미터에 대한 오차 함수의 기울기를 계산할 때, 알고리즘이 하위층으로 진행될 수록 기울기가 점점 작아져서 0으로 수렴하거나 커져서 발산하는 경우가 있다.

C. 과적합

  • 모델이 주어진 데이터에 지나치게 적합되거나 덜 되어 모델 성능이 저하되는 현상이다.
  • 방법
    • 규제: Overfitting 되지 않도록 사전에 방지하는 방법, ex_ L1, L2, 드롭아웃 등이 있다.
    • 조기종료: 모델이 Overfitting 되기 시작하면 훈련을 종료하는 방법이다. Validation set의 Loss가 커지기 시작하면 훈련을 종료한다.

3. 인공지능 트랜드

CNN (Convolution Neural Network, CNN)

  • CNN은 인공신경망 모델의 한 종류로 사람의 시신경 구조를 모방하여 만들었다.

    image

GAN (Generative Adversarial Network; GAN)

  • 비지도 학습에 사용되는 인공지능 알고리즘이다.
  • GAN 알고리즘의 원리
    • 생성자 모델과 판별자 모델이 서로 경쟁하며 학습한다.
    • 생성자는 가짜 이미지를 생성하고, 판별자는 가짜 이미지와 실제 이미지를 판별하면서 훈련한다.

      image

  • GAN 알고리즘 사례

Attention

  • 인간의 주의 집중을 모방하여 중요한 입력 부분을 다시 참고하는 기계학습 기법이다.
  • 시퀀스처리(ex_ RNN)에서 Attention 기반으로 바뀌는 추세이며, 컴퓨터 비전에서도 Attention 기반 모델이 확장되어 가고 있다.

    image

    • 시퀀스: 순차성이 있는 데이터. ex) 주가데이터, 인간의 언어
  • Attention을 기반으로 한 모델
    • Transformer 모델
    • GitHub Copilot
      • GitHub가 2021년 출시한 자동 코드 완성 인공지능이다. 2022년 6월 상업적인 판매가 시작되었다.
      • OpenAI의 GPT-3 모델을 이용하여 깃허브의 수많은 레포지토리들을 학습시키는 방식으로 개발되었다.
    • DALL-E
      • DALL-E, DALL-E 2는 OpenAI가 자연어로부터 디지털 이미지를 생성하기 위해 개발한 기계학습 모델이다.
      • DALL-E는 2021년 1월 공개되었으며, 이미지 생성을 위해 개조된 GPT-3 버전을 사용한다.

        image

        DALL·E: Creating Images from Text

댓글남기기