[AI] 인공지능 개념 정리
인공지능의 개념과 트렌드에 대해 알아보자.
1. 인공지능 개요
지도학습
- 어떤 X를 입력하면 정답 y를 출력하여 추론하는 기계학습니다.
- 현재까지 (어쩌면 미래에도) 인공지능 분야에서 가장 많이 사용되는 기계학습 분야이다.
- 단, Label(정답)을 사람이 직접 만들어야한다.
비지도학습
- 주어진 데이터의 내부에 존재하는 특별한 관계, 패턴, 규칙을 학습한다. 정답을 찾는 것이 목적이 아니기 때문에 정답 데이터를 필요로 하지 않는다.
- 특별한 관계? 모델에 따라 다르다!
- ex) 군집분석 - 데이터가 밀집된 좌표를 찾아서 데이터의 그룹 형성
- ex) 차원 축소 - 데이터가 밀집된 축을 찾아서 데이터를 압축
- 생성 AI 분야에 사용된다
- ex) GAN 알고리즘 - 다양한 실제 얼굴 사진을 통해서 내부의 패턴을 학습하여 새로운 사진을 만들어낼 수 있다.
강화학습
- 보상이 큰 행동을 강화하고 보상이 적은 행동은 약화시키는 기계학습이다.
- 목적: 미래에 받에 되는 보상을 고려하여 전체 보상의 합이 최대가 되는 행동을 강화하는 것이 목적이다.
- 과정: Agent는 Environment에 Action을 전달한다. Environment는 Agent에 Reward와 State를 전달한다
강화학습과 지도 학습의 차이점
지도학습 | 강화학습 |
---|---|
사람이 정답을 알아야 학습 가능 | 사람이 정답을 몰라도 학습이 가능 |
단편적인 예측 수행 | 순차적 상황에서 미래를 고려한 예측 수행 |
- 강화학습은 학습이 매우 불안정하고 생각보다 잘 학습이 안된다. 따라서 지도학습으로 해결이 가능하다면 지도학습을 이용하는 것이 좋다.
공짜 점심 없음 이론
- 모델을 돌려보기 전까지 한 모델이 다른모델보다 더 잘 맞을 것이라고 보장할 수 있는 근거가 없다.
- 최근 딥러닝 기반 모델이 많은 각광을 받고 있지만, 상황에 따라서 굉장히 단순한 선형모델이 오히려 더 데이터에 잘 맞을 수 있다. 결국, 어떤 모델이 가장 적합한지 알 수 있는 유일한 방법은 데이터에 잘 맞는 모델을 찾아보며 각각의 모델을 돌려보고 비교해보는 방법밖에는 없다.
2. 딥러닝
인공신경망 (ANN)
생물학적 신경망을 모방하여 만든 모델이다.
- 모방1 - 여러 뉴런들이 다음 뉴런으로 연결되어 신경전달물질이라는 화학적 신호를 전달한다. ⇒ 선형 결합
- 모방2 - 뉴런은 충분한 양의 신경전달물질을 받았을 때 자체적인 신호를 발생시킨다. ⇒ 활성 함수
인공신경망 구조
- 여러 개의 Layer를 쌓아 올린 구조로 되어있다.
- 심층 신경망 - 여러 개의 Layer로 구성된 인공신경망
- 딥러닝 - 심층 신경망을 이용한 머신러닝
- Layer 내부는 여러 개의 유닛의 집합으로 구성된다.
- 이전 Layer의 unit 값들은 선형결합하여 다음 Layer의 unit으로 들어온다.
- 선형결합된 값은 activation을 통해 수정되어 Node의 최종 값이 된다.
딥러닝 이슈
A. 블랙박스
선형 또는 의사결정나무와 같은 모델은 직관적이고 해석이 쉽다.
⇒ 모델을 통해 새로운 통찰력을 얻을 수 있고, 결과가 이상할 경우 그 이유를 분석할 수 있다.
하지만 딥러닝은 수많은 파라미터들이 복잡하게 꼬여있는 탓에 결과 해석이 쉽지 않다.
B. 불안정한 기울기
- 기울기 소실과 폭주
- 모든 파라미터에 대한 오차 함수의 기울기를 계산할 때, 알고리즘이 하위층으로 진행될 수록 기울기가 점점 작아져서 0으로 수렴하거나 커져서 발산하는 경우가 있다.
C. 과적합
- 모델이 주어진 데이터에 지나치게 적합되거나 덜 되어 모델 성능이 저하되는 현상이다.
- 방법
- 규제: Overfitting 되지 않도록 사전에 방지하는 방법, ex_ L1, L2, 드롭아웃 등이 있다.
- 조기종료: 모델이 Overfitting 되기 시작하면 훈련을 종료하는 방법이다. Validation set의 Loss가 커지기 시작하면 훈련을 종료한다.
3. 인공지능 트랜드
CNN (Convolution Neural Network, CNN)
-
CNN은 인공신경망 모델의 한 종류로 사람의 시신경 구조를 모방하여 만들었다.
GAN (Generative Adversarial Network; GAN)
- 비지도 학습에 사용되는 인공지능 알고리즘이다.
- GAN 알고리즘의 원리
- 생성자 모델과 판별자 모델이 서로 경쟁하며 학습한다.
-
생성자는 가짜 이미지를 생성하고, 판별자는 가짜 이미지와 실제 이미지를 판별하면서 훈련한다.
- GAN 알고리즘 사례
- StyleGAN
-
이미지의 style 정보 조절이 가능한 GAN 알고리즘이다.
A Style-Based Generator Architecture for Generative Adversarial Networks
[Gallery of AI Generated Faces Generated.photos](https://generated.photos/faces)
-
- StyleGAN
Attention
- 인간의 주의 집중을 모방하여 중요한 입력 부분을 다시 참고하는 기계학습 기법이다.
-
시퀀스처리(ex_ RNN)에서 Attention 기반으로 바뀌는 추세이며, 컴퓨터 비전에서도 Attention 기반 모델이 확장되어 가고 있다.
- 시퀀스: 순차성이 있는 데이터. ex) 주가데이터, 인간의 언어
- Attention을 기반으로 한 모델
- Transformer 모델
- 자연어 처리에 혁신적인 발전을 이룬 모델.
- GPT, BERT 등이 Transformer를 기반으로한 모델이다.
-
GPT-3와 BERT에 대해 궁금하다면 이전 포스트 참고하기
-
- GitHub Copilot
- GitHub가 2021년 출시한 자동 코드 완성 인공지능이다. 2022년 6월 상업적인 판매가 시작되었다.
- OpenAI의 GPT-3 모델을 이용하여 깃허브의 수많은 레포지토리들을 학습시키는 방식으로 개발되었다.
- DALL-E
- DALL-E, DALL-E 2는 OpenAI가 자연어로부터 디지털 이미지를 생성하기 위해 개발한 기계학습 모델이다.
-
DALL-E는 2021년 1월 공개되었으며, 이미지 생성을 위해 개조된 GPT-3 버전을 사용한다.
- Transformer 모델
댓글남기기