AI Tech

[논문 정리] CoDeF: Content Deformation Fields for Temporally Consistent Video Processing

2023-08-29 6 분 소요

https://arxiv.org/pdf/2308.07926.pdf

[논문 정리] StableVideo: Text-driven Consistency-aware Diffusion Video Editing

2023-08-25 6 분 소요

오늘은 StableVideo 논문을 읽어보고자 한다. 이 논문은 텍스트 기반으로 비디오를 수정하는 분야를 다룬 논문이다. 논문의 목적과, 모델 구조를 중심으로 정리하였다.

[논문 정리] Text Inversion: An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion

2023-08-22 3 분 소요

[논문 정리] Custom Diffusion: Multi-Concept Customization of Text-to-Image Diffusion

2023-08-07 5 분 소요

https://arxiv.org/pdf/2212.04488.pdf

[논문 리뷰] DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation

2023-07-31 6 분 소요

DreamBooth: https://dreambooth.github.io/ https://arxiv.org/pdf/2208.12242.pdf

[논문 리뷰] DDPM: Denoising Diffusion Probabilistic Models

2023-07-29 9 분 소요

오늘은 Diffusion의 기본 논문인 DDPM 논문을 공부해보고자 한다.

[논문 리뷰] AudioToken: Adaptation of Text-Conditioned Diffusion Models for Audio-to-Image Generation

2023-07-27 1 분 소요

이 논문은 Text를 조건으로한 Diffusion 모델을 Audio-to-Image generation으로 변화시킨 논문이다.

[논문 리뷰] Fate/Zero: Fusing Attentions for Zero-shot Text-based Video Editing

2023-07-20 5 분 소요

https://arxiv.org/pdf/2303.09535.pdf

[논문 리뷰] LDMs: High-Resolution Image Synthesis with Latent Diffusion Models

2023-07-17 3 분 소요

https://arxiv.org/pdf/2112.10752.pdf

[논문 리뷰] MM-Diffusion: Learning Multi-Modal Diffusion Models for joint Audio and Video Generation

2023-07-10 6 분 소요

오늘은 비디오를 생성하는 분야 중 하나인 MM diffusion에 대해서 정리하려고 한다. MM diffusion은 오디오와 비디오를 동시에 생성하는 모델이다. 오디오와 비디오를 어떻게 alignment하여 함께 생성하는지 원리를 알아보자.

[논문 리뷰] AUDIT: Audio Editing by Following Instructions with Latent Diffusion Models

2023-06-01 2 분 소요

오늘은 AUDIT: Audio Editing by Following Instructions with Latent Diffusion Models 라는 논문에 대해 알아볼 것이다.

[파이토치 딥러닝] 2단계: 입문용 신경망 3총사 CNN, ResNet, RNN

2023-05-05 10 분 소요

[파이토치 딥러닝] 1단계: 딥러닝 입문하기

2023-05-01 8 분 소요

[논문 리뷰] First-Person Hand Action Benchmark with RGB-D Videos and 3D Hand Pose Annotations

2023-04-04 4 분 소요

오늘은 hand recognition을 위해 데이터셋(FPHA)을 제안하는 논문을 읽어볼 것이다.

[논문 리뷰] Egocentric View Hand Action Recognition by Leveraging Hand Surface and Hand Grasp Type

2023-04-02 6 분 소요

오늘은 hand action recognition을 위해서 Hand Grasp Type을 사용하는 논문을 읽어볼 것이다.

[MRC] Extraction-based MRC

2023-03-25 3 분 소요

지난 포스트에서 MRC의 개념과 종류, 평가방법에 대해서 다뤄봤다. 이번 포스트에서는 질문과 답변이 주어진 지문 내에 존재하는 Extraction-based MRC에 대해 자세히 알아볼 것이다.

[MRC] 한국어 MRC 데이터셋 - KorQuAD Dataset

2023-03-24 1 분 소요

전 세계 모든 문자를 다룰 수 있는 Unicode와 텍스트를 토큰 단위로 나누는 Tokenization에 대해 알아보자.

[MRC] Unicode & Tokenization

2023-03-23 2 분 소요

전 세계 모든 문자를 다룰 수 있는 Unicode와 텍스트를 토큰 단위로 나누는 Tokenization에 대해 알아보자.

[MRC] MRC(Machine Reading Comprehension) Introduction

2023-03-23 1 분 소요

주어진 지문을 이해하고 주어진 질의의 답변을 추론하는 기계독해(MRC)와 MRC의 종류, MRC의 평가방법에 대해 알아보자.

[논문 리뷰] Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time

2023-03-22 4 분 소요

fine-tuning된 모델의 parameter를 평균낸 single model 방식을 제안하는 Model soups 논문 리뷰를 해보았다.

[논문 리뷰] CoCa: Contrastive Captioners are Image-Text Foundation Models

2023-03-20 4 분 소요

Contrastive learning와 ontrastive learning을 통합한 CoCa 논문 리뷰를 하였다.

[Hands-On ML] 11장 심층 신경망 훈련하기(6) - 규제 (L1, L2, dropout, max-norm)

2023-03-15 최대 1 분 소요

11.4 규제를 사용해 과대적합 피하기

[논문 리뷰] CLIP: Learning Transferable Visual Models From Natural Language Supervision

2023-03-10 4 분 소요

이미지와 텍스트의 관계를 학습한 CLIP에 대해 논문 리뷰를 해보았습니다.

[Hands-On ML] 11장 심층 신경망 훈련하기(4) - 학습률 스케줄링

2023-03-06 2 분 소요

11.3.6 학습률 스케줄링

[Hands-On ML] 11장 심층 신경망 훈련하기(4) - 고속 옵티마이저

2023-02-23 2 분 소요

지금까지 훈련 속도를 높이는 네 가지 방법을 보았다.

[캐글 리팩터링] 04 데이터를 한눈에 - 주요 시각화 그래프

2023-02-20 6 분 소요

데이터를 이해하기 위한 다양한 시각화 기법의 개념, 효과 구현 방법 등에 대해 알아보자

[캐글 리팩터링] 03 문제해결 프로세스 및 체크리스트

2023-02-20 2 분 소요

머신러닝, 딥러닝 문제를 해결하기 위한 프로세스를 정리하였다.

[Hands-On ML] 11장 심층 신경망 훈련하기(3) - 전이 학습

2023-02-19 3 분 소요

“핸즈온 머신러닝”의 “11장 심층 신경망 훈련하기” 파트를 읽고 공부한 내용을 정리해보았다. 사전훈련된 층을 재사용하는 전이 학습에 대해 다뤄볼 것이다.

[Amazon] AWS Deepracer(3) - Reward Function, Log Analysis

2023-02-16 4 분 소요

이 포스트는 AWS Deepracer 강의를 바탕으로 공부한 내용을 정리하였습니다.

[Amazon] AWS Deepracer(2) - Python for Deepracer

2023-02-16 1 분 소요

이 포스트는 AWS Deepracer 강의를 바탕으로 공부한 내용을 정리하였습니다.

[RL] 강화학습 개념 정리

2023-02-15 2 분 소요

강화학습의 개념에 대해 간단히 정리해보았다. 강화학습이 무엇인지 살펴보자.

[Amazon] AWS Deepracer(1) - AWS Deepracer Overview

2023-02-15 2 분 소요

이 포스트는 AWS Deepracer 강의를 바탕으로 공부한 내용을 정리하였습니다.

[AI] 인공지능 개념 정리

2023-02-15 3 분 소요

인공지능의 개념과 트렌드에 대해 알아보자.

[캐글 리팩터링] 02 캐글 정복 첫걸음

2023-02-14 2 분 소요

“Must Have 머신러닝 딥러닝 문제해결 전략”을 읽고 배운 내용을 정리해보았다. 캐글 가입부터 결과 제출까지 전체 프로세스를 배워보자

[캐글 리팩터링] 01 왜 캐글인가?

2023-02-14 2 분 소요

“Must Have 머신러닝 딥러닝 문제해결 전략”을 읽고 배운 내용을 정리해보았다. 캐글 입문하기 위해 필요한 정보를 알아보자

[Hands-On ML] 11장 심층 신경망 훈련하기(2) - 배치 정규화 & 그레디언트 클리핑

2023-02-12 3 분 소요

“핸즈온 머신러닝”의 “11장 심층 신경망 훈련하기” 파트를 읽고 공부한 내용을 정리해보았다. 그레디언트 소실과 폭주 문제 해결 방법인 배치 정규화와 그레디언트 클리핑에 대해 다뤄볼 것이다.

[ML] 머신러닝 기본 개념

2023-02-06 2 분 소요

머신러닝의 개념에 대해 간단히 복습을 하기 위해 작성하였다.

[Hands-On ML] 11장 심층 신경망 훈련하기(1) - 그레디언트 소실 & ReLU

2023-02-04 3 분 소요

“핸즈온 머신러닝”의 “11장 심층 신경망 훈련하기” 파트를 읽고 공부한 내용을 정리해보았다. 그레디언트 소실과 ReLU 활성화 함수에 대해 다뤄볼 것이다.

[딥러닝을 이용한 자연어 처리] 04 문서 유사도 및 언어 모델

2023-01-31 7 분 소요

04 문서 유사도 및 언어 모델

[GPT] 무엇이든 가능한 챗GPT

2023-01-30 2 분 소요

챗GPT란?

[딥러닝을 이용한 자연어 처리] 03 한국어 자연어 처리 및 문장 유사도

2023-01-30 9 분 소요

03 한국어 자연어 처리 및 문장 유사도

[Hands-On ML] 10장 케라스를 사용한 인공 신경망 소개(3)

2023-01-29 3 분 소요

“핸즈온 머신러닝”의 “10장 케라스를 사용한 인공신경망 소개” 파트를 읽고 공부한 내용을 정리해보았다. 신경망 하이퍼파라미터를 조정하는 방법을 다뤄볼 것이다.

[BERT] BERT 기본개념

2023-01-22 2 분 소요

BERT의 기본 개념에 대해서 알아보자

[Hands-On ML] 10장 케라스를 사용한 인공 신경망 소개(2)

2023-01-22 11 분 소요

“핸즈온 머신러닝”의 “10장 케라스를 사용한 인공신경망 소개” 파트를 읽고 공부한 내용을 정리해보았다. 케라스로 다층 퍼셉트론을 구현하는 방법을 다뤄볼 것이다.

[Hands-On ML] 10장 케라스를 사용한 인공 신경망 소개(1)

2023-01-15 2 분 소요

“핸즈온 머신러닝”의 “10장 케라스를 사용한 인공신경망 소개” 파트를 읽고 공부한 내용을 정리해보았다.

[딥러닝을 이용한 자연어 처리] 02 감정 분석 서비스

2022-12-20 1 분 소요

02 감정 분석 서비스

[딥러닝을 이용한 자연어 처리] 01 텍스트 전처리 및 단어 임베딩

2022-12-20 2 분 소요

01 텍스트 전처리 및 단어 임베딩

[Computer Vision] Object Detection: YOLO v2 & YOLO9000 논문 리뷰

2022-11-15 2 분 소요

Introduction

[Computer Vision] Object Detection: YOLO 논문 리뷰

2022-11-13 1 분 소요

Object Detection이란?

[Computer Vision] 11. Detection and Segmentation

2022-11-06 2 분 소요

스탠포드대학에서 발표한 CNN 강의 영상을 듣고 자료를 정리했습니다.

[Computer Vision] 9. CNN Architectures

2022-10-17 1 분 소요

스탠포드대학에서 발표한 CNN 강의 영상을 듣고 자료를 정리했습니다.

[Computer Vision] 5. Convolutional Neural Networks

2022-10-15 최대 1 분 소요

스탠포드대학에서 발표한 CNN 강의 영상을 듣고 자료를 정리했습니다. Lecture 5 | Convolutional Neural Networks

[Computer Vision] 4. Introduction to Neural Networks

2022-10-10 최대 1 분 소요

스탠포드대학에서 발표한 CNN 강의 영상을 듣고 자료를 정리했습니다. Lecture 4 | Introduction to Neural Networks

[Computer Vision] 3. Loss Functions and Optimization

2022-10-08 2 분 소요

스탠포드대학에서 발표한 CNN 강의 영상을 듣고 자료를 정리했습니다.

[Computer Vision] 2. Image Classification

2022-10-03 1 분 소요

스탠포드대학에서 발표한 CNN 강의 영상을 듣고 자료를 정리했습니다.

[Computer Vision] 1. Introduction to Convolutional Neural Networks for Visual Recognition

2022-10-01 1 분 소요

스탠포드대학에서 발표한 CNN 강의 영상을 듣고 자료를 정리했습니다.

맨 위로 이동 ↑

Computer Vision

[논문 정리] CoDeF: Content Deformation Fields for Temporally Consistent Video Processing

2023-08-29 6 분 소요

https://arxiv.org/pdf/2308.07926.pdf

[논문 정리] StableVideo: Text-driven Consistency-aware Diffusion Video Editing

2023-08-25 6 분 소요

[논문 정리] Text Inversion: An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion

2023-08-22 3 분 소요

[논문 정리] Custom Diffusion: Multi-Concept Customization of Text-to-Image Diffusion

2023-08-07 5 분 소요

https://arxiv.org/pdf/2212.04488.pdf

[논문 리뷰] DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation

2023-07-31 6 분 소요

DreamBooth: https://dreambooth.github.io/ https://arxiv.org/pdf/2208.12242.pdf

[논문 리뷰] DDPM: Denoising Diffusion Probabilistic Models

2023-07-29 9 분 소요

오늘은 Diffusion의 기본 논문인 DDPM 논문을 공부해보고자 한다.

[논문 리뷰] AudioToken: Adaptation of Text-Conditioned Diffusion Models for Audio-to-Image Generation

2023-07-27 1 분 소요

이 논문은 Text를 조건으로한 Diffusion 모델을 Audio-to-Image generation으로 변화시킨 논문이다.

[논문 리뷰] Fate/Zero: Fusing Attentions for Zero-shot Text-based Video Editing

2023-07-20 5 분 소요

https://arxiv.org/pdf/2303.09535.pdf

[논문 리뷰] LDMs: High-Resolution Image Synthesis with Latent Diffusion Models

2023-07-17 3 분 소요

https://arxiv.org/pdf/2112.10752.pdf

[논문 리뷰] MM-Diffusion: Learning Multi-Modal Diffusion Models for joint Audio and Video Generation

2023-07-10 6 분 소요

[논문 리뷰] AUDIT: Audio Editing by Following Instructions with Latent Diffusion Models

2023-06-01 2 분 소요

오늘은 AUDIT: Audio Editing by Following Instructions with Latent Diffusion Models 라는 논문에 대해 알아볼 것이다.

[파이토치 딥러닝] 2단계: 입문용 신경망 3총사 CNN, ResNet, RNN

2023-05-05 10 분 소요

[논문 리뷰] First-Person Hand Action Benchmark with RGB-D Videos and 3D Hand Pose Annotations

2023-04-04 4 분 소요

오늘은 hand recognition을 위해 데이터셋(FPHA)을 제안하는 논문을 읽어볼 것이다.

[논문 리뷰] Egocentric View Hand Action Recognition by Leveraging Hand Surface and Hand Grasp Type

2023-04-02 6 분 소요

오늘은 hand action recognition을 위해서 Hand Grasp Type을 사용하는 논문을 읽어볼 것이다.

[논문 리뷰] Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time

2023-03-22 4 분 소요

fine-tuning된 모델의 parameter를 평균낸 single model 방식을 제안하는 Model soups 논문 리뷰를 해보았다.

[논문 리뷰] CoCa: Contrastive Captioners are Image-Text Foundation Models

2023-03-20 4 분 소요

Contrastive learning와 ontrastive learning을 통합한 CoCa 논문 리뷰를 하였다.

[논문 리뷰] CLIP: Learning Transferable Visual Models From Natural Language Supervision

2023-03-10 4 분 소요

이미지와 텍스트의 관계를 학습한 CLIP에 대해 논문 리뷰를 해보았습니다.

[Computer Vision] Object Detection: YOLO v2 & YOLO9000 논문 리뷰

2022-11-15 2 분 소요

Introduction

[Computer Vision] Object Detection: YOLO 논문 리뷰

2022-11-13 1 분 소요

Object Detection이란?

[Computer Vision] 11. Detection and Segmentation

2022-11-06 2 분 소요

스탠포드대학에서 발표한 CNN 강의 영상을 듣고 자료를 정리했습니다.

[Computer Vision] 9. CNN Architectures

2022-10-17 1 분 소요

스탠포드대학에서 발표한 CNN 강의 영상을 듣고 자료를 정리했습니다.

[Computer Vision] 5. Convolutional Neural Networks

2022-10-15 최대 1 분 소요

스탠포드대학에서 발표한 CNN 강의 영상을 듣고 자료를 정리했습니다. Lecture 5 | Convolutional Neural Networks

[Computer Vision] 4. Introduction to Neural Networks

2022-10-10 최대 1 분 소요

스탠포드대학에서 발표한 CNN 강의 영상을 듣고 자료를 정리했습니다. Lecture 4 | Introduction to Neural Networks

[Computer Vision] 3. Loss Functions and Optimization

2022-10-08 2 분 소요

스탠포드대학에서 발표한 CNN 강의 영상을 듣고 자료를 정리했습니다.

[Computer Vision] 2. Image Classification

2022-10-03 1 분 소요

스탠포드대학에서 발표한 CNN 강의 영상을 듣고 자료를 정리했습니다.

[Computer Vision] 1. Introduction to Convolutional Neural Networks for Visual Recognition

2022-10-01 1 분 소요

스탠포드대학에서 발표한 CNN 강의 영상을 듣고 자료를 정리했습니다.

맨 위로 이동 ↑

Paper Review

[논문 정리] CoDeF: Content Deformation Fields for Temporally Consistent Video Processing

2023-08-29 6 분 소요

https://arxiv.org/pdf/2308.07926.pdf

[논문 정리] StableVideo: Text-driven Consistency-aware Diffusion Video Editing

2023-08-25 6 분 소요

[논문 정리] Text Inversion: An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion

2023-08-22 3 분 소요

[논문 정리] Custom Diffusion: Multi-Concept Customization of Text-to-Image Diffusion

2023-08-07 5 분 소요

https://arxiv.org/pdf/2212.04488.pdf

[논문 리뷰] DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation

2023-07-31 6 분 소요

DreamBooth: https://dreambooth.github.io/ https://arxiv.org/pdf/2208.12242.pdf

[논문 리뷰] DDPM: Denoising Diffusion Probabilistic Models

2023-07-29 9 분 소요

오늘은 Diffusion의 기본 논문인 DDPM 논문을 공부해보고자 한다.

[논문 리뷰] AudioToken: Adaptation of Text-Conditioned Diffusion Models for Audio-to-Image Generation

2023-07-27 1 분 소요

이 논문은 Text를 조건으로한 Diffusion 모델을 Audio-to-Image generation으로 변화시킨 논문이다.

[논문 리뷰] Fate/Zero: Fusing Attentions for Zero-shot Text-based Video Editing

2023-07-20 5 분 소요

https://arxiv.org/pdf/2303.09535.pdf

[논문 리뷰] LDMs: High-Resolution Image Synthesis with Latent Diffusion Models

2023-07-17 3 분 소요

https://arxiv.org/pdf/2112.10752.pdf

[논문 리뷰] MM-Diffusion: Learning Multi-Modal Diffusion Models for joint Audio and Video Generation

2023-07-10 6 분 소요

[논문 리뷰] AUDIT: Audio Editing by Following Instructions with Latent Diffusion Models

2023-06-01 2 분 소요

오늘은 AUDIT: Audio Editing by Following Instructions with Latent Diffusion Models 라는 논문에 대해 알아볼 것이다.

[논문 리뷰] First-Person Hand Action Benchmark with RGB-D Videos and 3D Hand Pose Annotations

2023-04-04 4 분 소요

오늘은 hand recognition을 위해 데이터셋(FPHA)을 제안하는 논문을 읽어볼 것이다.

[논문 리뷰] Egocentric View Hand Action Recognition by Leveraging Hand Surface and Hand Grasp Type

2023-04-02 6 분 소요

오늘은 hand action recognition을 위해서 Hand Grasp Type을 사용하는 논문을 읽어볼 것이다.

[논문 리뷰] Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time

2023-03-22 4 분 소요

fine-tuning된 모델의 parameter를 평균낸 single model 방식을 제안하는 Model soups 논문 리뷰를 해보았다.

[논문 리뷰] CoCa: Contrastive Captioners are Image-Text Foundation Models

2023-03-20 4 분 소요

Contrastive learning와 ontrastive learning을 통합한 CoCa 논문 리뷰를 하였다.

[논문 리뷰] CLIP: Learning Transferable Visual Models From Natural Language Supervision

2023-03-10 4 분 소요

이미지와 텍스트의 관계를 학습한 CLIP에 대해 논문 리뷰를 해보았습니다.

[Computer Vision] Object Detection: YOLO v2 & YOLO9000 논문 리뷰

2022-11-15 2 분 소요

Introduction

[Computer Vision] Object Detection: YOLO 논문 리뷰

2022-11-13 1 분 소요

Object Detection이란?

맨 위로 이동 ↑

Project

[GDSC] 지도에 지역 정보 표시하기 & 좌표 <-> 주소 변환하기

2023-02-18 2 분 소요

folium 라이브러리를 이용해서 지도에 지역 정보를 표시해보고, 지오코드 라이브러리를 이용해서 좌표와 주소를 변환해보자

[Solux] Politics News Portal UI 제작

2023-02-01 4 분 소요

프로젝트 ‘정치적 편향도를 제공하는 뉴스 포털’ UI 제작 과정을 담아보았다. 구성 개요

맨 위로 이동 ↑

ML (Others)

[AI] 인공지능 개념 정리

2023-02-15 3 분 소요

인공지능의 개념과 트렌드에 대해 알아보자.

[ML] 머신러닝 기본 개념

2023-02-06 2 분 소요

머신러닝의 개념에 대해 간단히 복습을 하기 위해 작성하였다.

맨 위로 이동 ↑

ETC

[ETC] 첫 포스팅입니다.

2023-01-13 최대 1 분 소요

안녕하세요, 첫 포스팅입니다.

맨 위로 이동 ↑

Web

[Solux] Politics News Portal UI 제작

2023-02-01 4 분 소요

프로젝트 ‘정치적 편향도를 제공하는 뉴스 포털’ UI 제작 과정을 담아보았다. 구성 개요

맨 위로 이동 ↑

Front-End

[Solux] Politics News Portal UI 제작

2023-02-01 4 분 소요

프로젝트 ‘정치적 편향도를 제공하는 뉴스 포털’ UI 제작 과정을 담아보았다. 구성 개요

맨 위로 이동 ↑

DL (Others)

[파이토치 딥러닝] 1단계: 딥러닝 입문하기

2023-05-01 8 분 소요

맨 위로 이동 ↑

Category

AI Tech

Computer Vision

Paper Review

My Log

Research & Development Log

Computer Science

Algorithm