Paper Review

[논문 정리] CoDeF: Content Deformation Fields for Temporally Consistent Video Processing

2023-08-29 6 분 소요

https://arxiv.org/pdf/2308.07926.pdf

[논문 정리] StableVideo: Text-driven Consistency-aware Diffusion Video Editing

2023-08-25 6 분 소요

오늘은 StableVideo 논문을 읽어보고자 한다. 이 논문은 텍스트 기반으로 비디오를 수정하는 분야를 다룬 논문이다. 논문의 목적과, 모델 구조를 중심으로 정리하였다.

[논문 정리] Text Inversion: An Image is Worth One Word: Personalizing Text-to-Image Generation using Textual Inversion

2023-08-22 3 분 소요

[논문 정리] Custom Diffusion: Multi-Concept Customization of Text-to-Image Diffusion

2023-08-07 5 분 소요

https://arxiv.org/pdf/2212.04488.pdf

[논문 리뷰] DreamBooth: Fine Tuning Text-to-Image Diffusion Models for Subject-Driven Generation

2023-07-31 6 분 소요

DreamBooth: https://dreambooth.github.io/ https://arxiv.org/pdf/2208.12242.pdf

[논문 리뷰] DDPM: Denoising Diffusion Probabilistic Models

2023-07-29 9 분 소요

오늘은 Diffusion의 기본 논문인 DDPM 논문을 공부해보고자 한다.

[논문 리뷰] AudioToken: Adaptation of Text-Conditioned Diffusion Models for Audio-to-Image Generation

2023-07-27 1 분 소요

이 논문은 Text를 조건으로한 Diffusion 모델을 Audio-to-Image generation으로 변화시킨 논문이다.

[논문 리뷰] Fate/Zero: Fusing Attentions for Zero-shot Text-based Video Editing

2023-07-20 5 분 소요

https://arxiv.org/pdf/2303.09535.pdf

[논문 리뷰] LDMs: High-Resolution Image Synthesis with Latent Diffusion Models

2023-07-17 3 분 소요

https://arxiv.org/pdf/2112.10752.pdf

[논문 리뷰] MM-Diffusion: Learning Multi-Modal Diffusion Models for joint Audio and Video Generation

2023-07-10 6 분 소요

오늘은 비디오를 생성하는 분야 중 하나인 MM diffusion에 대해서 정리하려고 한다. MM diffusion은 오디오와 비디오를 동시에 생성하는 모델이다. 오디오와 비디오를 어떻게 alignment하여 함께 생성하는지 원리를 알아보자.

[논문 리뷰] AUDIT: Audio Editing by Following Instructions with Latent Diffusion Models

2023-06-01 2 분 소요

오늘은 AUDIT: Audio Editing by Following Instructions with Latent Diffusion Models 라는 논문에 대해 알아볼 것이다.

[논문 리뷰] First-Person Hand Action Benchmark with RGB-D Videos and 3D Hand Pose Annotations

2023-04-04 4 분 소요

오늘은 hand recognition을 위해 데이터셋(FPHA)을 제안하는 논문을 읽어볼 것이다.

[논문 리뷰] Egocentric View Hand Action Recognition by Leveraging Hand Surface and Hand Grasp Type

2023-04-02 6 분 소요

오늘은 hand action recognition을 위해서 Hand Grasp Type을 사용하는 논문을 읽어볼 것이다.

[논문 리뷰] Model soups: averaging weights of multiple fine-tuned models improves accuracy without increasing inference time

2023-03-22 4 분 소요

fine-tuning된 모델의 parameter를 평균낸 single model 방식을 제안하는 Model soups 논문 리뷰를 해보았다.

[논문 리뷰] CoCa: Contrastive Captioners are Image-Text Foundation Models

2023-03-20 4 분 소요

Contrastive learning와 ontrastive learning을 통합한 CoCa 논문 리뷰를 하였다.

[논문 리뷰] CLIP: Learning Transferable Visual Models From Natural Language Supervision

2023-03-10 4 분 소요

이미지와 텍스트의 관계를 학습한 CLIP에 대해 논문 리뷰를 해보았습니다.

[Computer Vision] Object Detection: YOLO v2 & YOLO9000 논문 리뷰

2022-11-15 2 분 소요

Introduction

[Computer Vision] Object Detection: YOLO 논문 리뷰

2022-11-13 1 분 소요

Object Detection이란?