[논문 정리] CoDeF: Content Deformation Fields for Temporally Consistent Video Processing
https://arxiv.org/pdf/2308.07926.pdf
https://arxiv.org/pdf/2308.07926.pdf
오늘은 StableVideo 논문을 읽어보고자 한다. 이 논문은 텍스트 기반으로 비디오를 수정하는 분야를 다룬 논문이다. 논문의 목적과, 모델 구조를 중심으로 정리하였다.
https://arxiv.org/pdf/2212.04488.pdf
DreamBooth: https://dreambooth.github.io/ https://arxiv.org/pdf/2208.12242.pdf
오늘은 Diffusion의 기본 논문인 DDPM 논문을 공부해보고자 한다.
이 논문은 Text를 조건으로한 Diffusion 모델을 Audio-to-Image generation으로 변화시킨 논문이다.
https://arxiv.org/pdf/2303.09535.pdf
https://arxiv.org/pdf/2112.10752.pdf
오늘은 비디오를 생성하는 분야 중 하나인 MM diffusion에 대해서 정리하려고 한다. MM diffusion은 오디오와 비디오를 동시에 생성하는 모델이다. 오디오와 비디오를 어떻게 alignment하여 함께 생성하는지 원리를 알아보자.
오늘은 AUDIT: Audio Editing by Following Instructions with Latent Diffusion Models 라는 논문에 대해 알아볼 것이다.
오늘은 hand recognition을 위해 데이터셋(FPHA)을 제안하는 논문을 읽어볼 것이다.
오늘은 hand action recognition을 위해서 Hand Grasp Type을 사용하는 논문을 읽어볼 것이다.
fine-tuning된 모델의 parameter를 평균낸 single model 방식을 제안하는 Model soups 논문 리뷰를 해보았다.
Contrastive learning와 ontrastive learning을 통합한 CoCa 논문 리뷰를 하였다.
이미지와 텍스트의 관계를 학습한 CLIP에 대해 논문 리뷰를 해보았습니다.
Object Detection이란?