[논문 리뷰] LDMs: High-Resolution Image Synthesis with Latent Diffusion Models
https://arxiv.org/pdf/2112.10752.pdf
https://arxiv.org/pdf/2112.10752.pdf
오늘은 비디오를 생성하는 분야 중 하나인 MM diffusion에 대해서 정리하려고 한다. MM diffusion은 오디오와 비디오를 동시에 생성하는 모델이다. 오디오와 비디오를 어떻게 alignment하여 함께 생성하는지 원리를 알아보자.
오늘은 AUDIT: Audio Editing by Following Instructions with Latent Diffusion Models 라는 논문에 대해 알아볼 것이다.