Trending

Wan 2.1

Wan-VideoApache-2.02026.05.20

Vision16.1K Stars2.7K Forks5.0천 조회

Wan-Video 팀이 공개한 오픈소스 대규모 비디오 생성 파운데이션 모델 모음입니다. 텍스트→비디오(T2V), 이미지→비디오(I2V), 비디오 편집(VACE), 텍스트→이미지(T2I), 비디오→오디오(V2A) 등 거의 모든 영상 생성 워크플로우를 단일 코드베이스에서 다룹니다. 새로 설계된 3D VAE(Wan-VAE)와 Flow Matching 기반 디퓨전 트랜스포머를 사용하며, 1.3B 모델은 8.19GB VRAM만으로 RTX 4090에서 약 4분만에 5초 480p 영상을 생성할 수 있어 소비자 GPU 환경에서도 활용 가능합니다. 또한 중국어와 영어 텍스트를 영상 안에 직접 렌더링할 수 있는 최초의 오픈소스 비디오 모델이며, Diffusers와 ComfyUI에 통합되어 있습니다.

주요 특징

텍스트→비디오, 이미지→비디오, 비디오 편집(VACE) 통합 지원
Wan-VAE 3D VAE와 Flow Matching 디퓨전 트랜스포머
1.3B 모델 8.19GB VRAM, RTX 4090에서 5초 480p 4분
중국어/영어 텍스트 렌더링 가능 (오픈소스 최초)
Diffusers·ComfyUI 통합, FSDP+xDiT 멀티 GPU 추론

Open Source

Wan 2.1

주요 특징

태그

관련 프로젝트

ComfyUI

Deep-Live-Cam

MinerU

Ultralytics YOLO26