Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
LGM(Large Multi-View Gaussian Model)은 ECCV 2024 오럴 발표작으로, 텍스트 또는 단일 이미지로부터 고해상도 3D 콘텐츠를 생성하는 피드포워드 재단 모델입니다. 다중 뷰 가우시안 특성을 효율적인 표현으로 사용하고, 비대칭 U-Net을 고처리량 백본으로 제시합니다. 512 해상도에서 학습되어 5초 이내에 고해상도 3D 객체를 생성하며, 텍스트-3D 및 이미지-3D 생성에서 최첨단 성능을 달성합니다.
graphdeco-inria
실시간 3D 방사장 필드 렌더링의 원본 구현체

Tencent-Hunyuan
텐센트 고해상도 3D 생성

Microsoft
Microsoft의 텍스트/이미지→3D 자산 생성 모델 (CVPR'25)

VAST-AI-Research
단일 이미지에서 0.5초 만에 고품질 3D 객체를 재구성하는 AI 모델