Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요. LLM, Vision, Audio 등 다양한 카테고리의 프로젝트를 확인할 수 있습니다.
총 516개의 프로젝트
haotian-liu
GPT-4V 수준의 시각적 지시 조정 멀티모달 AI 모델
nerfstudio-project
CUDA 가속 3D 가우시안 스플래팅 라이브러리 - 메모리 4배 절감, 15% 빠른 학습
Gynjn
CVPR 2026 반복적 정제 기반 대규모 3D 재구성 모델
NVIDIA-NeMo
NVIDIA의 엔터프라이즈급 생성형 AI 프레임워크 - ASR, LLM, TTS 통합
speechbrain
PyTorch 기반 올인원 음성 AI 툴킷 - ASR, TTS, 화자 인식 등 지원
hexgrad
82M 파라미터의 초경량 TTS 모델, 대형 모델 수준의 품질을 Apache 2.0 라이선스로 제공
SparkAudio
Qwen2.5 LLM 기반, 별도 음향 모델 없이 직접 음성을 생성하는 효율적 TTS 시스템
fishaudio
TTS-Arena2 1위, 감정 풍부한 다국어 음성 합성 및 제로샷 음성 복제 모델
collabora
OpenAI Whisper 기반 실시간 음성-텍스트 변환 애플리케이션
tencent-ailab
Tencent AI Lab의 4B 파라미터 상업급 노래 생성 오픈소스 모델
MoonshotAI
오디오 이해/생성/대화를 통합한 Moonshot AI의 오픈소스 오디오 파운데이션 모델
Roots-Automation
VLM 기반 차세대 OCR 툴킷, Qwen2.5-VL 파인튜닝으로 2배 성능 향상