Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
MOSI.AI와 OpenMOSS 팀이 공개한 초경량 다국어 음성 합성 모델로, 단 0.1B(1억) 파라미터로 실시간 음성 생성을 제공하면서도 GPU 없이 CPU 환경에서 직접 구동 가능합니다. 네이티브 48kHz 스테레오 출력과 한국어, 영어, 중국어, 독일어, 스페인어, 프랑스어를 포함한 20개 언어를 지원하며, Audio Tokenizer와 LLM을 결합한 순수 자동회귀(Pure AR) 아키텍처를 채택했습니다. 스트리밍 추론으로 초기 오디오 출력 지연이 매우 짧고, 청크 기반 보이스 클로닝으로 장문 텍스트 처리도 안정적입니다. 2026년 4월 공개된 ONNX CPU 버전은 MacBook Air M4 단일 CPU 코어에서 약 2배의 처리 효율을 달성해 로컬 데모, 웹 서빙, 임베디드 제품 통합에 모두 적합한 가벼운 배포 스택을 제공합니다.
CorentinJ
5초 음성으로 즉시 목소리 복제 가능한 실시간 TTS 시스템
RVC-Boss
1분 음성으로 고품질 TTS 모델 훈련 가능한 음성 변환 웹UI
2noise
대화형 AI를 위한 자연스러운 음성 생성, 중영 이중언어 지원
myshell-ai
제로샷 크로스링귀얼 목소리 복제 기술로 정확한 톤 컬러 재현