Trending

MOSS-TTS-Nano

OpenMOSSApache-2.02026.06.06

TTS3.4K Stars439 Forks4.8천 조회

MOSI.AI와 OpenMOSS 팀이 공개한 초경량 다국어 음성 합성 모델로, 단 0.1B(1억) 파라미터로 실시간 음성 생성을 제공하면서도 GPU 없이 CPU 환경에서 직접 구동 가능합니다. 네이티브 48kHz 스테레오 출력과 한국어, 영어, 중국어, 독일어, 스페인어, 프랑스어를 포함한 20개 언어를 지원하며, Audio Tokenizer와 LLM을 결합한 순수 자동회귀(Pure AR) 아키텍처를 채택했습니다. 스트리밍 추론으로 초기 오디오 출력 지연이 매우 짧고, 청크 기반 보이스 클로닝으로 장문 텍스트 처리도 안정적입니다. 2026년 4월 공개된 ONNX CPU 버전은 MacBook Air M4 단일 CPU 코어에서 약 2배의 처리 효율을 달성해 로컬 데모, 웹 서빙, 임베디드 제품 통합에 모두 적합한 가벼운 배포 스택을 제공합니다.

주요 특징

0.1B 파라미터의 초경량 다국어 TTS 모델
GPU 없이 CPU 단독 구동 가능한 ONNX 최적화 추론
네이티브 48kHz 스테레오 출력과 20개 언어 지원
Audio Tokenizer + LLM 기반 Pure AR 스트리밍 아키텍처
청크 기반 보이스 클로닝으로 장문 텍스트 안정 처리

Open Source

MOSS-TTS-Nano

주요 특징

태그

관련 프로젝트

Real-Time-Voice-Cloning

GPT-SoVITS

ChatTTS

OpenVoice