Trending

MLX Audio

BlaizzyMIT2026.02.08

Audio5.8K Stars422 Forks7.3천 조회

MLX Audio는 Apple MLX 프레임워크 기반의 TTS/STT/STS 통합 라이브러리입니다. Apple Silicon에서 최적화된 성능으로 음성 합성(TTS 8개 모델), 음성 인식(STT 6개 모델), 음성 변환(STS)을 지원합니다. Kokoro, Qwen3-TTS, Whisper, Parakeet 등 주요 모델을 포함하며, 3-bit~8-bit 양자화로 메모리 효율을 극대화합니다. OpenAI 호환 REST API와 3D 시각화 웹 인터페이스, Swift 패키지로 iOS/macOS 네이티브 통합이 가능합니다.

주요 특징

TTS 8개 모델 (Kokoro, Qwen3-TTS, CSM, Dia 등)
STT 6개 모델 (Whisper, Qwen3-ASR, Parakeet, Voxtral 등)
3-bit~8-bit 양자화 지원으로 메모리 효율 극대화
OpenAI 호환 REST API + 3D 시각화 웹 인터페이스
Swift 패키지로 iOS/macOS 네이티브 통합

Open Source

MLX Audio

주요 특징

태그

관련 프로젝트

Whisper

Coqui TTS

Bark

Retrieval-based Voice Conversion WebUI (RVC)