Trending

Descript Audio Codec

descriptincMIT2026.06.05

Audio1.8K Stars180 Forks4.9천 조회

Descript Audio Codec(DAC)는 Descript에서 개발한 최첨단 신경망 기반 오디오 코덱으로, 44.1kHz 오디오를 단 8kbps의 낮은 비트레이트로 약 90배 압축하면서도 원본에 가까운 고음질을 유지합니다. 음성, 환경음, 음악 등 모든 오디오 도메인에 대해 도메인 특화 학습 없이 작동하며, 16kHz, 24kHz, 44.1kHz 샘플링 레이트를 네이티브로 지원합니다. AudioLM, MusicGen, VALL-E 등 최신 오디오 언어 모델의 토크나이저로 활용 가능한 드롭인 대체재로, 개선된 RVQGAN(Residual Vector Quantization GAN) 아키텍처를 기반으로 고충실도 재구성을 제공합니다.

주요 특징

44.1kHz 오디오 90배 압축 (8kbps 비트레이트)
음성, 환경음, 음악 등 범용 오디오 도메인 지원
16kHz, 24kHz, 44.1kHz 멀티 샘플링 레이트 네이티브 지원
AudioLM, MusicGen용 EnCodec 대체 가능한 드롭인 코덱
개선된 RVQGAN 기반 고충실도 재구성 아키텍처

Open Source

Descript Audio Codec

주요 특징

태그

관련 프로젝트

Whisper

Coqui TTS

Bark

Retrieval-based Voice Conversion WebUI (RVC)