Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
48kHz 풀밴드 오디오를 위한 고급 노이즈 억제 프레임워크입니다. 딥러닝 기반 필터링으로 음성 품질을 유지하면서 배경 소음을 제거합니다. Python 바인딩, 실시간 처리, LADSPA 플러그인, GPU 가속을 지원하며, DeepFilterNet2(임베디드 기기용)와 DeepFilterNet3(지각적 최적화)의 여러 모델 버전을 제공합니다. 화상 회의, 음성 녹음, 보청기, 접근성 기술 등 다양한 실제 응용에 사용됩니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음

nari-labs
초현실적 대화형 음성 생성 1.6B TTS 모델
jamiepine
23개 언어 지원, 다중 TTS 엔진 기반의 로컬 음성 합성 스튜디오