Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Resemble Enhance는 AI 기반 음성 디노이징 및 향상 도구입니다. 잡음이 섞인 오디오에서 음성을 깨끗하게 분리하는 디노이저와, 분리된 음성의 품질을 한층 더 높이는 인핸서 두 가지 모듈로 구성되어 있습니다. 저품질 녹음, 배경 소음이 있는 환경에서 녹음된 음성을 스튜디오급 품질로 변환할 수 있으며, 실시간에 가까운 처리 속도를 제공합니다. 팟캐스트 후처리, 화상회의 음질 개선, TTS 학습 데이터 정제 등 다양한 분야에서 활용됩니다. MIT 라이선스로 상업적 사용이 자유롭습니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음

nari-labs
초현실적 대화형 음성 생성 1.6B TTS 모델
jamiepine
23개 언어 지원, 다중 TTS 엔진 기반의 로컬 음성 합성 스튜디오