Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
Resemble Enhance는 AI 기반 음성 디노이징 및 향상 도구입니다. 잡음이 섞인 오디오에서 음성을 깨끗하게 분리하는 디노이저와, 분리된 음성의 품질을 한층 더 높이는 인핸서 두 가지 모듈로 구성되어 있습니다. 저품질 녹음, 배경 소음이 있는 환경에서 녹음된 음성을 스튜디오급 품질로 변환할 수 있으며, 실시간에 가까운 처리 속도를 제공합니다. 팟캐스트 후처리, 화상회의 음질 개선, TTS 학습 데이터 정제 등 다양한 분야에서 활용됩니다. MIT 라이선스로 상업적 사용이 자유롭습니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음
suno-ai
Suno AI의 텍스트-오디오 생성 모델 - 다국어 음성, 음악, 효과음 생성
facebookresearch
Meta의 오디오 생성 딥러닝 라이브러리 - MusicGen, AudioGen, EnCodec 포함