Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
librosa는 파이썬 기반의 오디오 및 음악 분석 라이브러리로, 음악 정보 검색(MIR)과 오디오 신호 처리 분야의 사실상 표준 도구로 자리잡았습니다. 오디오 로딩, 리샘플링, STFT/CQT 변환, 멜 스펙트로그램, MFCC 추출, 비트 트래킹, 템포 추정, 화성 분석, 피치 검출, 음원 분리 전처리 등 음악·오디오 분석에 필요한 거의 모든 기능을 제공합니다. NumPy·SciPy 생태계와 완벽하게 호환되어 머신러닝/딥러닝 파이프라인의 특징 추출 단계에서 폭넓게 활용되며, 학계 논문과 산업 현장 모두에서 가장 많이 인용되는 오디오 라이브러리 중 하나입니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음
suno-ai
Suno AI의 텍스트-오디오 생성 모델 - 다국어 음성, 음악, 효과음 생성
RVC-Project
10분 음성으로 학습하는 검색 기반 음성 변환 웹 UI