Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

실시간 대화형 음성 에이전트 구축을 위한 오픈소스 end-to-end 음성 AI 오케스트레이션 플랫폼입니다. 오디오 스트리밍, STT, TTS, VAD, 멀티채널 통합, 에이전트 상태 관리, 관찰성 기능을 제공합니다. GRPC를 사용한 저지연 실시간 음성 오케스트레이션, OpenAI/Anthropic/오픈소스 모델을 지원하는 LLM 비의존적 아키텍처, 재시도/에러 핸들링/호출 수명주기 관리/헬스 체크를 갖춘 프로덕션급 안정성, 호출 로그/스트리밍 이벤트/도구 추적/지연 시간 분석/메트릭/대시보드를 포함한 완전한 관찰성을 제공합니다. Go, Python, Node.js, React SDK를 제공합니다.
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음
suno-ai
Suno AI의 텍스트-오디오 생성 모델 - 다국어 음성, 음악, 효과음 생성
facebookresearch
Meta의 오디오 생성 딥러닝 라이브러리 - MusicGen, AudioGen, EnCodec 포함