Trending

Bark

suno-aiMIT2026.04.07

Audio38.8K Stars4.7K Forks7.0천 조회

Bark는 Suno AI가 개발한 트랜스포머 기반 텍스트-오디오 생성 모델입니다. 매우 사실적인 다국어 음성 합성은 물론, 음악, 배경 소음, 효과음까지 생성할 수 있는 범용 오디오 모델입니다. 웃음, 한숨, 울음 같은 비언어적 표현도 자연스럽게 생성하며, 텍스트 프롬프트에 특수 태그를 넣어 화자 스타일과 감정을 제어할 수 있습니다. 10개 이상의 언어를 지원하며 별도의 파인튜닝 없이도 고품질 음성을 생성합니다. 연구 및 데모 목적으로 공개되어 AI 오디오 생성 분야의 대표적인 오픈소스 프로젝트로 자리잡았습니다.

주요 특징

다국어 텍스트-음성 변환 (10개 이상 언어 지원)
음악 및 효과음 생성 가능
비언어적 표현 생성 (웃음, 한숨, 울음 등)
화자 스타일 및 감정 프롬프트 제어
파인튜닝 없이 제로샷 음성 생성

Open Source

Bark

주요 특징

태그

관련 프로젝트

Whisper

Coqui TTS

Retrieval-based Voice Conversion WebUI (RVC)

Retrieval-based Voice Conversion WebUI