Trending

ebook2audiobook

DrewThomassonApache-2.02026.05.11

Audio18.9K Stars1.6K Forks4.7천 조회

ebook2audiobook(E2A)는 epub·mobi·azw3·pdf·docx·txt 등 다양한 전자책 포맷을 챕터와 메타데이터가 살아있는 고품질 오디오북으로 변환하는 오픈소스 도구입니다. XTTSv2, Bark, Fairseq, VITS, Tacotron2, Tortoise, GlowTTS, YourTTS 등 8가지 TTS 엔진을 선택할 수 있고 사용자가 직접 녹음한 짧은 음성 파일로 음성 클로닝을 적용할 수 있습니다. Meta의 MMS 기반으로 1158개 언어와 방언을 지원해 글로벌 출판물을 동일한 파이프라인으로 처리할 수 있고, 텍스트가 이미지로 들어간 페이지에는 OCR을 자동 적용합니다. m4b·mp3·flac·wav·ogg·aac 등 주요 오디오북 포맷으로 모노 또는 스테레오 출력이 가능하며 SML 태그로 일시 정지·음성 전환 등을 세밀하게 제어합니다. 최소 2GB RAM과 1GB VRAM에서도 동작하고 Gradio 웹 UI, 헤드리스 CLI, Docker, Hugging Face Spaces, Google Colab, Kaggle 환경에서 자유롭게 실행할 수 있습니다.

주요 특징

XTTSv2·Bark·VITS·Tortoise 등 8가지 TTS 엔진 선택형 파이프라인
Meta MMS 기반 1158개 언어와 방언 지원
사용자 음성 파일을 활용한 옵션형 음성 클로닝
epub·mobi·pdf·docx 등 다양한 전자책 포맷과 이미지 페이지 OCR 자동 처리
Gradio 웹 UI·CLI·Docker·Colab·Kaggle·Hugging Face Spaces 다중 실행 환경

Open Source

ebook2audiobook

주요 특징

태그

관련 프로젝트

Whisper

Coqui TTS

Bark

Retrieval-based Voice Conversion WebUI (RVC)