Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요. LLM, Vision, Audio 등 다양한 카테고리의 프로젝트를 확인할 수 있습니다.
총 516개의 프로젝트
AIDC-AI
시각-텍스트 임베딩을 구조적으로 정렬하는 멀티모달 LLM
deepseek-ai
이미지 이해와 생성을 통합한 DeepSeek의 멀티모달 AI 모델
hustvl
선형 복잡도로 무제한 입력을 처리하는 효율적인 비전-언어 모델
FunAudioLLM
31개 언어 지원, 실시간 저지연 STT, 방언/고소음 환경 특화
facebookresearch
1,600개 언어 지원하는 범용 음성인식, Zero-Shot 학습 가능
FireRedTeam
중국어/영어 특화 산업급 STT 모델, 노래 가사 인식 지원
openai
99개+ 언어 지원 범용 음성 인식 모델 - GitHub 96K 스타
coqui-ai
1100개 이상 언어를 지원하는 오픈소스 음성 합성 딥러닝 도구 모음
stepfun-ai
130B 파라미터 멀티모달 음성 상호작용 오픈소스 프레임워크
yl4579
스타일 확산과 적대적 훈련으로 인간 수준 음성 합성을 달성한 TTS 모델
neonbjb
음성 품질에 중점을 둔 다중 화자 텍스트-투-스피치 시스템 (14.8k Stars)
huggingface
자연어 프롬프트로 화자 특성을 제어하는 Hugging Face의 고품질 TTS 라이브러리