Open Source
GitHub, HuggingFace의 최신 AI 오픈소스 프로젝트를 탐색하세요.

VoxCPM은 OpenBMB(칭화대)가 개발한 Tokenizer-free TTS 시스템입니다. 이산 토큰 대신 연속 음성 표현을 직접 생성하여 자연스러운 음성 합성과 제로샷 음성 클로닝을 구현합니다. MiniCPM-4 백본 기반으로 180만 시간 이중언어 데이터로 학습되었으며, RTF 0.15의 효율적 실시간 스트리밍과 LoRA/SFT 파인튜닝을 지원합니다.
haotian-liu
GPT-4V 수준의 시각적 지시 조정 멀티모달 AI 모델

OpenBMB
스마트폰에서 실행 가능한 멀티모달 AI 모델
microsoft
작업, 언어, 모달리티 전반의 통일된 사전학습 모델
jina-ai
클라우드 네이티브 멀티모달 AI 애플리케이션 구축 프레임워크