Trending

WebLLM

mlc-aiApache-2.02026.07.04

추론18.3K Stars1.3K Forks54 조회

MLC 프로젝트가 개발한 브라우저 내장형 LLM 추론 엔진으로, WebGPU 하드웨어 가속을 활용해 별도 서버 없이 웹 브라우저에서 직접 대규모 언어 모델을 실행합니다. 모든 연산이 클라이언트 측에서 이루어져 데이터가 외부로 전송되지 않으므로 개인정보 보호에 유리합니다. Llama, Phi, Gemma, Mistral, Qwen 등 다양한 오픈 모델을 지원하며, OpenAI API와 호환되는 인터페이스를 제공해 기존 애플리케이션에 손쉽게 통합할 수 있습니다. 스트리밍 응답과 웹 워커 기반 백그라운드 실행도 지원합니다.

주요 특징

WebGPU 하드웨어 가속을 통한 브라우저 내 실행
서버 없이 클라이언트에서 처리해 개인정보 보호
OpenAI API 호환 인터페이스 제공
Llama·Phi·Gemma·Mistral·Qwen 등 다양한 모델 지원
스트리밍 응답과 웹 워커 백그라운드 실행

Open Source

WebLLM

주요 특징

태그

관련 프로젝트

Ollama

llama.cpp

exo

llamafile