Trending

OpenVLA

openvlaMIT2026.04.12

멀티모달5.9K Stars692 Forks7.5천 조회

OpenVLA는 로봇 조작 작업을 위한 비전-언어-액션(VLA) 모델의 학습과 미세조정을 위한 간단하고 확장 가능한 코드베이스입니다. 1B부터 34B 파라미터까지 다양한 규모의 모델을 지원하며, RLDS 형식의 임의 데이터셋과 Open X-Embodiment 데이터를 혼합하여 처리할 수 있습니다. PyTorch FSDP와 Flash-Attention을 활용한 분산 학습으로 효율적인 훈련이 가능하며, LoRA 기반의 매개변수 효율적 미세조정도 지원합니다.

주요 특징

1B~34B 파라미터 범위의 다양한 규모 모델 학습
RLDS 형식 데이터셋 및 Open X-Embodiment 혼합 처리
PyTorch FSDP와 Flash-Attention 기반 분산 학습
LoRA를 통한 매개변수 효율적 미세조정
처음부터 학습 가능한 완전한 훈련 파이프라인

Open Source

OpenVLA

주요 특징

태그

관련 프로젝트

MiniCPM-V

LLaVA

MiniCPM-o

UniLM