π₀: Cross-Embodiment Vision-Language-Action Model for General Robot Control
π₀는 인터넷 규모의 비전-언어 사전학습과 대규모 로봇 데이터셋을 결합하여, 다양한 로봇과 장기 조작 작업에서 일반화 가능한 Vision-Language-Action 파운데이션 모델을 제안한다.
π₀: Cross-Embodiment Vision-Language-Action Model for General Robot Control
This post is licensed under CC BY 4.0 by the author.