V-JEPA 2
a year ago
- #AI
- #world-model
- #robotics
- V-JEPA 2是当前最先进的视频世界模型,专为视觉理解和预测而训练
- 它能在全新环境中实现零样本机器人控制,无需大量训练数据
- 该模型在运动理解、视觉推理和基于上下文线索预判动作方面表现卓越
- V-JEPA 2采用两阶段训练:视觉数据的自监督学习与机器人数据的微调
- 模型基于Droid数据集62小时的机器人数据训练,可执行伸手抓取、分拣放置等任务
- 潜在应用包括家务机器人助手和可穿戴设备的实时危险预警系统
- Meta将开源V-JEPA 2供社区拓展,预计将在多领域催生创新应用场景