Hasty Briefsbeta

双语

V-JEPA 2

a year ago
  • #AI
  • #world-model
  • #robotics
  • V-JEPA 2是当前最先进的视频世界模型,专为视觉理解和预测而训练
  • 它能在全新环境中实现零样本机器人控制,无需大量训练数据
  • 该模型在运动理解、视觉推理和基于上下文线索预判动作方面表现卓越
  • V-JEPA 2采用两阶段训练:视觉数据的自监督学习与机器人数据的微调
  • 模型基于Droid数据集62小时的机器人数据训练,可执行伸手抓取、分拣放置等任务
  • 潜在应用包括家务机器人助手和可穿戴设备的实时危险预警系统
  • Meta将开源V-JEPA 2供社区拓展,预计将在多领域催生创新应用场景