Hasty Briefsbeta

双语

V-JEPA 2

a year ago

#AI
#world-model
#robotics

V-JEPA 2是当前最先进的视频世界模型，专为视觉理解和预测而训练
它能在全新环境中实现零样本机器人控制，无需大量训练数据
该模型在运动理解、视觉推理和基于上下文线索预判动作方面表现卓越
V-JEPA 2采用两阶段训练：视觉数据的自监督学习与机器人数据的微调
模型基于Droid数据集62小时的机器人数据训练，可执行伸手抓取、分拣放置等任务
潜在应用包括家务机器人助手和可穿戴设备的实时危险预警系统
Meta将开源V-JEPA 2供社区拓展，预计将在多领域催生创新应用场景