Hasty Briefsbeta

双语

Video models are zero-shot learners and reasoners

8 months ago

#AI
#Zero-shot Learning
#Computer Vision

Veo 3在多种视觉任务中展现出新兴的零样本能力
视频模型可能演变为视觉基础模型，类似语言领域的LLM
Veo 3能以零样本方式解决物体分割、边缘检测和图像编辑等任务
该模型展现出感知、建模、操控及早期视觉推理能力
任务包括理解物理属性、识别功能可供性及模拟工具使用
Veo 3的能力预示着通向统一通用视觉基础模型的发展路径