Video models are zero-shot learners and reasoners
8 months ago
- #AI
- #Zero-shot Learning
- #Computer Vision
- Veo 3在多种视觉任务中展现出新兴的零样本能力
- 视频模型可能演变为视觉基础模型,类似语言领域的LLM
- Veo 3能以零样本方式解决物体分割、边缘检测和图像编辑等任务
- 该模型展现出感知、建模、操控及早期视觉推理能力
- 任务包括理解物理属性、识别功能可供性及模拟工具使用
- Veo 3的能力预示着通向统一通用视觉基础模型的发展路径