Meta Segment Anything Model 3
6 months ago
- #Meta
- #AI
- #Computer Vision
- Meta推出Segment Anything Model 3(SAM 3),支持文本提示和样本提示,实现高级图像和视频分割功能。
- SAM 3突破固定标签分割模型的限制,支持开放词汇名词短语和图像样本输入。
- Meta公开SAM 3模型权重,在Segment Anything Playground提供演示,并发布详细技术论文。
- SAM 3在SA-Co可提示概念分割基准测试中,性能超越现有系统2倍。
- 人机混合数据引擎加速标注流程,构建包含超400万独特概念的训练集。
- SAM 3采用Meta感知编码器与DETR架构,实现快速推理和顶尖性能表现。
- 应用场景涵盖Facebook Marketplace的「房间实景查看」功能及SA-FARI数据集野生动物监测。
- 未来改进方向包括提升视频处理效率和复杂场景理解能力。
- Segment Anything Playground提供友好交互平台,供用户体验SAM 3功能。
- Meta呼吁AI社区采用SAM 3和SA-Co基准测试,共同推动开放科学创新。