LightlyStudio – an open-source multimodal data curation and labeling tool
4 months ago
- #data-annotation
- #machine-learning
- #open-source
- LightlyStudio 是一个开源工具,用于数据整理、标注和管理。
- 基于 Rust 构建以确保性能,支持在配备 M1 芯片和 16GB 内存的 Macbook Pro 上处理 COCO 和 ImageNet 数据集。
- 兼容 Windows、Linux 和 MacOS 上的 Python 3.8+ 环境。
- 可通过 pip 安装:`pip install lightly-studio`。
- 示例数据集可从 GitHub 仓库下载,或使用您自己的 YOLO/COCO 数据集。
- 包含纯图像数据集、YOLO 目标检测、COCO 实例分割和 COCO 图像描述的示例。
- LightlyStudio 提供强大的 Python 接口,用于数据集索引、查询和操作。
- 支持从云存储(如 S3、GCS)和本地文件夹加载数据。
- 样本属性包括 ID、文件名、路径、标签和元数据,均可访问和修改。
- 数据集查询支持通过表达式进行过滤、排序和切片操作。
- 高级功能可自动选择数据,基于典型性和多样性筛选最有价值的样本。
- 0.4.0 预览版于 2025-10-21 发布。
- 欢迎通过 issues 页面提交任务和改进建议参与贡献。