Hasty Briefsbeta

双语

LightlyStudio – an open-source multimodal data curation and labeling tool

4 months ago
  • #data-annotation
  • #machine-learning
  • #open-source
  • LightlyStudio 是一个开源工具,用于数据整理、标注和管理。
  • 基于 Rust 构建以确保性能,支持在配备 M1 芯片和 16GB 内存的 Macbook Pro 上处理 COCO 和 ImageNet 数据集。
  • 兼容 Windows、Linux 和 MacOS 上的 Python 3.8+ 环境。
  • 可通过 pip 安装:`pip install lightly-studio`。
  • 示例数据集可从 GitHub 仓库下载,或使用您自己的 YOLO/COCO 数据集。
  • 包含纯图像数据集、YOLO 目标检测、COCO 实例分割和 COCO 图像描述的示例。
  • LightlyStudio 提供强大的 Python 接口,用于数据集索引、查询和操作。
  • 支持从云存储(如 S3、GCS)和本地文件夹加载数据。
  • 样本属性包括 ID、文件名、路径、标签和元数据,均可访问和修改。
  • 数据集查询支持通过表达式进行过滤、排序和切片操作。
  • 高级功能可自动选择数据,基于典型性和多样性筛选最有价值的样本。
  • 0.4.0 预览版于 2025-10-21 发布。
  • 欢迎通过 issues 页面提交任务和改进建议参与贡献。