Hasty Briefsbeta

双语

Show HN: OctaneDB – Fast, Open-Source Vector Database for Python

9 months ago
  • #vector-database
  • #AI-ML
  • #python
  • OctaneDB 是一个高性能 Python 向量数据库库,性能比 Pinecone、ChromaDB 和 Qdrant 等竞争对手快 10 倍。
  • 特性包括亚毫秒级查询响应时间、每秒 3,000+ 向量的插入速率,以及通过 HDF5 压缩优化的内存使用。
  • 支持多种索引方法:用于超快速近似搜索的 HNSW 和用于精确相似性搜索的 FlatIndex。
  • 提供与 ChromaDB 兼容的 API 便于迁移,并使用 sentence-transformers 自动进行文本到向量的转换。
  • 支持 GPU 加速(CUDA)、批处理以及多种距离度量(余弦、欧几里得、点积等)。
  • 包含带逻辑运算符的高级元数据过滤和批量搜索操作。
  • 提供内存和基于文件的持久化存储选项,采用 HDF5 格式实现高效压缩。
  • 通过 pip 简单安装,API 直观且类似 ChromaDB,易于集成到现有项目中。
  • 基准测试显示,在插入速率、搜索时间和内存使用方面,性能优于 ChromaDB、Pinecone 和 Qdrant。
  • 适用于 AI/ML 应用、文档搜索、推荐系统、图像搜索、NLP 应用和研究。