Hasty Briefsbeta

双语

ThalamusDB: Query text, tables, images, and audio

5 months ago
  • #SQL
  • #multimodal-data
  • #approximate-processing
  • ThalamusDB是一个支持多模态数据语义运算符SQL查询的近似处理引擎
  • 使用pip安装ThalamusDB:`pip install thalamusdb`
  • 设置API密钥环境变量,例如:`export OPENAI_API_KEY=[您的密钥]`
  • 通过DuckDB数据库文件和模型配置运行ThalamusDB控制台
  • 示例数据库`cars.db`包含带有文本描述和图片路径的表格
  • 支持语义查询,如`nlfilter(pic, '图片中的车是红色的')`
  • 可处理文本、图像及以文本列路径存储的音频文件
  • 支持两种语义过滤运算符:`NLfilter`和`NLjoin`
  • 模型配置文件指定不同数据类型和运算符对应的模型
  • 专为近似处理设计:聚合查询显示误差范围,检索查询显示交集行
  • 误差范围帮助追踪精确结果的逼近进度
  • 可配置停止标准包括最大时间、LLM调用次数、token数和误差阈值
  • 文档和示例详见GitHub和Google Colab