ThalamusDB: Query text, tables, images, and audio
5 months ago
- #SQL
- #multimodal-data
- #approximate-processing
- ThalamusDB是一个支持多模态数据语义运算符SQL查询的近似处理引擎
- 使用pip安装ThalamusDB:`pip install thalamusdb`
- 设置API密钥环境变量,例如:`export OPENAI_API_KEY=[您的密钥]`
- 通过DuckDB数据库文件和模型配置运行ThalamusDB控制台
- 示例数据库`cars.db`包含带有文本描述和图片路径的表格
- 支持语义查询,如`nlfilter(pic, '图片中的车是红色的')`
- 可处理文本、图像及以文本列路径存储的音频文件
- 支持两种语义过滤运算符:`NLfilter`和`NLjoin`
- 模型配置文件指定不同数据类型和运算符对应的模型
- 专为近似处理设计:聚合查询显示误差范围,检索查询显示交集行
- 误差范围帮助追踪精确结果的逼近进度
- 可配置停止标准包括最大时间、LLM调用次数、token数和误差阈值
- 文档和示例详见GitHub和Google Colab