Show HN: Extrai – An open-source tool to fight LLM randomness in data extraction
4 months ago
- #LLM
- #SQLModel
- #data-extraction
- extrai 是一个利用大语言模型(LLM)从文本文档中提取数据,并将其格式化为SQLModel并注册到数据库的库。
- 通过整合多个LLM输出来提高准确性的共识机制。
- 支持从自然语言描述动态生成SQLModel。
- 提供分层提取功能,通过分解步骤处理复杂的嵌套数据。
- 包括可扩展的LLM支持、内置分析和工作流编排。
- 提供示例JSON生成和可定制提示,以满足特定提取需求。
- 允许轮换LLM提供商以修订JSON输出。
- 文档主要章节:入门指南、操作教程、核心概念、参考、API参考、社区。
- 通过pip安装:`pip install extrai-workflow`。
- 示例用法包括定义数据模型、设置编排器并运行提取流程。