Hasty Briefsbeta

双语

Show HN: Extrai – An open-source tool to fight LLM randomness in data extraction

4 months ago
  • #LLM
  • #SQLModel
  • #data-extraction
  • extrai 是一个利用大语言模型(LLM)从文本文档中提取数据,并将其格式化为SQLModel并注册到数据库的库。
  • 通过整合多个LLM输出来提高准确性的共识机制。
  • 支持从自然语言描述动态生成SQLModel。
  • 提供分层提取功能,通过分解步骤处理复杂的嵌套数据。
  • 包括可扩展的LLM支持、内置分析和工作流编排。
  • 提供示例JSON生成和可定制提示,以满足特定提取需求。
  • 允许轮换LLM提供商以修订JSON输出。
  • 文档主要章节:入门指南、操作教程、核心概念、参考、API参考、社区。
  • 通过pip安装:`pip install extrai-workflow`。
  • 示例用法包括定义数据模型、设置编排器并运行提取流程。