Hasty Briefsbeta

双语

Show HN: Misata – synthetic data engine using LLM and Vectorized NumPy

2 months ago
  • #synthetic-data
  • #machine-learning
  • #data-generation
  • Misata允许通过自然语言描述生成真实的多表数据集,无需编写模式或提供训练数据。
  • 支持自动模式生成、关系完整性、业务约束和大数据集流式处理(1000万+行)等功能。
  • 通过pip即可简单安装,支持Groq、OpenAI和Ollama等多种大语言模型提供商。
  • 用户可为SaaS、电子商务和健身应用等多种场景生成数据,并提供可定制选项。
  • Misata包含噪声注入、自定义分布和条件值等高级功能,用于生成真实数据。
  • 性能指标显示其高速生成数据的能力,可高效处理数百万行数据。
  • 提供基于浏览器的试用版和企业支持,适用于复杂场景。
  • 由Muhammed Rasin在MIT许可证下开发。