Hasty Briefsbeta

双语

Show HN: Auto-Match – How We Built Receipt-to-Transaction Matching (Open Source)

9 months ago
  • #automation
  • #machine-learning
  • #financial-technology
  • 手工进行财务对账既繁琐又容易出错。
  • 传统系统因现实世界混乱的财务数据(货币差异、日期延迟、商户名称变体)而失效。
  • 解决方案:采用嵌入技术实现语义理解的多维度匹配引擎。
  • 数据预处理包括商户标准化、法律实体解析和货币规范化。
  • 768维向量嵌入捕获语义信息,即使文本表述不同也能实现精准匹配。
  • 匹配算法综合评估嵌入相似度(45%)、金额(35%)、货币(15%)和日期(5%)权重,采用自适应逻辑。
  • 匹配结果分为自动匹配(置信度95%+)、高置信度(75-95%)和建议匹配(60-75%)三级。
  • 学习校准机制根据用户反馈动态调整阈值,持续提升准确率。
  • 系统架构采用PostgreSQL与pgvector扩展、谷歌Gemini嵌入模型,Trigger.dev处理后台任务。
  • 性能指标:95%+自动匹配准确率、亚秒级响应、跨货币支持、99.9%运行可用性。
  • 未来升级方向:增强文档理解能力、预测性匹配功能和先进机器学习模型。