Show HN: Auto-Match – How We Built Receipt-to-Transaction Matching (Open Source)
9 months ago
- #automation
- #machine-learning
- #financial-technology
- 手工进行财务对账既繁琐又容易出错。
- 传统系统因现实世界混乱的财务数据(货币差异、日期延迟、商户名称变体)而失效。
- 解决方案:采用嵌入技术实现语义理解的多维度匹配引擎。
- 数据预处理包括商户标准化、法律实体解析和货币规范化。
- 768维向量嵌入捕获语义信息,即使文本表述不同也能实现精准匹配。
- 匹配算法综合评估嵌入相似度(45%)、金额(35%)、货币(15%)和日期(5%)权重,采用自适应逻辑。
- 匹配结果分为自动匹配(置信度95%+)、高置信度(75-95%)和建议匹配(60-75%)三级。
- 学习校准机制根据用户反馈动态调整阈值,持续提升准确率。
- 系统架构采用PostgreSQL与pgvector扩展、谷歌Gemini嵌入模型,Trigger.dev处理后台任务。
- 性能指标:95%+自动匹配准确率、亚秒级响应、跨货币支持、99.9%运行可用性。
- 未来升级方向:增强文档理解能力、预测性匹配功能和先进机器学习模型。