Hasty Briefsbeta

双语

Nanonets-OCR2-3B – OCR model that transforms documents into structured markdown

7 months ago
  • #AI
  • #markdown
  • #OCR
  • Nanonets-OCR2 是先进的OCR模型系列,可将文档转换为带有语义标记的结构化Markdown格式
  • 功能包括处理复杂文档、识别公式/图像/签名/水印,并为大语言模型处理添加标记
  • 可用模型包含Nanonets-OCR2-Plus、Nanonets-OCR2-3B和Nanonets-OCR2-1.5B-exp,提供性能对比
  • 支持通过Python代码片段或API调用使用模型,可处理财务文档等多种文件类型
  • 性能基准测试显示Nanonets-OCR2系列与Gemini、GPT-5等领先模型具有竞争力