Nanonets-OCR2-3B – OCR model that transforms documents into structured markdown
7 months ago
- #AI
- #markdown
- #OCR
- Nanonets-OCR2 是先进的OCR模型系列,可将文档转换为带有语义标记的结构化Markdown格式
- 功能包括处理复杂文档、识别公式/图像/签名/水印,并为大语言模型处理添加标记
- 可用模型包含Nanonets-OCR2-Plus、Nanonets-OCR2-3B和Nanonets-OCR2-1.5B-exp,提供性能对比
- 支持通过Python代码片段或API调用使用模型,可处理财务文档等多种文件类型
- 性能基准测试显示Nanonets-OCR2系列与Gemini、GPT-5等领先模型具有竞争力