Rust based Viewer: Any document, any platform, in milliseconds
2 months ago
- #rust
- #document-processing
- #sdk
- Prism是一款基于Rust语言构建的下一代文档处理SDK,支持600多种文件格式。
- 核心特性包括:全面格式支持、现代化架构、云原生设计、安全性、开发者友好API及高性能处理能力。
- 支持格式涵盖Office文档、PDF、电子邮件、图像、压缩包及CAD文件等。
- 采用Rust语言开发,确保内存安全、卓越性能与可靠性。
- 专为容器化、水平扩展和无服务器部署设计。
- 通过WebAssembly沙箱实现解析器隔离与安全防护。
- 提供10余种编程语言的SDK支持。
- 组件体系包含:prism-core核心库、prism-parsers解析器、prism-render渲染器、prism-sandbox沙箱、prism-server服务端及prism-cli命令行工具。
- 内置CLI工具可实现文档检测、格式转换、文本提取和元数据抽取。
- REST API接口涵盖健康检查、版本信息、格式检测、文档转换、文本提取、元数据获取及渲染功能。
- 可通过prism-bindings集成到.NET应用程序。
- 所有文档格式均解析为统一的中间表示(Document模型)。
- 提供Docker部署方案实现快速部署。
- 性能目标包括快速格式识别、高效转换、即时文本提取和缩略图生成。
- 安全机制包含解析器沙箱隔离、禁止代码执行、内存限制、超时防护及无I/O访问权限。
- 发展路线图规划了格式支持扩展、AI增强功能、企业级特性及认证计划。
- 采用AGPL-3.0开源协议与商业许可双轨制,满足专有应用需求。
- 设计灵感源自Oracle Outside In、Apache POI、LibreOffice等经典文档处理库。