Hasty Briefsbeta

双语

Rust based Viewer: Any document, any platform, in milliseconds

2 months ago
  • #rust
  • #document-processing
  • #sdk
  • Prism是一款基于Rust语言构建的下一代文档处理SDK,支持600多种文件格式。
  • 核心特性包括:全面格式支持、现代化架构、云原生设计、安全性、开发者友好API及高性能处理能力。
  • 支持格式涵盖Office文档、PDF、电子邮件、图像、压缩包及CAD文件等。
  • 采用Rust语言开发,确保内存安全、卓越性能与可靠性。
  • 专为容器化、水平扩展和无服务器部署设计。
  • 通过WebAssembly沙箱实现解析器隔离与安全防护。
  • 提供10余种编程语言的SDK支持。
  • 组件体系包含:prism-core核心库、prism-parsers解析器、prism-render渲染器、prism-sandbox沙箱、prism-server服务端及prism-cli命令行工具。
  • 内置CLI工具可实现文档检测、格式转换、文本提取和元数据抽取。
  • REST API接口涵盖健康检查、版本信息、格式检测、文档转换、文本提取、元数据获取及渲染功能。
  • 可通过prism-bindings集成到.NET应用程序。
  • 所有文档格式均解析为统一的中间表示(Document模型)。
  • 提供Docker部署方案实现快速部署。
  • 性能目标包括快速格式识别、高效转换、即时文本提取和缩略图生成。
  • 安全机制包含解析器沙箱隔离、禁止代码执行、内存限制、超时防护及无I/O访问权限。
  • 发展路线图规划了格式支持扩展、AI增强功能、企业级特性及认证计划。
  • 采用AGPL-3.0开源协议与商业许可双轨制,满足专有应用需求。
  • 设计灵感源自Oracle Outside In、Apache POI、LibreOffice等经典文档处理库。