Hasty Briefsbeta

双语

Show HN: OnPair – String compression with fast random access (Rust, C++)

9 months ago
  • #rust
  • #random-access
  • #compression
  • OnPair是一种针对短字符串序列高效随机访问的压缩算法
  • 该算法包含两个阶段:训练阶段(识别高频相邻标记对)和解析阶段(将字符串压缩为标记ID)
  • OnPair16是其变体,对字典条目设置16字节限制以进行优化
  • Rust实现版本支持最多65,536个标记,每个标记使用2字节ID
  • 使用方式包括在Cargo.toml中添加crate依赖,并调用OnPair或OnPair16进行压缩/解压
  • 提供了压缩和解压字符串列表的代码示例
  • 该项目采用MIT许可证,由比萨大学的Francesco Gargiulo和Rossano Venturini开发