Show HN: OnPair – String compression with fast random access (Rust, C++)
9 months ago
- #rust
- #random-access
- #compression
- OnPair是一种针对短字符串序列高效随机访问的压缩算法
- 该算法包含两个阶段:训练阶段(识别高频相邻标记对)和解析阶段(将字符串压缩为标记ID)
- OnPair16是其变体,对字典条目设置16字节限制以进行优化
- Rust实现版本支持最多65,536个标记,每个标记使用2字节ID
- 使用方式包括在Cargo.toml中添加crate依赖,并调用OnPair或OnPair16进行压缩/解压
- 提供了压缩和解压字符串列表的代码示例
- 该项目采用MIT许可证,由比萨大学的Francesco Gargiulo和Rossano Venturini开发