Hasty Briefsbeta

双语

Speculative Speculative Decoding (SSD)

2 months ago
  • #Autoregressive Decoding
  • #Machine Learning
  • #Inference Acceleration
  • 提出推测性推测解码(SSD)方法,实现自回归解码过程中的操作并行化
  • 采用草稿模型预测验证结果并预先准备推测内容
  • 推出Saguaro优化算法,较传统推测解码基线最高实现2倍加速
  • 针对推测性推测解码的三大核心挑战提出系统性解决方案