Speculative Speculative Decoding (SSD)2 months ago#Autoregressive Decoding#Machine Learning#Inference Accelerationhttps://arxiv.org/abs/2603.03251Copy Link提出推测性推测解码(SSD)方法,实现自回归解码过程中的操作并行化采用草稿模型预测验证结果并预先准备推测内容推出Saguaro优化算法,较传统推测解码基线最高实现2倍加速针对推测性推测解码的三大核心挑战提出系统性解决方案