Hasty Briefsbeta

双语

Show HN: Sweep, Open-weights 1.5B model for next-edit autocomplete

4 months ago
  • #Code Autocomplete
  • #AI
  • #Machine Learning
  • Sweep Next-Edit 1.5B 是一个用于代码自动补全的下一编辑预测模型,采用 Q8_0 量化的 GGUF 格式。
  • 它能在你实际修改前预测下一步代码编辑,通过推测解码技术在你的笔记本上以低于 500 毫秒的延迟本地运行。
  • 在下一编辑预测基准测试中,其性能超过比它大 4 倍以上的模型。
  • 使用方式包括下载 run_model.py 脚本和模型文件,然后通过 pip 安装依赖项。
  • 模型详情:GGUF 格式(Q8_0 量化),15 亿参数,8192 token 上下文长度,基于 Qwen2.5-Coder 架构。
  • 采用特定提示格式,包含文件上下文、近期差异和当前状态以进行预测。
  • 提供技术细节博客链接和 JetBrains 插件下载。
  • 采用 Apache 2.0 许可证,上月下载量 21 次。
  • 硬件兼容性支持 8 位推理,但当前暂不支持推理加速器。