Show HN: Sweep, Open-weights 1.5B model for next-edit autocomplete
4 months ago
- #Code Autocomplete
- #AI
- #Machine Learning
- Sweep Next-Edit 1.5B 是一个用于代码自动补全的下一编辑预测模型,采用 Q8_0 量化的 GGUF 格式。
- 它能在你实际修改前预测下一步代码编辑,通过推测解码技术在你的笔记本上以低于 500 毫秒的延迟本地运行。
- 在下一编辑预测基准测试中,其性能超过比它大 4 倍以上的模型。
- 使用方式包括下载 run_model.py 脚本和模型文件,然后通过 pip 安装依赖项。
- 模型详情:GGUF 格式(Q8_0 量化),15 亿参数,8192 token 上下文长度,基于 Qwen2.5-Coder 架构。
- 采用特定提示格式,包含文件上下文、近期差异和当前状态以进行预测。
- 提供技术细节博客链接和 JetBrains 插件下载。
- 采用 Apache 2.0 许可证,上月下载量 21 次。
- 硬件兼容性支持 8 位推理,但当前暂不支持推理加速器。