DeepSeek-v3.2-Exp
5 months ago
- #DeepSeek
- #AI Research
- #Sparse Attention
- DeepSeek-V3.2-Exp 是一个实验版本,引入了 DeepSeek 稀疏注意力(DSA)机制,以提升长上下文场景下的效率。
- DSA 实现了细粒度的稀疏注意力,在保持输出质量的同时提高了训练和推理效率。
- 性能基准测试显示,DeepSeek-V3.2-Exp 在各领域表现与 V3.1-Terminus 相当。
- 提供了更新的推理演示代码和 Docker 镜像,便于快速部署和探索。
- 该模型及代码库采用 MIT 许可证授权。