Hasty Briefsbeta

双语

Mistral Integration Improved in Llama.cpp

9 months ago
  • #llama.cpp
  • #Mistral
  • #GitHub
  • 通知需要登录以更改设置。
  • 在问题#14737中讨论了改进Mistral模型与llama.cpp的集成。
  • Mistral的架构使用滑动窗口注意力机制(SWA),默认窗口大小为4096个标记。
  • 支持在llama.cpp中传递jinja模板以进行模型服务。
  • 讨论更新Pydantic需求以及在PR中处理格式/样式更改。
  • 计划在当前PR合并后为llama.cpp添加对Voxtral模型的支持。
  • 重构和合并代码以实现更好的集成和维护。
  • 发布Magistral GGUF模型,并与llama.cpp顺利运行。
  • 最终审查并准备合并PR,已纳入社区反馈。