Hasty Briefsbeta

双语

Kimi k2 largest open source SOTA model?

10 months ago
  • #AI
  • #Language Model
  • #Mixture-of-Experts
  • Kimi K2 是一款采用专家混合架构(MoE)的尖端语言模型,激活参数量达320亿,总参数量高达1万亿。
  • 该模型使用Muon优化器训练,专为智能体能力优化,在尖端知识、推理和代码任务方面表现卓越。
  • 提供两种版本:Kimi-K2-Base适用于微调和定制解决方案,Kimi-K2-Instruct则面向通用对话和智能体体验场景。
  • Kimi K2 在多项基准测试中表现优异,包括代码任务(LiveCodeBench、OJBench)、工具使用任务(Tau2、AceBench)以及数学与STEM任务(AIME、MATH-500)。
  • 支持工具调用功能,可自主调用天气查询等工具完成任务。
  • 模型可通过Moonshot AI平台API获取,兼容OpenAI/Anthropic API接口。
  • 推荐使用vLLM、SGLang、KTransformers和TensorRT-LLM等推理引擎。
  • 该模型采用修改版MIT许可协议发布,权重文件已在Hugging Face平台开源。