Nvidia Nemotron 3-Nano 30B-A3B-BF16

4 months ago

NVIDIA Nemotron-3-Nano-30B-A3B-BF16 是一款专为推理和非推理任务设计的大型语言模型（LLM），采用混合专家系统（MoE）架构。
该模型支持包括英语、德语、西班牙语、法语、意大利语和日语在内的多语言，并针对AI代理系统、聊天机器人和RAG应用进行了优化。
模型通过预训练、监督微调和强化学习的混合方法，在25万亿token的合成与精选数据集上进行训练。
基准测试显示，在通用知识、推理和代理任务方面，其性能可与Qwen3-30B-A3B-Thinking-2507和GPT-OSS-20B等模型竞争。
该模型已具备商用就绪性，支持全球部署，并能与Hugging Face Transformers、vLLM、TRT-LLM和SGLang等框架集成。
伦理考量强调负责任地使用AI，英伟达提供了缓解偏见、隐私和滥用风险的指导方针。

Hasty Briefsbeta