Nvidia Nemotron 3-Nano 30B-A3B-BF16
4 months ago
- #AI
- #NVIDIA
- #LLM
- NVIDIA Nemotron-3-Nano-30B-A3B-BF16 是一款专为推理和非推理任务设计的大型语言模型(LLM),采用混合专家系统(MoE)架构。
- 该模型支持包括英语、德语、西班牙语、法语、意大利语和日语在内的多语言,并针对AI代理系统、聊天机器人和RAG应用进行了优化。
- 模型通过预训练、监督微调和强化学习的混合方法,在25万亿token的合成与精选数据集上进行训练。
- 基准测试显示,在通用知识、推理和代理任务方面,其性能可与Qwen3-30B-A3B-Thinking-2507和GPT-OSS-20B等模型竞争。
- 该模型已具备商用就绪性,支持全球部署,并能与Hugging Face Transformers、vLLM、TRT-LLM和SGLang等框架集成。
- 伦理考量强调负责任地使用AI,英伟达提供了缓解偏见、隐私和滥用风险的指导方针。