A new, 200% faster DeepSeek R1-0528 variant appears from German lab
10 months ago
- #Enterprise
- #AI
- #Open Source
- 深度求索(DeepSeek)作为中国AI初创公司,发布了最新开源模型R1-0528,其宽松的Apache 2.0许可协议正推动该模型被广泛适配。
- TNG技术咨询公司发布的DeepSeek-TNG R1T2 Chimera是基于R1-0528的改进版本,速度较原版R1提升20%,比R1-0528快两倍以上。
- R1T2在仅消耗R1-0528 40%输出token的情况下,达到了其90%的智能基准表现,具有更高能效比。
- 该模型采用TNG研发的专家矩阵融合技术(AoE),无需微调即可整合多个预训练模型的权重张量。
- AoE与混合专家系统(MoE)的核心差异在于:前者专注于专家张量融合,而非运行时动态激活专家模块。
- R1T2专为高推理能力与精简响应设计,特别适合企业级应用与研究场景。
- 模型在Hugging Face平台采用MIT许可开源,但存在函数调用和工具使用方面的功能限制。
- 欧盟用户需评估其是否符合即将实施的《欧盟AI法案》要求,美国企业则具有更高使用灵活性。
- 成立于2001年的TNG技术咨询公司专注AI与软件开发领域,主要服务各行业头部客户。
- 对企业用户而言,R1T2在降低推理成本、保持高质量推理能力及开源可改性方面优势显著,但仍存在部分功能局限。