A new, 200% faster DeepSeek R1-0528 variant appears from German lab

10 months ago

深度求索（DeepSeek）作为中国AI初创公司，发布了最新开源模型R1-0528，其宽松的Apache 2.0许可协议正推动该模型被广泛适配。
TNG技术咨询公司发布的DeepSeek-TNG R1T2 Chimera是基于R1-0528的改进版本，速度较原版R1提升20%，比R1-0528快两倍以上。
R1T2在仅消耗R1-0528 40%输出token的情况下，达到了其90%的智能基准表现，具有更高能效比。
该模型采用TNG研发的专家矩阵融合技术（AoE），无需微调即可整合多个预训练模型的权重张量。
AoE与混合专家系统（MoE）的核心差异在于：前者专注于专家张量融合，而非运行时动态激活专家模块。
R1T2专为高推理能力与精简响应设计，特别适合企业级应用与研究场景。
模型在Hugging Face平台采用MIT许可开源，但存在函数调用和工具使用方面的功能限制。
欧盟用户需评估其是否符合即将实施的《欧盟AI法案》要求，美国企业则具有更高使用灵活性。
成立于2001年的TNG技术咨询公司专注AI与软件开发领域，主要服务各行业头部客户。
对企业用户而言，R1T2在降低推理成本、保持高质量推理能力及开源可改性方面优势显著，但仍存在部分功能局限。

Hasty Briefsbeta