Cogito Preview: IDA as a path to general superintelligence
a year ago
- #Superintelligence
- #LLM
- #AI
- Cogito发布开源大语言模型(30亿、80亿、140亿、320亿、700亿参数),在基准测试中表现超越LLaMA、Qwen等竞品
- 模型采用迭代蒸馏与放大技术(IDA),实现可扩展的对齐能力与面向超级智能的自我进化
- 每个模型提供标准模式和自省式(推理)应答模式
- 即将发布更大规模模型(1090亿、4000亿、6710亿参数)及优化版检查点
- IDA技术融合高级推理与迭代自我提升,突破监督学习的局限性
- 放大阶段通过计算力增强智能,蒸馏阶段将改进内化为模型参数
- Cogito的700亿参数模型性能超越Llama 4的1090亿参数混合专家模型
- 模型针对编程、函数调用、代理任务优化,采用更短推理链设计
- 基准测试验证IDA有效性,实际应用表现可能存在差异
- Deep Cogito致力于通过科学突破与顶尖研究实现通用超级智能