Hasty Briefsbeta

双语

Cogito Preview: IDA as a path to general superintelligence

a year ago
  • #Superintelligence
  • #LLM
  • #AI
  • Cogito发布开源大语言模型(30亿、80亿、140亿、320亿、700亿参数),在基准测试中表现超越LLaMA、Qwen等竞品
  • 模型采用迭代蒸馏与放大技术(IDA),实现可扩展的对齐能力与面向超级智能的自我进化
  • 每个模型提供标准模式和自省式(推理)应答模式
  • 即将发布更大规模模型(1090亿、4000亿、6710亿参数)及优化版检查点
  • IDA技术融合高级推理与迭代自我提升,突破监督学习的局限性
  • 放大阶段通过计算力增强智能,蒸馏阶段将改进内化为模型参数
  • Cogito的700亿参数模型性能超越Llama 4的1090亿参数混合专家模型
  • 模型针对编程、函数调用、代理任务优化,采用更短推理链设计
  • 基准测试验证IDA有效性,实际应用表现可能存在差异
  • Deep Cogito致力于通过科学突破与顶尖研究实现通用超级智能