Hasty Briefsbeta

双语

Cogito Preview: IDA as a path to general superintelligence

a year ago

#Superintelligence
#LLM
#AI

Cogito发布开源大语言模型（30亿、80亿、140亿、320亿、700亿参数），在基准测试中表现超越LLaMA、Qwen等竞品
模型采用迭代蒸馏与放大技术（IDA），实现可扩展的对齐能力与面向超级智能的自我进化
每个模型提供标准模式和自省式（推理）应答模式
即将发布更大规模模型（1090亿、4000亿、6710亿参数）及优化版检查点
IDA技术融合高级推理与迭代自我提升，突破监督学习的局限性
放大阶段通过计算力增强智能，蒸馏阶段将改进内化为模型参数
Cogito的700亿参数模型性能超越Llama 4的1090亿参数混合专家模型
模型针对编程、函数调用、代理任务优化，采用更短推理链设计
基准测试验证IDA有效性，实际应用表现可能存在差异
Deep Cogito致力于通过科学突破与顶尖研究实现通用超级智能